はじめに
LuupのInfra/SREチームに所属している、ぐりもお(@gr1m0h)です。
この記事は、2022年に公開したLuup Infra/SREチームを紹介した記事をアップデート版です。現在の私たちのチームがどのようなフェーズにあり、どのようなミッションを掲げ、どの機能領域を担い、そして日々どのような動き方で業務に取り組んでいるのかを中心に紹介します。
なお、本記事では以下の用語を次のように定義しています。
- Luup
- 社名、株式会社Luup
- LUUP
- サービス名
- 株式会社Luupが提供している電動マイクロモビリティのシェアリングサービスである「LUUP」を指している
- SRE
- Site Reliability Engineeringの略称
- サービスの信頼性を高めるためのエンジニアリング手法や文化を指す
- SREs
- Site Reliability Engineer(RoleとしてのSRE)のこと
- Luup Infra/SREチームメンバーを指している
チームの輪郭
Luupのソフトウェア開発部は、以下のチームが存在し、互いにコラボレーションしながら、LUUPの開発を進めています。
Infra/SREチームもその一翼を担い、サービスの信頼性向上や開発効率の向上に貢献しています。
現在地:チームフェーズ
チームの成長段階について、SRE Kaigi 2025のVTRyoさんのセッション資料で示されたモデルに照らし合わせると、LuupのInfra/SREチームは 「一人目のSRE期」から「チーム拡大期」へ移行しつつある、あるいはその間に位置していると考えています。専任のSREsが活動を開始し、チームとしての形を模索しながら、徐々に活動範囲と責任を明確化している段階です。
指針:チームミッション
チームの成長と活動の方向性をより明確にするため、2025年に入り、私たちInfra/SREチームは以下のミッションを策定しました。
サービスレベル、コスト指標、セキュリティリスクといった領域を、部内の他チーム以上に主体的に監視や監視の支援をすることで、開発組織全体の機能開発とのバランスを取る意思決定をサポートし、事業の中長期的な存続と成長に貢献するチームです。
それ以外に開発生産性や他部署の運用上の課題の中で、担当チームが曖昧なものや複数部門に跨るものに対しても積極的に関与し、課題の再評価・分解・責任の明確化といった構造的・俯瞰的なアプローチを念頭に、必要に応じて自らの技術力で解決に取り組みます。
このミッションを定めることで、これまで暗黙知となっていたチームの価値観や判断基準が明文化され、日々の活動における優先順位付けがより明確になりました。
守備範囲:3つの機能領域
私たちのチームは、主に以下の3つの機能領域をカバーしています。
- Infrastructure:LUUPを支えるクラウドインフラの設計、構築、運用など
- SRE:SLOの策定・監視、信頼性向上、インシデント管理、ポストモーテム、自動化推進など
- Security:インフラおよびアプリケーションのセキュリティー対策、脆弱性管理など
LUUPではFirebase、Cloud Run Functionsといったサーバーレス技術を積極的に活用しており、多くの部分で開発者がインフラを意識せず開発・デプロイできる状態になっています。
これは、逆コンウェイの法則にも通じるものがあり、開発チームがインフラ運用からある程度独立して動けるアーキテクチャが、結果として独立した大規模な「Infrastructure専門チーム」を必要としない組織構造と対応していると言えるでしょう。
そのため「Infrastructure専門チーム」としての業務比重は相対的に低く、むしろ 「SRE」としての信頼性向上活動や、「Security」(特にガバナンスや監査対応)の重要性が高い状態にあります。 これら3つの領域を1つのチームで担っているのは、スキルセットの近接性と現在のチーム規模を考慮した結果です。
日々の活動とリズム:カンバンからスクラム(的アプローチ)へ
Luup Infra/SREチームは、これまでタスク管理にカンバン方式を採用していましたが、2025年5月よりスクラム(的アプローチ)へ移行しました。この変更は、チームが直面していた以下の課題を解決し、より効果的なチーム運営を目指すためです。
- 担当外タスクの進捗が見えにくい
- 未経験タスクへの挑戦がしづらい
- タスクの期限や優先順位が曖昧になりがち
- 短いサイクルでの計画的な振り返りが不足している
「現在地:チームフェーズ」の項で触れたように、私たちは「チーム拡大期」に差し掛かっています。これまでは属人化を許容し、各メンバーが比較的自由にタスクを進めていましたが、チームの成長に伴い、情報共有の難しさや連携のしづらさが顕在化してきました。特に各メンバー間で多忙さに差が生じ、特定のメンバーに業務負荷が集中してしまう状況がありました。さらに、これまでの属人化が壁となって他のメンバーがその業務を迅速にキャッチアップしてサポートすることが難しく、この点に危機感を覚えました。こうした背景から、チームとしてより一層の成果を出すためには、タスクの透明性を高め、チーム全体での協力を促進する必要があると考えました。その具体的な解決策として、スクラム的な働き方を取り入れることにしました。
ただし、私たちは厳密なスクラムを実践しているわけではありません。現状は、課題解決のためにスクラムの原則やイベントを柔軟に取り入れている段階です。例えば、現在のチーム体制と自律性を考慮し、専任のプロダクトオーナーは設けていません。タスクの優先順位付けやBacklogのリファインメントはチーム全員で行い、合議制で意思決定をしています。そのため、スプリントレビューも現時点では実施していません。このように、教科書通りのスクラムではありませんが、チームの状況に合わせて最適化を行っています。
活動紹介
最後に、これまでのLuup Infra/SREチームの活動の一部を、公開されている技術ブログ記事を通じて紹介します。
Infrastructure
SLO
Incident Management
その他SRE活動
さいごに
弊社のプロダクト開発やSRE、使用技術に興味を持っていただけた方は、以下のリンクからお気軽にご連絡ください!私のX(Twitter)アカウントでもDMを受け付けています。
副業や転職をお考えの方だけでなく、気軽に話を聞きたいという方も大歓迎です!
Views: 0