2019年初頭、私たちはインド中のキャンパスを訪問し優秀な人材を採用し始めました。LinkedInおよびその複雑なテクノロジースタックを構成するすべてのサービスを皆様がいつでも利用できることを保証するためです。LinkedInにおけるこの重要な機能は、サイトエンジニアリングチームと、信頼性を専門とするソフトウェアエンジニアであるサイトリライアビリティエンジニア(SRE)の管轄下にあります。SREは、コンピュータサイエンスとエンジニアリングの原則を、大規模な分散型コンピュータシステムの設計、開発、運用に適用します。
この旅を続けていくうちに、キャンパスで多くの質問を受けるようになりました。「サイトリライアビリティエンジニアリングの役割とは何か?また、SREとして成功するためには、どのようにしてスキルや知識を身につければよいのでしょうか?数ヶ月後、このキャンパスの学生の何人かがLinkedInにインターンとして、またはフルタイムのエンジニアとして入社し、サイトエンジニアリングチームの一員となりました。また、従来のSREのバックグラウンドを持たない後任者も数名入社しました。そこで何人かで集まって、新卒のエンジニアをサイトエンジニアリングチームに迎え入れるにはどうしたらいいかを考え始めたのです。
SREの役割や責任、サイトの健全性やプロダクションのインシデントの監視方法、SLO/SLIなどの定義については、ウェブ上に膨大な量のリソースが散在しています。しかし、初心者として身につけなければならない基本的なスキルセットを案内するリソースはほとんどありません。このようなリソースがないために、個人がこの業界のオープンポジションに入るのは難しいと感じていました。私たちは、SREとしてのキャリアを築きたい人のための出発点として、「School Of SRE」を設立しました。
このコースでは、基礎的で強固なスキルを身につけることに重点を置いています。このコースは、より多くの実例を示し、各トピックを学ぶことがSREの仕事でどのように重要な役割を果たすかを説明するように構成されています。現在、School Of SREでは以下のトピックを取り上げています。
- 基礎
- PythonとWeb
- データ
- システム設計
- メトリクスとモニタリング
- セキュリティ
継続的に学習することでより深い知識と能力を身につけ、スキルセットを拡大することができると考えています。すべてのモジュールには、さらなる学習のためのガイドとなる参考文献が追加されています。これらのモジュールを通して、SREに必須のスキルを身につけられるようになることを願っています。
LinkedInでは、このカリキュラムを、従来とは異なる採用者や大学新卒者のSRE職へのオンボーディングに使用しています。新入社員のオンボーディングを何度も成功させましたが、このコースのおかげで短期間で生産性を上げることができました。このことから、他の組織が新入社員をSREに迎え入れる際に役立つコンテンツをオープンソース化し、意欲的な人たちにSREになるためのガイダンスを提供したいと考えました。私たちが作成した最初のコンテンツは出発点に過ぎないことを理解しており、コミュニティがコンテンツの改良と拡張の道のりを支援してくれることを願っています。まずは、コントリビューションガイドをご覧ください。