Google Cloud Next ’19 in Tokyo 行ってきた (day2) | Advent Calendar 2019
IT系の勉強会行ってきた Advent Calendar 2019 - Adventar の15日目
昨日に続いてGoogle Cloud Next ’19 in TokyoのDay2
Google Cloud Next ’19 in Tokyo | 7 月 30 日 - 8 月 1日
資料は全部公開されてるので参加時のメモ
基調講演
- 企業事例いろいろ。印象に残ったのはファミペイDLしてねくらい
GKEとfirebaseでブロックチェーン Ginco
- ブロックチェーン:特定の管理者に依存せずに価値や権利のやり取りをできる
→技術優位性:発行や流通が低コスト、非中央集権、取引を自動的 - 仮想通貨 から 暗号資産 って呼び方に変わるらしい
- ブロックチェーンノードをGKE
1環境あたり24pod、全環境では60ノード以上を運用 - Firebaseを使ったブロックエクスプローラーを自作
- Firebase活用でアプリエンジニアの責任範囲が広くなるがバックエンドほぼ必要ない
- マネージドサービスを活用することで少人数での開発を実現
Site Reliability Engineering 入門
- ソフトウェアのコストの多くは運用コスト、開発時がかかりがち(開発者はアジリティ、運用担当者は安定性)
→DevOpsの登場、すべてのドメインをつなげる - ソリューション開発:スケーラビリティ、信頼性、効率性を発揮する大規模システムの設計、構築、運用
- 哲学と考え方:本番システムの運用を目的とした職務
- エンジニアリングの実践とツール:ソフトウェア開発とシステムエンジニアリングが交わるところで運用
- SREの原則:信頼性をどのように測定するか
様々な指標がある。→単純な定義だと可用性。成功した数/すべての数 - エラーバジェット:可用性目標を定義、許容されるダウンタイム
- SLI サービスレベル指標 尺度。成功の割合
- SLO サービスレベル目標 99.99% とか
- SLA サービスレベル契約 目標達成出来なかった場合にどのような処置が取られるか
- 適切なSLOの定義をするのは難しい、100%を目指すのは大抵間違い
- SREの実践:指標とモニタリング、キャパシティプランニング、変更管理、緊急対応、文化
- チームスキル:SWE と SE のスキルセットを組み合わせる。全員がコードを書かなければならない
- SREチームへの権限付与
エラーバジェットとトイルバジェットを使う権限を持つ必要がある
SREチームの負担を増やしすぎないように
Istio, k8s, Spinnakerを使ったカナリアデプロイメント
- SpinnakerではなくTektonの話
- GKEクラスタをTEKTONのパイプラインを使ってカナリアデプロイ可能
- デフォルトのk8sのリソースだけで簡単にカナリアのロールアウトが実施可能
- Istioを使うとカナリア機能を強化
- TEKTONやspinnakerはCDF次世代の為のCDを話すファウンデーションが存在
個人的にもっとFirebase系のセッション増やしてもいいんじゃないかと思いました。
Firebase系の便利なプロダクト色々あるのでそのへんの話を聞きたい。