SRE Lounge #11 行ってきた | Advent Calendar 2019
IT系の勉強会行ってきた Advent Calendar 2019 - Adventar の19日目
eurekaのパフォーマンス定点観測会の取り組み紹介2019
- パフォーマンス定点観測会
APIチームとインフラ関連全員が集まり毎週ミーティングを行う 水曜開催
30分ずつ、土日のトラフィックが多いので振返りも兼ねてる - DDのダッシュボードの1週間のメトリックスを振り返っていく
- ロードマップに乗らないタスクが発生しやすい
→3タスクを事前に確保、ターゲットを絞る - 可用性のSLI/SLOを深堀り
課題感は変わっていくので目標設定の変化を適切に行う - エラーログの件数変化
- エンドポイントごとのレスポンスタイム計測
Cybozuにおける大規模インフラ基盤の移行プロジェクトManekiの紹介
- 契約3万社 indexが40TBとか、昔の設計ままなので厳しい
- Necoというk8sという自社データセンターのスケーラブルな環境
- Manekiというインフラ基盤の移行プロジェクト
- yaml は ArgoCDで管理
- 監視:Prometheus + Grafana
安定・安価な ECS auto scaling を目指して
- Serviceのdesired countを調整する
- clustersを構成するinstansの数を調整
- Fargate使わない?
→割高、パフォーマンスが低い、タスク起動が遅い、log driverがawslogs
Cybozuさんも自前でk8sクラスタ運用してるらしい。
YahooやCyberAgentもそうだけど今後どんな感じで進化していくのか気になる。
DeNAはパブリッククラウド活用を全面に押し出してたので自前でk8s運用はやってなさそうなので、その辺が数年後どうなるんだろうか。