新宿 Geek Lounge#7 SRE Meetup 行ってきたメモ
shinjuku-geek-lounge.connpass.com
こちら行ってきた。のでメモンヌ。
毎度ご飯がすごく美味しそう。
SRE的プラクティスのここがよかった/ダメだった集
speaker
slide
エラーバジェット
- とは? : 失敗の許容範囲の閾値
- 定めておくと開発速度うp
とはいえ失敗の合意を取るのは難しい 失敗 < 成果
になるための大人の言い訳が付けれないと実際は難しい。
時間など計算して「ほら早くなっただろう」が示せるとなお良し。
SLO
- サービス品質の目標値
- SREは品質をあげる仕事なのでどこまで担保するかを決めておくのはとても大事
- 担保できなかった場合を定義しておけるとなお良し。
トイル
- 日々発生するしょうもない仕事を減らそうって話
- トイルの作業時間は50%以下
- togglで監視した。togglは良かった。トイルは減らない。そもそもトイル50%ってなかなかならない
- 俺も測ってみたいけどマインスイーパー50%ってバレるからやらない
オンコール
- アラート対応
- サービスが安定してくると緊張感なくなってくる
- 大事な時にパソコン持ってなかったりするよね
インシデント管理
- 緊急事態のフレームワーワク(対応方針みたいな?)
- これは考えておきたい
- Slack channelとかくらいなら作れそうなので考えておく
ポストモーテム
- 障害事例のメモ(みたいな感じ?)
- どいういう時に書くべきか論
- 見せ合いっこすると楽しい
メモ
- 優しそうな人だった
VOYAGE GROUPでSREチームができるまでとこれから
speaker
slide
What is SRE
- 本を読め
- 読む
SLOを設定する
- 「 ADが出ないをなくす!」
- いろんなケースがあるので定義をしっかりする
- 計測(モニタリング)大事
- 私は今Datadogが多機能すぎて何をモニタリングすればいいのかすらわかってない
エンジニアリング
- SREチームはめっちゃコード書くし1日複数回リリースする
- Not 専任 But 専門
- かっこいい、マネしよう
- developerと壁を作らないように働く
メモ
- 意識して壁を壊しに行く気持ちが大切
- やれる人がやってこうぜ!
- Full Cycle Developers at Netflix – Netflix TechBlog – Medium
SLOのあるサービスとないサービスの話
speaker
キン肉マン Takato Horikoshi (@tkt_horikoshi) | Twitter
slide
SLO
- SLAはservice level agreement => ユーザーとのお約束みたいなもの?
- SLOがあると ⭐️1 ゴミアプリを回避できる
- SLOがあっても あぐらをかくと ⭐️1 ゴミアプリは回避できない
- 最終的に顧客に良い価値を届けることに繋がるのでSLOはとても重要
SLOの選定に向けて
- ユーザー目線
- 今にとらわれない
- 頑張りすぎない
- たまに見直す
メモ
- キン肉マン直前までめっちゃご飯食べてた
- ヘイシャもSLOを定めてみようと思った。
- 何も思いつかない
- SLOは四半期に見直す
最後に
飯うま。