30億のデバイスで走るHonMarkHunt

JavaとJavaScriptと恐竜の絶滅について書いていきます。

新宿 Geek Lounge#7 SRE Meetup 行ってきたメモ

shinjuku-geek-lounge.connpass.com

こちら行ってきた。のでメモンヌ。

wifiのpasswordセキュリティーがすごい。

毎度ご飯がすごく美味しそう。

SRE的プラクティスのここがよかった/ダメだった集

speaker

渋谷/オプト (@m4buya) | Twitter

slide

qiita.com

エラーバジェット

  • とは? : 失敗の許容範囲の閾値
  • 定めておくと開発速度うp

とはいえ失敗の合意を取るのは難しい 失敗 < 成果 になるための大人の言い訳が付けれないと実際は難しい。

時間など計算して「ほら早くなっただろう」が示せるとなお良し。

SLO

  • サービス品質の目標値
  • SREは品質をあげる仕事なのでどこまで担保するかを決めておくのはとても大事
  • 担保できなかった場合を定義しておけるとなお良し。

トイル

  • 日々発生するしょうもない仕事を減らそうって話
    • トイルの作業時間は50%以下
  • togglで監視した。togglは良かった。トイルは減らない。そもそもトイル50%ってなかなかならない
  • 俺も測ってみたいけどマインスイーパー50%ってバレるからやらない

toggl.com

オンコール

  • アラート対応
  • サービスが安定してくると緊張感なくなってくる
    • 大事な時にパソコン持ってなかったりするよね

インシデント管理

  • 緊急事態のフレームワーワク(対応方針みたいな?)
  • これは考えておきたい
  • Slack channelとかくらいなら作れそうなので考えておく

ポストモーテム

  • 障害事例のメモ(みたいな感じ?)
  • どいういう時に書くべきか論
  • 見せ合いっこすると楽しい

メモ

  • 優しそうな人だった

VOYAGE GROUPでSREチームができるまでとこれから

speaker

にしごおり (@_nishigori) | Twitter

slide

speakerdeck.com

What is SRE

  • 本を読め
  • 読む

SLOを設定する

  • 「 ADが出ないをなくす!」
    • いろんなケースがあるので定義をしっかりする
  • 計測(モニタリング)大事
    • 私は今Datadogが多機能すぎて何をモニタリングすればいいのかすらわかってない

エンジニアリング

  • SREチームはめっちゃコード書くし1日複数回リリースする
  • Not 専任 But 専門
    • かっこいい、マネしよう
  • developerと壁を作らないように働く

メモ

SLOのあるサービスとないサービスの話

speaker

キン肉マン Takato Horikoshi (@tkt_horikoshi) | Twitter

slide

speakerdeck.com

SLO

  • SLAはservice level agreement => ユーザーとのお約束みたいなもの?
  • SLOがあると ⭐️1 ゴミアプリを回避できる
  • SLOがあっても あぐらをかくと ⭐️1 ゴミアプリは回避できない
  • 最終的に顧客に良い価値を届けることに繋がるのでSLOはとても重要

SLOの選定に向けて

  • ユーザー目線
  • 今にとらわれない
  • 頑張りすぎない
  • たまに見直す

メモ

  • キン肉マン直前までめっちゃご飯食べてた
  • ヘイシャもSLOを定めてみようと思った。
    • 何も思いつかない
  • SLOは四半期に見直す

最後に

飯うま。

f:id:HonMarkHunt:20190312203433j:plain