「Google Cloud Platform」(GCP)の障害を引き起こしたエンジニアの行動とは?対処の迅速さに評価の声も

「Google Cloud Platform」(GCP)の複数のサービスが2019年3月、障害に見舞われた。アナリストは、Googleの素早い対処と透明性を評価する。

2019年04月03日 05時00分 公開
[Chris KanaracusTechTarget]

関連キーワード

Google | ストレージ | IaaS | PaaS


画像

 Googleのクラウドサービス群「Google Cloud Platform」(GCP)で2019年3月11日(日付は米国時間)に発生した障害は迅速に解決され、ユーザー企業への影響は限定的だった。だがユーザー企業にとっては、クラウドサービスの信頼性を向上させるよう、クラウドベンダーに圧力をかけ続けなければならない必要性を再認識させる出来事だった。

 障害が発生したGCPのサービスは、以下の2つだ。

  • Cloud Console
    • ユーザー企業が自分のアカウントおよびプロジェクト管理に使うサービス
  • Cloud Dataflow
    • ユーザー企業がバッチとストリームデータの処理に使うサービス

GCPの障害はなぜ発生したのか

 Googleの事後検証によると、Cloud Consoleは約4時間にわたって使用不能になった。これはGCPでユーザーリクエストにレート(単位時間当たりのリクエスト数)制限をかけるシステムで実施した、コードの変更が原因だった。この不具合のために、システムがレート制限の低い状態に陥り、結果としてリクエストが拒否された。

 Cloud Dataflowの問題では、システムの速度が低下する問題が19時間以上も続いたが、2019年3月12日に完全に障害はなくなった。Googleは、原因の究明を続けると説明している。

 オブジェクトストレージの「Google Cloud Storage」は2019年3月12日に全リージョンで、エラーが増える現象が4時間にわたって発生した。Googleの事後検証によると、この問題はWebサイトやサービスの信頼性向上に向けたGoogleの取り組み「サイトリライアビリティーエンジニアリング」(SRE)を担当するエンジニアが取った行動に起因していた。

ITmedia マーケティング新着記事

news079.jpg

狙うは「銀髪経済」 中国でアクティブシニア事業を展開する企業とマイクロアドが合弁会社を設立
マイクロアドは中国の上海東犁と合弁会社を設立。中国ビジネスの拡大を狙う日本企業のプ...

news068.jpg

社会人1年目と2年目の意識調査2024 「出世したいと思わない」社会人1年生は44%、2年生は53%
ソニー生命保険が毎年実施している「社会人1年目と2年目の意識調査」の2024年版の結果です。

news202.jpg

KARTEに欲しい機能をAIの支援の下で開発 プレイドが「KARTE Craft」の一般提供を開始
サーバレスでKARTEに欲しい機能を、AIの支援の下で開発できる。