高い処理能力と必要に応じた環境の組み合わせにより、効率的でハイレベルなサービスを実現できることが特徴で、多くの有名企業がAWSを導入・活用しています。
今回は、AWSは世の中でどのくらい浸透しているのか、いくつかの有名企業や機関の導入事例を基に検証していきましょう。
AWSの最新導入事例:PayPay
大規模キャンペーンでのシステムトラブルに学ぶ対処法 日本では、空前のQRコード決済ブームが起きています。その中でも、2018年10月のサービス開始から、QR決済ブームを牽引してきたのがPayPayです。2019年6月にAWSのイベントでは、PayPayのシステムについて講演が行われ、その内容を知ることができました。
PayPayのシステムには、EC2・RDS・S3・CloudFrontなど多くのAWSが利用されています。
3ヶ月という短い期間で、サービス開始を実現するために、60以上の独立したマイクロサービスを組み合わせて構築する手法を取り、日本やカナダで7以上のエンジニアチームが時差を利用して開発し、無事ローンチに至ったといいます。
AWSを選ぶメリットと実際に起きたトラブル
開発側がAWSを選んだ理由として、- 開発リソースの調達が素早く容易
- 決済サービスに利用できるレベルのセキュリティ
- 日本での冗長性が確保できること
その後、サービス開始直後の2018年12月に実施した「100億円あげちゃうキャンペーン第1弾」が、10日間で終了するほどの大反響。しかし、様々なトラブルやシステム障害が続出。
実際に起きたトラブルの原因を、
- 想定以上のアクセス数とトラフィック量
- 不十分なサーバとストレージ処理能力
- 事前の負荷テストと、実際に起きた障害にずれがあったこと
- 外部との連携を行うマイクロサービスでトランザクションが滞留し、決済システムも連鎖
であると分析し、課題解決に取り組みました。
トラブル防止のため実際に対策したポイントと教訓
具体的には、キャンペーン中と終了後に、以下のような対策を行い、- 負荷軽減のためホーム画面などのデザイン変更、機能の制限や廃止を行った。
- トラフィック量に応じてアクセス制限を設ける仕組みを導入した。
- タイムアウト設定時間の短縮し、システム障害の発生を未然に防ぐようにした。
- サービスを分割してシステム障害発生時の連鎖的なクラッシュを回避できるように対策した。
- アプリケーション監視ツール・コンテナ管理ツール・データベース監視ツールの導入etc
今回の教訓としては、トラブルの原因を的確に捉え対策すること。システム自体を過信せず、障害を想定した構築と、障害時の被害拡大を防ぐ設計が重要です。
また、大規模トラブルにも柔軟な対処や拡張が可能な、AWSのサービスのレベルの高さも実感できます。
AWSの最新導入事例:ZOZOTOWN
膨大な数の商品画像を扱うZOZOTOWNで利用されるAWSのサービス
ファッション通販サイト最大手の「ZOZOTOWN」では、7300以上のブランドの、65万点を超える販売アイテムがオンラインで購入できます。最短翌日配達や、2ヶ月後の支払いが可能なツケ払いシステム、多彩な日替わりクーポンなどで人気となり、今では日本や中国、韓国などでも展開しています。
ZOZOTOWNのアイテムページを見ると、たくさんの商品画像が並んでいて、直感的に選択できるように工夫されています。
この数億枚にも及ぶ商品画像のデータファイルを保存しているのが、AWSのS3。そして、画像データのリサイズなどをLambdaで行っています。
オンプレミスからAWSへの移行
AWSを利用する以前は、オンプレミスサーバ10台で管理していたようですが、日々増え続けるデータ量からの容量不足と、画像関連の管理や保守の面での不安から、AWSへの移行を選択したようです。AWSを選ぶ際のメリットと実際の効果
オンプレミスからの移行の際、AWSのS3とSnowballのどちらを使うか検討したようです。最終的にS3を選択したのですが、メリットとして- 容量に制限がなく画像データの容量を考慮しなくて良い。
- 複数のデバイスにバックアップ保存をする仕組みのため耐久性が優秀な点。
- AWSのソリューションアーキテクトから技術的なサポートが受けられる点。
- 運用ノウハウや知識が共有・公開されているためクラウド運用未経験でも安心できる点。
- Snowballと比べ、オンプレミスからのデータ移行時間が短縮できる点。
さらに、実際オンプレミスサーバから移行する際、保存する画像データを厳選し、データ転送処理の方法を見直したことで、Snowballで想定された転送処理時間を、S3とLambdaの使用でおよそ9分の1まで縮小することができたと言います。
また、移行後の運用方法にもLambdaとS3を利用しており、容量不足とデータ保守・管理部分の不安は解消され、さらにコストカットや属人化していた人員を考慮しなくて良くなったという相乗効果も産まれています。
ただし、S3のGETリクエストに関しては不安な部分もあるようで、さらなるサービスの追求に取り組んでいます。
今回の教訓として、オンプレミス環境の課題解決に早期に取り組んだこと。オンプレミスからAWSへの移行にも、様々な方法を検討し、検証してから導入に至ったこと。導入後もクラウドサービスについて問題提起と検証を重ねていることが重要だと言えます。
AWSの最新導入事例:京都大学
災害時の復旧と可用性の確保のためのAWS
日本最高峰の国立大学である京都大学は、設立から100年以上の歴史を持ち、2004年には国立大学法人として新たに組織しています。東京大学と並びトップレベルの難関大学としても知られ、卒業生には、数々の研究者や著名人がいることでも知られます。
京都大学も、ZOZOTOWNと同様オンプレミスからAWS運用に切り替えた企業の一つです。
京都大学のAWS運用の目的は、主にシステムの可用性確保と災害時の復旧への対策でした。
もともと大学全体のシステムを一つに集約して、オンプレミスでの運用を行っていましたが、利用者からのパフォーマンスへの不満はあったようです。
時を同じくして、西日本を中心とした大規模な自然災害(豪雨や地震)のニュースを受けて
災害発生時のシステム復旧や早期回復を実現し、その被害を最小限にする予防環境の整備をクラウドシステムに求めることにしました。
AWSを選んだ理由と移行後のメリット
京都大学のインフラ担当者は、- 24時間休まずオンプレミスでシステムを稼働、維持していくには、運用担当者が少なく、かなりの負荷がかかること。
- サーバがクラウドで稼働するため、大学が災害の被害を受けてもITインフラが保護できるため。
- 必要な要件を考慮し、他のパブリッククラウドに比べた際、コストパフォーマンスに優れていたこと。
- アベイラビリティーゾーン3ヶ所をユーザーが選択できる点。
その後2ヶ月かけて、Sler(システムインテグレーター)の協力を受け、実際にオンプレミスからAWSへと移行します。
その際、漏洩リスクを考慮し、個人データや機密データのみオンプレミス環境で保管することにしました。
結果的に、オンプレミスとパブリッククラウドを利用するハイブリッドクラウドで運用する形となりましたが、当初の目的であった災害に強いシステムの構築と、物理的なセキュリティの強化など大きな成果があったようです。
さらに、トータルコストの削減と、少ない人員でも高いパフォーマンスで運用できる環境が整ったこと、クラウド化したことで外部との連携強化に繋がる可能性が広がったことをメリットであると捉えています。
AWS移行時の問題点とさらなるクラウド環境の活用
AWS移行の際に上がった問題点として、古いシステムの不要なデータが残ったままで、工数が増えたことを挙げています。また、G-mailやkintoneといった業務アプリケーションもクラウド化する作業を並行して行っていたため、スケジュールを圧迫したことを問題だったと振り返っています。
今回の教訓として、自然災害に強いパブリッククラウドを積極的に活用したこと。Slerの協力を受けてハイブリッドシステムを取り入れたこと。ITインフラ、業務アプリケーションのクラウド化が金銭的、人員的、物理的な問題解決に繋がったこと。以上が重要だと言えそうです。
まとめ
いくつかの有名企業の事例から、世の中にどのくらいAWSが浸透しているかを確認できました。それではまとめです。- AWSとマイクロサービスを組み合わせることで、短期間でのシステム構築が可能。
- キャンペーンなど大規模なアクセスやトラフィックを想定し、事前に十分なサーバやストレージ環境を準備する。
- システム障害などトラブルは原因を洗い出し、対策と検証を行う。
- クラウド自体を過信せず、障害時の被害を最小限にする対策も行う。
- 数億枚の画像データにも容量を気にせずに利用できる。
- オンプレミスからのデータ移行も、AWSのサービスの組み合わせで短期間で実現可能。
- コストカットと管理・保守人員の削減に繋がる。
- 物理的にも自然災害に強いインフラ環境づくりが、AWS運用で実現できる。
- 人員コストをかけられない場合は、Slerを選択した方が良い。
- ハイブリッドクラウドという選択肢も考慮する。