OPS

【AWS re:Invent2023】生成系AIとStable Diffusionを使った画像生成について

2023.12.18

本記事のポイント

本記事では生成系AIの成り立ちやAWSでAIを利用するときのポイント、Stable Diffusion の仕組みや実例を紹介します。
AWSのサービスを利用して生成系AIを構築や利用していくのは今後、強力な一つの選択肢になっていくと思いますので是非ご検討ください!!


セッション情報

セッション名 Unlocking your full potential with the power of generative AI on AWS
セッション概要 人工知能の画期的な分野である生成系AIは機械が多様なコンテンツやアイデアを生成できるようにします。AWS は生成系AIの変革の可能性をすぐに利用できます。基礎モデルとして知られる大規模な事前トレーニング済みモデルの機能を利用します。このトークでは、Amazon SageMaker と Amazon の仕組みについて学びます。Amazon Bedrock は、開発者、研究者、企業が簡単に生成系AI をアプリケーションに組み込むことができ、独自のデータを使用して生成系AIモデルを利用できるようになります。創造性の新たな次元を解き放ち、あなたとビジネスの未来を再構築します。

登壇者 役職
Vinicius Caridá AWS Machine Learning Hero
Head of Digital Customer Service Platforms, Data and AI

はじめに

本講演ではテクノロジー発展の歴史から生成系AIの概要と画像生成系AIのStable Diffusionを利用して実際にどのような画像を生成できるかを紹介していました。

AWSでの生成系AIとは

“スタートアップからエンタープライズまで、多くの組織が生成系人工知能 (AI) を使用したイノベーションにおいて AWS を信頼しています。エンタープライズグレードのセキュリティとプライバシー、業界をリードする基盤モデルへのアクセス、生成系 AI 搭載アプリケーションにより、AWS では、データ、ユースケース、顧客に合わせて生成系 AI を簡単に構築してスケールできます。”

引用元:AWS 公式サイト

AWSでは Amazon SageMaker や Amazon Bedrock など様々なサービスを利用して、生成系AIの構築が可能になります。
本講演では生成系AIが学習方法や構築や選択において重要な要素を紹介してくれました。

生成系AIは通常ユーザーからのインプットされる情報を基にシステムがアウトプットする形となり、下記画像は大規模言語モデル(LLM)での生成系AIの例となります。AWS CodeWhisperer などがそれにあたります。
その他の講義でも言及されていましたが AWS CodeWhisperer を利用することでコーディングにかかる時間がかなり短縮することができます。

生成系AIは①Understanding、②Reasoning&knowledge、③Generation、④Safety&responsibility の4つの主なステージに分けることができ、このライフサイクルを何度も繰り返すことでAIが回答を生成するそうです。

また生成系AIはそれ一つで全ての問題を解決できる万能なツールではないため、AWSで提供されているAIと様々な基盤モデル(FM)を組み合わせることで、サービスの用途に合わせて構築すること、またそれに使用されるデータやビジネスケースの選定が重要であることを強調していました。

画像生成系AIのStable Diffusionを用いて

まず画像生成系AIの基盤ともいえる「Diffusion models(拡散モデル)」と「CLIP(Contrastive Language-Image Pretraining)」を説明していただけました。

「Diffusion models(拡散モデル)」とは画像にノイズを加えていき(拡散過程)、ノイズだけになった画像からノイズを除去していき(復元過程)、生成した画像が元の画像に近づくように学習する技術になります。実際の画像を見ていただいた方が分かりやすいかと思います。

「CLIP(Contrastive Language-Image Pretraining)」とは大量の画像とテキストの組み合わせを学習し、その類似度を出したうえで特定の画像に対して適切なテキストを選択してくれるようにする方法になります。

上記を踏まえStable Diffusionでは「潜在拡散モデル」を利用しています。こちらはピクセル単位でノイズ加工、除去を行っていた「Diffusion models(拡散モデル)」の計算量を改善するために考えられた方法です。画像ではなく潜在変数に対して拡散過程と復元過程を実行していきます。

実際にAmazon SageMaker 内で使える Stable Diffusion を使って登壇者の同僚の画像を学習させていき、画像を生成するところまで紹介してくれました。最後には登壇者の同僚も登場し、みんなで写真撮影も行いました。実際の様子はこちらからご覧ください!!

まとめ

今回のre:Inventでもアツい分野のAIについてのSeesionについて紹介させていただきました。生成系AIを構築する際にAWSのサービスは強力な選択肢の一つになっていくと思いますので検討してみてはいかがでしょうか!!