はじめに
現地時間 2024/7/16 に開催されている AWS Summit New York 2025 で多くの生成 AI 関連のアップデートが発表されました。
以下の公式ブログに基調講演での発表内容がまとめられていますが、本記事では基調講演などでの発表も踏まえて日本語で概要をまとめています。
Amazon Nova 関連
Amazon Nova のカスタマイズが可能に
- Bedrock でファインチューニング/蒸留または SageMaker AI 上でカスタマイズしたモデルをオンデマンドで利用できる
- Nova 以外のカスタムモデルは Provisioned Throughput の購入が必須だったため、それと比較すると大幅にコストを抑えて利用を開始できる
- カスタマイズに対応しているのは Nova Micro、Nova Lite、Nova Pro
- リリース時点ではバージニア北部リージョンでのみ利用可能
Nova Sonic 対応言語追加
基調講演では特に触れられていませんでしが、アップデートとして記載します。
- Nova Sonic はリアルタイム音声会話が可能な音声合成モデル
- これまでは英語のみのサポートだったが、新たにフランス語、イタリア語、ドイツ語をサポート
AI Agent 関連
Amazon Bedrock AgentCore の発表 (Preview)
- Strands Agents、LangGraph、といったオープンソースのフレームワークやモデルを使用して、本番環境レベルのエージェントを安全かつスケーラブルに構築、デプロイ、運用するためのモジュール式のサービス群
-
Runtime
- セキュアなサーバーレス実行環境
- フレームワーク、プロトコル、モデル選択に関係なく AI エージェントをデプロイ・スケール
- 最大 8 時間の長時間ワークロード実行に対応
- セッションごとの専用計算環境と完全なメモリ分離
-
Memory
- 短期メモリ (マルチターン会話用) と 長期メモリ (ユーザーセッション間で持続) を提供
- 協力するエージェント間でのメモリストア共有が可能
- 短期メモリを自動的に長期メモリにエンコード (重要な情報を圧縮して保持) するため、開発者による管理が不要
-
Identity
- AWS のサービスやサードパーティのツール、サービスに安全に接続できるようにする認証情報管理サービス
- インバウンド認証: Cognito/Okta/Entra ID などの既存アイデンティティプロバイダーと連携し、Caller がエージェント、ツールランタイム、またはゲートウェイにアクセスできるように認証・承認する
- アウトバウンド認証: API キーまたは OAuth クライアントを使用して、エージェント、ツール、またはゲートウェイが下流のリソースにアクセスできるようにする
-
Code Interpreter
- セキュアなサンドボックス環境でのコード記述・実行
- ファイルの読み書きが可能 (アップロードはインラインで100MBまで、S3 経由で 2GB まで)
- インターネットアクセス可能
- Python、JavaScript、TypeScriptなど複数言語の事前構築ランタイムを提供
-
Browser
- エージェントがウェブアプリケーションを操作できる、安全で分離されたブラウザ環境を提供
- 既存の Compute Use などとは異なり、特定のモデルに依存しないことが特徴
- ブラウザセッションの記録 (S3 に保存) とリプレイに対応し、デバッグ、監査、トレーニングなどの用途で利用可能
-
Gateway
- ツールとデータソースの構築、デプロイ、発見、接続を簡単かつ安全に実現する機能
- OpenAPI、Smithy、Lambda 関数を MCP 互換ツールに変換し、Gateway エンドポイントを介してエージェントが利用できるようにする
- Salesforce、Slack、Jira、Asana、Zendesk など人気ツールとはワンクリックで連携
- セマンティック検索機能により、エージェントがタスクのコンテキストに基づいて利用可能なツールを高速に特定できる
-
Observability
- エージェントのパフォーマンスをトレース、デバッグ、監視できる
- 出力されるメトリクスやログデータは CloudWatch に保存され、CloudWatch GenAI Observability で提供されるダッシュボードから参照可能
- OpenTelemetry (OTEL)互換形式でテレメトリデータを出力するため、既存のモニタリングおよびオブザーバビリティスタックとも簡単に統合可能
AWS Markatplace に AI エージェントとツールカテゴリが追加
- AWS パートナーが提供する構築済みエージェントや MCP サーバー、ガードレール、ナレッジベースなどのツール、プロフェッショナルサービス、エージェント開発ソリューションなどがカテゴリに登録されている
- AgentCore Runtime で 構築済みエージェントやツールを実行できる
- AgentCore Gateway で AWS Marketplace から提供される API ベースのエージェントやツールに安全かつ迅速に接続できるように
Strands Agents の一般提供開始 (事前発表済み)
- AWS が中心となって開発するオープンソースのエージェント開発フレームワーク
- v1.0.0 がリリースされ、A2A(Agent-to-Agent)サポート、会話のデータ永続化、マルチエージェントワークフローなどの機能が追加
Amazon S3 Vector の発表 (Preview。事前発表済み)
- 汎用バケット、テーブルバケットに次ぐ新しいデータタイプとして S3 Vector を発表
- PutVectors や QueryVectors などの一般的なベクトルデータベースとしての API も提供し、低コストのベクターストアとして利用可能
- 現状 S3 Vector としては埋め込みの API は持っていない
- Bedrock Knowledge Bases とすでに統合済み
- 他のベクターストアと比較すると検索性能やレイテンシなどが劣ると思われるので、安いからと言って S3 Vector 一択になるわけではなく、使い分け
- S3 Vector から OpenSearch Servelrss にデータを移行できる機能も提供
- OpenSearch から階層ストレージ的に透過的に S3 Vector にアクセスできるわけではない
Kiro (Preview、事前発表済み)
- AWS が開発する Agentic IDE
- 仕様駆動開発や Agent Hock などの機能が特徴
- すでにいろいろな紹介記事がでているので詳細は割愛
AWS AI League
- AWS DeepRacer スタイルのゲーミフィケーションを LLM に適用した従業員のスキルアップを支援するプログラム
- Bedrock や SageMageker AI などを使ってプロンプトエンジニアリングやモデルのカスタマイズなどの課題を解きながら実環境で学習することができる
- 個人としては AWS Summit や re:Invent などで開催されるイベントに参加できる
Keynote 以外での生成 AI 関連のアナウンス
基調講演では特に触れられていませんでしたが、他にも前日からいくつかアップデートがでているので参考までにまとめておきます。
CloudWatch GenAI observability (Preview)
- モデル呼び出しの可観測性と Bedrock AgentCore の可観測性の二つが、GenAI observability として提供されている
- モデル呼び出しの可観測性でinput/output text などのログの中身を確認したい場合は Model Invocation Logs を設定し、ログを CloudWatch に送信する必要がある (S3 だけだとダメ)
TwelveLabs の動画理解モデルが Bedrock で利用可能に
- Marengo: 検索や分類などのタスクに優れた動画埋め込みモデル
- Pegasus: 動画データに基づいてテキストを生成できる動画言語モデル
Knowledge Bases がベクターストアとして Amazon OpenSearch Service マネージドクラスターをサポート
- Serveless Collection に加え、マネージドクラスターもナレッジベースのベクターストアとして利用可能に
- マネージドクラスターの利点は、クラスター構成や細かく制御できるため、ユーザー側でパフォーマンスとコストを調整できる
以上です。
参考になれば幸いです。
Views: 0