Agentic APIの生成AIモデルとリージョン
このページには、OCI生成AIのエージェント機能でサポートされている事前トレーニング済モデルおよびリージョンのサブセットがリストされます。
エージェント機能には次のものがあります。
- 実行時にエージェントによって使用されるエージェント推論(ランタイム・チャット・コール)。
- プロジェクト・メモリー・モデルは、長期メモリー抽出および短期メモリー圧縮をOCI生成AIプロジェクトに追加するときに使用されます。
1.Agentic Inference(ランタイム)モデル
エージェントで使用可能なチャット・モデル
エージェントは、エージェント推論ユース・ケースに対して次のチャット・モデルをコールできます。
- Google Vertex AIプラットフォーム
- OpenAIオープン・ソース
- xAIプラットフォーム
使用可能なリージョン
エージェント推論モデルには、次の1つ以上のOC1リージョンからアクセスできます。
- 北米
-
- 米国東部(アッシュバーン)
- 米国中西部(シカゴ)
- 米国西部(フェニックス)
- 南アメリカ
-
- ブラジル東部(サンパウロ)
- ヨーロッパ(EU)
-
- ドイツ中央部(フランクフルト)
- 英国南部(ロンドン)
- 中東(ME)
-
- サウジアラビア中央部(リヤド)
-
ノート
エージェントAPIは、UAE East (Dubai)では使用できません。
- アジア太平洋(AP)
-
- インド南部(ハイデラバード)
- 日本中央部(大阪)
プロジェクトメモリーモデル(プロジェクト設定)
プロジェクトを作成してメモリー機能を有効にするときに、次のモデルを選択します。
- 短期メモリー圧縮 (会話履歴圧縮)
- 長期メモリー抽出(会話から重要な情報を抽出する要求)
- 長期メモリー埋込み(抽出されたメモリーを検索可能なベクトルとして格納)
2.1 短期メモリー圧縮(会話履歴圧縮)
プロジェクトでは、短期的なメモリー圧縮に次のモデルを使用できます。
| リージョン | リージョン・コード | 埋込みモデル |
|---|---|---|
| ブラジル東部(サンパウロ) | sa-saopaulo-1 |
|
| ドイツ中央部(フランクフルト) | eu-frankfurt-1 |
|
| 英国南部(ロンドン) | uk-london-1 |
|
| インド南部(ハイデラバード) | ap-hyderabad-1 |
|
| 米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン) | us-ahsburn-1 (us-chicago-1へのクロス・リージョン) |
|
| 日本中央部(大阪) | ap-osaka-1 |
|
| サウジアラビア中央部(リヤド) | me-riyadh-1 |
|
| 米国中西部(シカゴ) | us-chicago-1 |
|
| 米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン) | us-phoenix-1(リージョン間を us-chicago-1に) |
|
2.2 長期メモリ
- 抽出モデル(サポートされているすべてのリージョン)
- OpenAI gpt-oss-120b
- 埋込みモデル
-
抽出されたメモリーを検索可能なベクトルとして格納するために使用される埋込みモデルは、「プロジェクト」リージョンによって異なります:
リージョン リージョン・コード 埋込みモデル ブラジル東部(サンパウロ) sa-saopaulo-1Cohere Embed Multilingual 3 ドイツ中央部(フランクフルト) eu-frankfurt-1Cohere Embed Multilingual 3 英国南部(ロンドン) uk-london-1Cohere Embed Multilingual 3 インド南部(ハイデラバード) ap-hyderabad-1Cohere Embed Multilingual Image 3 米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン) 外部コールを参照してください
us-ahsburn-1(us-chicago-1へのクロス・リージョン)Cohere Embed 4 日本中央部(大阪) ap-osaka-1Cohere Embed 4 サウジアラビア中央部(リヤド) me-riyadh-1Cohere Embed 4 米国中西部(シカゴ) us-chicago-1Cohere Embed 4 米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン) 外部コールを参照してください
us-phoenix-1(us-chicago-1へのクロス・リージョン)Cohere Embed 4
ノートおよび既知の制限事項
- UAE東部(ドバイ):エージェントAPIはこのリージョンでは使用できません。
- 可用性:このページのエージェント推論モデルについてリストされているリージョンは、エージェント機能がサポートされている場所を示します。個々のモデルの可用性は、引き続きリージョン内で異なる場合があります。
Googleモデルへの外部コール
米国リージョンのGoogle Gemini 2.5 Proへの外部コール
米国リージョンのOCI生成AIサービスを介してアクセスできるGoogle Gemini 2.5 Proモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Google Gemini 2.5 Proモデルをコールすると、Googleロケーションがコールされます。Google Gemini 2.5 Proでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。
米国リージョンのGemini 2.5 Flashへの外部コール
米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flashモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flashモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flashでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。
米国リージョンのGemini 2.5 Flash-Liteへの外部コール
米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flash-Liteモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flash-Liteモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flash-Liteでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。