Agentic APIの生成AIモデルとリージョン

このページには、OCI生成AIのエージェント機能でサポートされている事前トレーニング済モデルおよびリージョンのサブセットがリストされます。

エージェント機能には次のものがあります。

  • 実行時にエージェントによって使用されるエージェント推論(ランタイム・チャット・コール)
  • プロジェクト・メモリー・モデルは、長期メモリー抽出および短期メモリー圧縮をOCI生成AIプロジェクトに追加するときに使用されます。

1.Agentic Inference(ランタイム)モデル

エージェントで使用可能なチャット・モデル

エージェントは、エージェント推論ユース・ケースに対して次のチャット・モデルをコールできます。

Google Vertex AIプラットフォーム
OpenAIオープン・ソース
xAIプラットフォーム

使用可能なリージョン

エージェント推論モデルには、次の1つ以上のOC1リージョンからアクセスできます。

北米
  • 米国東部(アッシュバーン)
  • 米国中西部(シカゴ)
  • 米国西部(フェニックス)
南アメリカ
  • ブラジル東部(サンパウロ)
ヨーロッパ(EU)
  • ドイツ中央部(フランクフルト)
  • 英国南部(ロンドン)
中東(ME)
  • サウジアラビア中央部(リヤド)
  • ノート

    エージェントAPIは、UAE East (Dubai)では使用できません。
アジア太平洋(AP)
  • インド南部(ハイデラバード)
  • 日本中央部(大阪)
重要

前述のすべてのリージョンで、すべてのモデルを使用できるわけではありません。モデルごとにサポートされているリージョンおよびデプロイメントの詳細は、リージョン別のモデル・ページを参照してください。

プロジェクトメモリーモデル(プロジェクト設定)

プロジェクトを作成してメモリー機能を有効にするときに、次のモデルを選択します。

  • 短期メモリー圧縮 (会話履歴圧縮)
  • 長期メモリー抽出(会話から重要な情報を抽出する要求)
  • 長期メモリー埋込み(抽出されたメモリーを検索可能なベクトルとして格納)

2.1 短期メモリー圧縮(会話履歴圧縮)

プロジェクトでは、短期的なメモリー圧縮に次のモデルを使用できます。

リージョン リージョン・コード 埋込みモデル
ブラジル東部(サンパウロ) sa-saopaulo-1
メタ
OpenAIオープン・ソース
ドイツ中央部(フランクフルト) eu-frankfurt-1
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
英国南部(ロンドン) uk-london-1
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
インド南部(ハイデラバード) ap-hyderabad-1
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン) us-ahsburn-1 (us-chicago-1へのクロス・リージョン)
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
日本中央部(大阪) ap-osaka-1
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
サウジアラビア中央部(リヤド) me-riyadh-1
メタ
OpenAIオープン・ソース
米国中西部(シカゴ) us-chicago-1
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン) us-phoenix-1(リージョン間を us-chicago-1に)
Google Vertex AIプラットフォーム
メタ
OpenAIオープン・ソース

2.2 長期メモリ

抽出モデル(サポートされているすべてのリージョン)
OpenAI gpt-oss-120b
埋込みモデル

抽出されたメモリーを検索可能なベクトルとして格納するために使用される埋込みモデルは、「プロジェクト」リージョンによって異なります:

リージョン リージョン・コード 埋込みモデル
ブラジル東部(サンパウロ) sa-saopaulo-1 Cohere Embed Multilingual 3
ドイツ中央部(フランクフルト) eu-frankfurt-1 Cohere Embed Multilingual 3
英国南部(ロンドン) uk-london-1 Cohere Embed Multilingual 3
インド南部(ハイデラバード) ap-hyderabad-1 Cohere Embed Multilingual Image 3
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン)

外部コールを参照してください

us-ahsburn-1 (us-chicago-1へのクロス・リージョン) Cohere Embed 4
日本中央部(大阪) ap-osaka-1 Cohere Embed 4
サウジアラビア中央部(リヤド) me-riyadh-1 Cohere Embed 4
米国中西部(シカゴ) us-chicago-1 Cohere Embed 4
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン)

外部コールを参照してください

us-phoenix-1 (us-chicago-1へのクロス・リージョン) Cohere Embed 4

ノートおよび既知の制限事項

  • UAE東部(ドバイ):エージェントAPIはこのリージョンでは使用できません。
  • 可用性:このページのエージェント推論モデルについてリストされているリージョンは、エージェント機能がサポートされている場所を示します。個々のモデルの可用性は、引き続きリージョン内で異なる場合があります。

Googleモデルへの外部コール

重要

米国リージョンのGoogle Gemini 2.5 Proへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGoogle Gemini 2.5 Proモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Google Gemini 2.5 Proモデルをコールすると、Googleロケーションがコールされます。Google Gemini 2.5 Proでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flashへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flashモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flashモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flashでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flash-Liteへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flash-Liteモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flash-Liteモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flash-Liteでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。