プロジェクト

OCI Generative AIプロジェクトでは、会話と応答を共有設定の下に整理します。プロジェクトでは、データの保持期間を定義し、長期メモリーが会話間でコンテキストを維持できるようにし、短期メモリー圧縮を有効にして会話履歴の処理方法を最適化します。

プロジェクトは、ライフサイクル管理とコンプライアンスの境界をサポートするために相互に分離されています。APIおよびSDKコールでプロジェクトOCIDを参照し、実行時にプロジェクト設定を適用します。

プロジェクトについて

プロジェクトは、レスポンス、会話、ファイル、コンテナなど、生成AIサービスによって作成されたエージェント固有のアーティファクトを編成するOCIリソースです。プロジェクトは相互に分離されているため、あるプロジェクトのアーティファクトには別のプロジェクトからアクセスできません。エージェント関連タスクのOCI OpenAI互換APIをコールするには、プロジェクトが必要です。

プロジェクト設定には次のものがあります。

  • レスポンスと会話のデータ保持
  • 長期メモリ設定
  • 会話履歴圧縮(短期メモリー圧縮)設定
  • プロジェクトを削除すると、そのプロジェクト内に作成されたすべての関連アーティファクト(レスポンス、会話、ファイルおよびコンテナ)が削除されます。
  • APIコールでは、プロジェクトOCIDが使用されます。

エージェント・メモリー

エージェント・メモリーを使用すると、エージェントはインタラクション間でコンテキストを保持して使用できます。会話内の短期メモリと会話全体の長期メモリの両方をサポートし、継続性、関連性、効率性を向上させます。

短期メモリー

短期記憶とは、進行中の会話の中で繰り越される会話のコンテキストを指します。Responses APIとConversations APIは、会話の状態管理を簡素化し、マルチターンのインタラクションを可能にします。

長期メモリー

長期間のメモリは、会話全体で永続的なコンテキストを提供します。有効にすると、サービスは会話から重要な情報を抽出して格納し、同じプロジェクト内の将来の相互作用でリコールできるようにします。

長期メモリーは、次のようなセッション間の継続性を必要とするシナリオで役立ちます。

  • 安定したユーザー・プリファレンスの記憶
  • 繰返しバックグラウンド・コンテキストの保持
  • 相互作用の継続性の維持

短期メモリー圧縮

会話履歴が増えるにつれて、完全な履歴を送信すると、トークンの使用状況と待機時間が増加する可能性があります。短期メモリー圧縮は、以前の会話履歴を要約し、より小さく構造化された表現に圧縮します。これにより、モデルに送信されるコンテキストの量を削減しながら、キーの詳細を保持できます。

この方法の特徴は、次のとおりです。

  • 以前のターンからの重要な情報を保持します
  • 長い会話のトークン使用を削減
  • コンテキストを軽量に保つことでレイテンシを向上

データ保存

データ保持では、プロジェクト・アーティファクトが自動的に削除されるまで保持される期間を定義します。OCI Generative AIプロジェクトでは、応答と会話の保持を個別に設定します。

  • レスポンス保持: 生成されたレスポンスを保持する期間を制御します。
  • 会話の保持: 最新の更新後に会話が保持される期間を制御します。

保存設定は、ストレージ期間を制御し、組織のデータ処理要件に合せるのに役立ちます。

QuickStart権限

  1. プロジェクトOCIDを取得するために必要な最小IAMポリシーを追加します。
    allow group <your-group-name> to use generative-ai-project 
    in compartment <your-compartment>
  2. (オプション)前の権限ではなく、プロジェクトを作成および削除する必要がある場合は、次のポリシーを追加します:
    allow group <your-group-name> to manage generative-ai-project 
    in compartment <your-compartment>

    ガイダンスについては、OCI生成AIのIAMポリシーを参照してください。