アプリケーションの作成

OCI生成AIサービスでアプリケーションを作成します。

アプリケーションは、スケーリング、マネージド・ストレージ、ネットワーキング、認証設定など、ホストされたデプロイメントの管理対象ランタイムを定義します。このタスクでは、Oracle Cloudコンソールを使用してアプリケーションを作成するステップについて説明します。

ヒント

アプリケーションを作成した後、その詳細を表示して、その更新、別のコンパートメントへの移動、タグの管理、削除など、その他のタスクを実行できます。コンソールの「アクション」メニュー(3つのドット)を使用して、これらのタスクにアクセスします。アプリケーションのデプロイメントを1つ以上作成し、デプロイメントをアクティブ化して実行中バージョンにすることもできます。詳細は、アプリケーションのリストを参照してください。

アプリケーションを作成するには、リスト・ページで「アプリケーションの作成」を選択します。リスト・ページの検索に関するヘルプが必要な場合は、アプリケーションのリストを参照してください。

  1. (オプション)「環境変数」で、コンテナに必要な環境変数を追加します。
  2. (オプション)「ネットワーキング」で、アウトバウンド・トラフィック(エグレス)のネットワーキング・タイプを選択し、このアプリケーションのアクティブなデプロイメントにアクセスするためのエンドポイント・タイプ(パブリックまたはプライベート)を選択します。
  3. 「認証」で、アイデンティティ・ドメイン構成を選択し、必要なOAuth設定(スコープおよびオーディエンス)を指定します。
  4. 設定を確認し、「アプリケーションの作成」を選択します。

基本的な情報

  1. アプリケーションの名前を入力します。
    名前は文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアが続きます。長さは1 - 255文字です。
  2. (オプション)アプリケーションに関する説明を入力します。
  3. アプリケーションを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じですが、作業する権限がある任意のコンパートメントを選択できます。

タグ

  1. (オプション)「タグの追加」を選択し、このベクトル・ストアにタグを割り当てます。リソース・タグを参照してください。
  2. 「作成」を選択します。

スケーリング

  1. 自動スケーリングでは、ホストされるデプロイメントがロードを処理するためにスケーリングする方法を定義します。
    • 最小レプリカ

      少なくとも、この多くのレプリカを常に実行し続けます。最大レプリカ以下である必要があります。デフォルトは1です。

    • 最大レプリカ数

      レプリカの数を上限とします。負荷が増加すると、この制限まで新しいレプリカが追加されます。デフォルトは3 (最大30)です。自動スケーリングを無効にするには、最小レプリカと同じに設定します。

  2. 「同時実行性」メトリックを選択します。
    この設定により、同時リクエストがこの値を超えたときに、設定した最大レプリカ数までレプリカが追加されます。範囲: 1–500。
    • CPU使用率(%)

      CPU使用率がこのパーセンテージを超えた場合に、設定した最大レプリカまでレプリカを追加します。範囲: 50–95%。

    • メモリー使用率(%)

      メモリー使用率がこのパーセンテージを超えた場合に、設定した最大レプリカまでレプリカを追加します。範囲: 50–95%。

    • コンカレント要求

      コンカレント要求がこの値を超えた場合に、設定した最大レプリカ数までレプリカを追加します。範囲: 1–500。

    • リクエスト数/秒(RPS)

      少なくとも、この多くのレプリカを常に実行し続けます。最小レプリカ数以下にする必要があります。デフォルトは1です。

ストレージ(オプション)

エージェントがサービス管理ストレージを使用する必要がある場合は、PostgreSQL、OCI CacheおよびOracle Autonomous Databaseを選択できます。

このアプリケーションに関連付けられたホスト・デプロイメントのマネージド・ストレージを有効にします。マネージド・ストレージはサービスによって作成および管理され、このアプリケーションに関連付けられたホスト・デプロイメントからのみアクセスできます。接続の詳細は、環境変数を使用してコンテナに提供されます。

  1. エージェントがサービスの管理対象ストレージを使用する必要がある場合は、次のいずれかのオプションを有効にします。
    • OCI PostgreSQL

      OCI PostgreSQLを有効にして、このアプリケーションのデプロイメントの管理対象データベースを提供します。

      「ストレージ選択」ドロップダウンには、使用可能な管理対象PostgreSQL DBシステムのリストが表示されます。ストレージ・システムを選択すると、コンソールにそのストレージを現在使用しているアプリケーションのリストがドロップダウンの下に表示され、選択したDBシステムを共有しているアプリケーションを把握できます。

      このオプションの場合:
      • OCI PostgreSQL接続URIを受信する環境変数名を入力します。サービスは、指定された環境変数に接続文字列を追加します。コード内の環境変数名と同じ名前を使用する必要があります。
      • ストレージ: 作成するか、既存のストレージを使用するかを選択します。既存のストレージを選択すると、アプリケーションは、このOCI PostgreSQLをテナンシ内の他のアプリケーションと共有します。ただし、各アプリケーションに専用データベースが割り当てられ、このアプリケーションには専用データベースにアクセスする権限のみがあります。
    • OCIキャッシュ
      OCIキャッシュを有効にして、このアプリケーションのデプロイメントにマネージド・キャッシュを提供します。このオプションでは、次のことが行われます。
      • OCIキャッシュ接続URIを受信する環境変数名を入力します
      • ストレージ: 作成するか、既存のストレージを使用するかを選択します。
    • Oracle Autonomous Database
      Oracle Autonomous Databaseを有効にして、このアプリケーションのデプロイメントに管理対象データベースを提供します。このオプションでは、次のことが行われます。
      • Autonomous Database接続URIを受信する環境変数名を入力します
      サービスは、接続文字列に加えて、次の場所にあるコンテナ・ローカル・ファイルにデータベース・ユーザー資格証明をマウントします。
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (オプション)「環境変数」に、デプロイメントの環境変数を1つ以上入力します。

    コードでカスタム環境変数を使用する必要がある場合は、このセクションでこれらの変数を定義し、これらの環境変数をコンテナ・プロファイルに追加します。

    • プレーンテキスト

      変数ごとに、キー(環境変数名)とその値を定義します。

    • OCIボールト

      変数ごとに、次の情報を選択して、キー(環境変数名)およびボールトのシークレットを定義します。

      • ボールト・コンパートメント
      • ボールト
      • ボールト・シークレット
      このサービスは、ボールト情報をJSONファイルとしてコンテナに追加します。JSONコードの例:
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

ネットワーキング(オプション)

このアプリケーションのデプロイメントでアウトバウンド・トラフィック(エグレス)をルーティングする方法と、クライアントがデプロイメント・エンドポイントにアクセスする方法を選択します。

  1. 「ネットワーキング」で、次のオプションのいずれかを選択します。
    • デフォルト(サービス管理)

      サービス管理ネットワークを介したOCIサービスおよびパブリック・インターネットへのアウトバウンド・アクセスを許可します。

    • カスタム(顧客管理)
      プライベート・エンドポイント接続(PE/RCE)を使用して、テナンシ内のVCNおよびサブネットを介してアウトバウンド・トラフィックをルーティングします。プライベートなエンタープライズ統合デプロイメントにお薦めします。このオプションでは、次を選択します。
      • VCNコンパートメント
      • VCN
      • サブネット・コンパートメント
      • サブネット
      ノート

      カスタムを選択すると、すべてのエグレス・トラフィックがVCNのサブネットにルーティングされます。エージェントにインターネット・アクセスも必要な場合は、パブリック・サブネットを使用してルーティング表を構成できます。インターネット・ゲートウェイに関する項を参照してください。
  2. このアプリケーションのアクティブ・デプロイメントに、パブリック・エンドポイントとプライベート・エンドポイントのどちらからアクセスするかを選択します。
    • パブリック

      VCNの外部からアクセスできます。

    • Private

      VCN内からのみアクセス可能です。

      重要

      生成AIプライベート・エンドポイントを使用する必要があります。ない場合は、生成AIプライベート・エンドポイントを作成します。

      次の情報を選択します。

      • プライベート・エンドポイント・コンパートメント
      • プライベート・エンドポイント

    アプリケーションの作成後、そのFQDNまたはIPアドレスを使用して、このプライベート・エンドポイントからアプリケーションにアクセスできます。FQDNの例:

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

認証

このタスクを開始する前に、Setting up Authentication for Agentic Supportのタスクを実行します。

  1. 認証には「OCIアイデンティティ・ドメイン」を選択します。
  2. アイデンティティ・ドメイン情報を選択または貼り付けます。
    • 既存アイデンティティ・ドメインの選択

      サービス管理ネットワークを介したOCIサービスおよびパブリック・インターネットへのアウトバウンド・アクセスを許可します。

      • アイデンティティ・ドメイン・コンパートメント
      • アイデンティティ・ドメイン
    • アイデンティティ・ドメインURLの貼付け

      例: https://idcs-xxx.identity.oraclecloud.com:443

  3. アイデンティティ・ドメインについて、次のパラメータの値を入力します:
    • スコープ

      アクセス・トークンで許可されるアクション(権限)を指定します。例: user.reademail

    • 対象者

      アクセス・トークンの対象となるサービスまたはAPIを指定します。トークンは、オーディエンス・クレームがターゲット・リソース・サーバーと一致する場合にのみ受け入れられます。

      値を確認するには、アイデンティティ・ドメイン・コンソールに移動し、ステップ2で作成した統合アプリケーションを確認します。アイデンティティ・ドメインにアプリケーションを作成しますOAuth構成を選択し、プライマリ・オーディエンスをコピーしてここに貼り付けます。

      例:
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

確認および作成

選択内容を確認し、問題がない場合は「作成」を選択します。

ノート

アプリケーションが作成される時間は、アプリケーションのリソースによって異なります。

  • 管理対象ストレージが有効な場合、サービスは専用ストレージ・インスタンスをプロビジョニングします。これには数分かかる場合があります。

  • 「カスタム・ネットワーキング」を選択した場合、サービスは必要なネットワーク・ブリッジング・リソースをプロビジョニングします。これには数分かかる場合もあります。