クロスリージョン推論

推論とは、機械学習モデルを使用して、ユーザーの入力に基づいて出力を得るプロセスです。たとえば、 SNOWFLAKE.CORTEX.COMPLETE 関数を呼び出すと、プロンプトを入力として、 LLM に推論を要求していることになります。Snowflakeでは、 CORTEX_ENABLED_CROSS_REGION パラメーターを使用して、クロスリージョン推論処理を許可するようにアカウントを設定できます。このパラメーターは、推論リクエストを既定のリージョンとは異なるリージョンで処理することを可能にします。クロスリージョン推論パラメーターは、クロスリージョン推論がサポートするあらゆるSnowflake機能(Cortex LLM 関数を含む)の推論動作を決定するために使用されます。

有効にすると、 LLM または機能が既定のリージョンでサポートされていない場合、クロスリージョン推論が発生します。

デフォルトでは、パラメーターは DISABLED に設定されています。これにより、リクエストは既定のリージョンでのみ処理されます。 ALTER ACCOUNT コマンドを使って、クロスリージョン推論を許可したいリージョンを指定することができます。

このパラメーターの詳細については、 CORTEX_ENABLED_CROSS_REGION をご参照ください。

アクセス制御の要件

このパラメーターはアカウントレベルでのみ設定可能で、ユーザーレベルやセッションレベルでは設定できません。 ALTER ACCOUNT コマンドを使用してパラメーターを設定できるのは、 ACCOUNTADMIN ロールのみです。

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US';
Copy

このパラメーターは ORGADMIN ロールでは設定できません。

クロスリージョン推論パラメーターの使い方

デフォルトでは、このパラメーターは DISABLED に設定されています。つまり、推論リクエストは既定のリージョンでのみ処理されます。以下の例では、様々な使用ケースにおけるクロスリージョンパラメーターの設定方法を示しています。

すべてのリージョン

クロスリージョン推論リクエストをサポートするSnowflakeリージョンのいずれかにリクエストの処理を許可するには、パラメーターを 'ANY_REGION' に設定します。

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'ANY_REGION';
Copy

既定のリージョンのみ

推論リクエストを既定のリージョンでのみ処理するには、このパラメーターを 'DISABLED' に設定します。

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'DISABLED';
Copy

リージョンの指定

指定したリージョンにのみリクエストの処理を許可するには、このパラメーターをカンマで区切ったリージョンに設定します。全リージョンのリストについては CORTEX_ENABLED_CROSS_REGION をご参照ください。

以下の例では、推論リクエストを処理するために、 AWS_USAWS_EU リージョンを指定しています。

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US,AWS_EU';
Copy

コストの考慮事項

  • Snowflakeサービス利用テーブル に記載されているとおり、 LLM の使用に対するクレジットが課金されます。クレジットは要求リージョンで消費されたものとみなされます。例えば、 us-east-2 リージョンから LLM 関数を呼び出し、リクエストが us-west-2 リージョンで処理された場合、クレジットは us-east-2 リージョンで消費されたとみなされます。

  • クロスリージョン推論を使用しても、データ消去料金は発生しません。

考慮事項

  • リージョン間の遅延は、クラウドプロバイダーのインフラとネットワークの状態に依存します。Snowflakeでは、クロスリージョン推論を有効にして特定のユースケースをテストすることを推奨しています。

  • USではクロスリージョン推論はサポートされていません。SnowGov リージョン つまり、 SnowGov リージョンをまたいだ推論リクエストはできません。

  • GCP またはAzureリージョンからこの設定を使用して、それらのリージョンでサポートされていない機能の推論要求を行うことができます。

  • ユーザー入力、サービスが生成したプロンプト、および出力は、クロスリージョン推論中に保存またはキャッシュされません。

  • 推論リクエストに必要なデータは、以下のようにリージョン間をトラバースします。

    • 送信元と宛先の両方のリージョンが AWS にある場合、データは AWS グローバルネットワーク 内に留まります。データセンターと地域を相互接続する AWS グローバルネットワークを流れるデータはすべて、物理層で自動的に暗号化されます。

    • リージョンが異なるクラウドプロバイダー上にある場合、データは相互TLS認証(mTLS)を使用してパブリック・インターネットを横断します。

次のステップ

  • クロスリージョン推論パラメーターの詳細については、 SQL パラメーターリファレンスの CORTEX_ENABLED_CROSS_REGION セクションをご参照ください。