クロスリージョン推論¶
推論とは、機械学習モデルを使用して、ユーザーの入力に基づいて出力を得るプロセスです。たとえば、 SNOWFLAKE.CORTEX.COMPLETE 関数を呼び出すと、プロンプトを入力として、 LLM に推論を要求していることになります。Snowflakeでは、 CORTEX_ENABLED_CROSS_REGION パラメーターを使用して、クロスリージョン推論処理を許可するようにアカウントを設定できます。このパラメーターは、推論リクエストを既定のリージョンとは異なるリージョンで処理することを可能にします。クロスリージョン推論パラメーターは、クロスリージョン推論がサポートするあらゆるSnowflake機能(Cortex LLM 関数を含む)の推論動作を決定するために使用されます。
有効にすると、 LLM または機能が既定のリージョンでサポートされていない場合、クロスリージョン推論が発生します。
デフォルトでは、パラメーターは DISABLED に設定されています。これにより、リクエストは既定のリージョンでのみ処理されます。ALTER ACCOUNT コマンドを使って、クロスリージョン推論を許可したいリージョンを指定することができます。
このパラメーターの詳細については、 CORTEX_ENABLED_CROSS_REGION をご参照ください。
アクセス制御の要件¶
このパラメーターはアカウントレベルでのみ設定可能で、ユーザーレベルやセッションレベルでは設定できません。ALTER ACCOUNT コマンドを使用してパラメーターを設定できるのは、 ACCOUNTADMIN ロールのみです。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US';
このパラメーターは ORGADMIN ロールでは設定できません。
クロスリージョン推論パラメーターの使い方¶
デフォルトでは、このパラメーターは DISABLED に設定されています。つまり、推論リクエストは既定のリージョンでのみ処理されます。以下の例では、様々な使用ケースにおけるクロスリージョンパラメーターの設定方法を示しています。
すべてのリージョン¶
クロスリージョン推論リクエストをサポートするSnowflakeリージョンのいずれかにリクエストの処理を許可するには、パラメーターを 'ANY_REGION' に設定します。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'ANY_REGION';
既定のリージョンのみ¶
推論リクエストを既定のリージョンでのみ処理するには、このパラメーターを 'DISABLED' に設定します。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'DISABLED';
リージョンの指定¶
指定したリージョンにのみリクエストの処理を許可するには、このパラメーターをカンマで区切ったリージョンに設定します。全リージョンのリストについては CORTEX_ENABLED_CROSS_REGION をご参照ください。
以下の例では、推論リクエストを処理するために、 AWS_US と AWS_EU リージョンを指定しています。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US,AWS_EU';
US 商業政府リージョン¶
Snowflakeの政府公認かつ、 FIPS 準拠の商用環境向けクロスリージョン推論は、サポートされる AI モデルへのアクセスを提供しながら、データ処理の境界を維持するように設計されています。有効にすると、推論リクエストは同じクラウドとコンプライアンス境界内にとどまり、処理は AWS Bedrock FIPS エンドポイントなど、 FIPS で検証済みのインフラストラクチャ上で行われます。このアプローチにより、米国政府の認可を受けた一部のリージョンのお客様は、コンプライアンスポリシーに例外を設けることなく、安全にSnowflake AI の機能を使用することができます。
この機能を有効にするには、サポートされている政府認可リージョンのワークロードに対して、 CORTEX_ENABLED_CROSS_REGION パラメーターを AWS_US に設定します。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US';
以下のリージョンでは、 US 商業政府のクロスリージョン推論が利用可能です。
US 東部(商業組織、バージニア政府北部)
US 西部(商業組織、オレゴン)
コストの考慮事項¶
Snowflakeサービス利用テーブル に記載されているとおり、 LLM の使用に対するクレジットが課金されます。クレジットは要求リージョンで消費されたものとみなされます。例えば、
us-east-2リージョンから LLM 関数を呼び出し、リクエストがus-west-2リージョンで処理された場合、クレジットはus-east-2リージョンで消費されたとみなされます。クロスリージョン推論を使用しても、データ消去料金は発生しません。
考慮事項¶
リージョン間の遅延は、クラウドプロバイダーのインフラとネットワークの状態に依存します。Snowflakeでは、クロスリージョン推論を有効にして特定のユースケースをテストすることを推奨しています。
USではクロスリージョン推論はサポートされていません。SnowGov リージョン つまり、 SnowGov リージョンをまたいだ推論リクエストはできません。
GCP またはAzureリージョンからこの設定を使用して、それらのリージョンでサポートされていない機能の推論要求を行うことができます。
ユーザー入力、サービスが生成したプロンプト、および出力は、クロスリージョン推論中に保存またはキャッシュされません。
推論リクエストに必要なデータは、以下のようにリージョン間をトラバースします。
送信元と宛先の両方のリージョンが AWS にある場合、データは AWS グローバルネットワーク 内に留まります。データセンターと地域を相互接続する AWS グローバルネットワークを流れるデータはすべて、物理層で自動的に暗号化されます。
If both the source and destination regions are in Azure, the traffic stays entirely within the Azure global network. It never enters the public internet.
リージョンが異なるクラウドプロバイダー上にある場合、データは相互TLS認証(mTLS)を使用してパブリック・インターネットを横断します。
Cortex Search のクロスリージョン推論は、 すべてのリージョン でサポートされているわけではありません。
次のステップ¶
クロスリージョン推論パラメーターの詳細については、 SQL パラメーターリファレンスの CORTEX_ENABLED_CROSS_REGION セクションをご参照ください。