クロスリージョン推論¶
推論とは、機械学習モデルを使用して、ユーザーの入力に基づいて出力を得るプロセスです。たとえば、 SNOWFLAKE.CORTEX.COMPLETE 関数を呼び出すと、プロンプトを入力として、 LLM に推論を要求していることになります。Snowflakeでは、 CORTEX_ENABLED_CROSS_REGION パラメーターを使用して、クロスリージョン推論処理を許可するようにアカウントを設定できます。このパラメーターは、推論リクエストを既定のリージョンとは異なるリージョンで処理することを可能にします。クロスリージョン推論パラメーターは、クロスリージョン推論がサポートするあらゆるSnowflake機能(Cortex LLM 関数を含む)の推論動作を決定するために使用されます。
有効にすると、 LLM または機能が既定のリージョンでサポートされていない場合、クロスリージョン推論が発生します。
デフォルトでは、パラメーターは DISABLED に設定されています。これにより、リクエストは既定のリージョンでのみ処理されます。 ALTER ACCOUNT コマンドを使って、クロスリージョン推論を許可したいリージョンを指定することができます。
このパラメーターの詳細については、 CORTEX_ENABLED_CROSS_REGION をご参照ください。
アクセス制御の要件¶
このパラメーターはアカウントレベルでのみ設定可能で、ユーザーレベルやセッションレベルでは設定できません。 ALTER ACCOUNT コマンドを使用してパラメーターを設定できるのは、 ACCOUNTADMIN ロールのみです。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US';
このパラメーターは ORGADMIN ロールでは設定できません。
クロスリージョン推論パラメーターの使い方¶
デフォルトでは、このパラメーターは DISABLED
に設定されています。つまり、推論リクエストは既定のリージョンでのみ処理されます。以下の例では、様々な使用ケースにおけるクロスリージョンパラメーターの設定方法を示しています。
すべてのリージョン¶
クロスリージョン推論リクエストをサポートするSnowflakeリージョンのいずれかにリクエストの処理を許可するには、パラメーターを 'ANY_REGION'
に設定します。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'ANY_REGION';
既定のリージョンのみ¶
推論リクエストを既定のリージョンでのみ処理するには、このパラメーターを 'DISABLED'
に設定します。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'DISABLED';
リージョンの指定¶
指定したリージョンにのみリクエストの処理を許可するには、このパラメーターをカンマで区切ったリージョンに設定します。全リージョンのリストについては CORTEX_ENABLED_CROSS_REGION をご参照ください。
以下の例では、推論リクエストを処理するために、 AWS_US
と AWS_EU
リージョンを指定しています。
ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US,AWS_EU';
コストの考慮事項¶
Snowflakeサービス利用テーブル に記載されているとおり、 LLM の使用に対するクレジットが課金されます。クレジットは要求リージョンで消費されたものとみなされます。例えば、
us-east-2
リージョンから LLM 関数を呼び出し、リクエストがus-west-2
リージョンで処理された場合、クレジットはus-east-2
リージョンで消費されたとみなされます。クロスリージョン推論を使用しても、データ消去料金は発生しません。
考慮事項¶
リージョン間の遅延は、クラウドプロバイダーのインフラとネットワークの状態に依存します。Snowflakeでは、クロスリージョン推論を有効にして特定のユースケースをテストすることを推奨しています。
USではクロスリージョン推論はサポートされていません。SnowGov リージョン つまり、 SnowGov リージョンをまたいだ推論リクエストはできません。
GCP またはAzureリージョンからこの設定を使用して、それらのリージョンでサポートされていない機能の推論要求を行うことができます。
ユーザー入力、サービスが生成したプロンプト、および出力は、クロスリージョン推論中に保存またはキャッシュされません。
推論リクエストに必要なデータは、以下のようにリージョン間をトラバースします。
送信元と宛先の両方のリージョンが AWS にある場合、データは AWS グローバルネットワーク 内に留まります。データセンターと地域を相互接続する AWS グローバルネットワークを流れるデータはすべて、物理層で自動的に暗号化されます。
リージョンが異なるクラウドプロバイダー上にある場合、データは相互TLS認証(mTLS)を使用してパブリック・インターネットを横断します。
次のステップ¶
クロスリージョン推論パラメーターの詳細については、 SQL パラメーターリファレンスの CORTEX_ENABLED_CROSS_REGION セクションをご参照ください。