カテゴリ:

:doc:`/sql-reference/functions-string`(AI 関数)

AI_EMBED

注釈

AI_EMBED は EMBED_TEXT_1024 (SNOWFLAKE.CORTEX) and EMBED_TEXT_768 (SNOWFLAKE.CORTEX) の更新されたバージョンです。最新の関数については、 AI_EMBED を使用してください。

テキストまたは画像から埋め込みベクトルを作成します。埋め込みは、テキストや画像の特徴量の抽象的な数値表現であり、テキストや画像間の類似性を決定するために使用できます。これは、セマンティック検索、クラスタリング、分類、その他のタスクに使用できます。

リージョンの可用性

次の表は、テキストと画像用の AI_EMBED 関数を使用できるリージョンを示しています。

データ型
AWS US西部2
(オレゴン)
AWS US東部1
(N.バージニア)
AWSヨーロッパ中部1
(フランクフルト)
AWS ヨーロッパ西部1
(アイルランド)
AWS AP 南東部2
(シドニー)
AWS AP 北東部1
(東京)
Azure東部 US 2
(バージニア)
Azure西ヨーロッパ
(オランダ)
AWS
(リージョン横断)
テキスト

画像

構文

AI_EMBED( <model> , <input> )
Copy

引数

必須:

model

埋め込みを生成するために使用するベクトル埋め込みモデルを指定する文字列。

テキストの場合は、以下の値を指定できます。

  • snowflake-arctic-embed-l-v2.0

  • snowflake-arctic-embed-l-v2.0-8k

  • nv-embed-qa-4

  • multilingual-e5-large

  • voyage-multilingual-2

  • snowflake-arctic-embed-m-v1.5

  • snowflake-arctic-embed-m

  • e5-base-v2

画像の場合は、以下の値のみを指定できます。

  • voyage-multimodal-3

サポートされるモデルでは、 コスト が異なる可能性があります。

input

画像から埋め込みを生成するための文字列または画像(FILE オブジェクト として)は、次の条件を満たす必要があります。

  • JPEG、WEBP、PNG または BMP の形式

  • 10 MB 以下のサイズ

  • 8,000 × 8,000ピクセル以下

戻り値

入力テキストまたは画像から派生した VECTOR 型の埋め込みベクトル。

アクセス制御の要件

ユーザーは、 SNOWFLAKE.CORTEX_USER データベースロール を持つロールを使用する必要があります。この権限の詳細については、 必要な権限 をご参照ください。

テキスト例

この例では、 snowflake-arctic-embed-l-v2.0 モデルを使って、フレーズ hello world に対してベクトル埋め込みが生成されます。

SELECT AI_EMBED('snowflake-arctic-embed-l-v2.0', 'hello world');
Copy

画像の例

この例では、voyage-multimodal-3 モデルを使用して、ステージングされた画像に対してベクトル埋め込みが生成されています。

SELECT AI_EMBED('voyage-multimodal-3',
        TO_FILE ('@my_images', 'CITY_WALKING1.PNG'));
Copy

制限事項

  • Snowflake AI 関数は、動的テーブルのインクリメンタルリフレッシュをサポートしていません。

  • Snowflake AI 関数は、以下の種類のステージングのファイルから作成された FILE オブジェクトでは動作しません。

    • 暗号化モード TYPE = 'SNOWFLAKE_FULL' 付き内部ステージ

    • AWS_CSE または AZURE_CSE などの、お客様側の暗号化モードを使用した外部ステージ。

    • ユーザーステージ

    • テーブルステージ

    • 名前が二重引用符で囲まれているステージ