DOCUMENTATION
/
はじめるにあたり
ガイド
開発者
参照情報
リリース
チュートリアル
Snowflake Open Catalog
ステータス
  1. 概要
    • Snowflake Horizon カタログ
      • Snowflakeに接続するためのアプリケーションおよびツール
      • 仮想ウェアハウス
      • データベース、テーブル、およびビュー
      • データ型
        • データ統合
          1. Snowflake Openflow
            1. Openflowについて
              • Openflowのコストについて
                • Openflowをセットアップする
                  • Openflowコネクタを使用したデータソースの接続
                    1. Openflowコネクタについて
                      • Amazon Ads向けOpenflowコネクタ
                        1. コネクタについて
                          • コネクタを設定する
                          • Box向けOpenflowコネクタ
                            1. コネクタについて
                              • コネクタを設定する
                              • Excel向けOpenflowコネクタ
                                1. コネクタについて
                                  • コネクタを設定する
                                  • Openflow Connector for Google Ads
                                    1. コネクタについて
                                      • コネクタを設定する
                                      • Googleドライブ用Openflowコネクタ
                                        1. コネクタについて
                                          • コネクタを設定する
                                          • Googleシート向けOpenflowコネクタ
                                            1. コネクタについて
                                              • コネクタを設定する
                                              • Openflow Connector for HubSpot
                                                1. コネクタについて
                                                  • コネクタを設定する
                                                  • Jira Cloud向けOpenflowコネクタ
                                                    1. コネクタについて
                                                      • コネクタを設定する
                                                      • Openflow Connector for Kafka
                                                        1. コネクタについて
                                                          • コネクタ(Core)をセットアップする
                                                          • パフォーマンスチューニング
                                                          • Kinesis向けOpenflowコネクタ
                                                            1. コネクタについて
                                                              • コネクタを設定する
                                                              • LinkedIn Ads向けOpenflowコネクタ
                                                                1. コネクタについて
                                                                  • コネクタを設定する
                                                                  • Meta Ads向けOpenflowコネクタ
                                                                    1. コネクタについて
                                                                      • コネクタを設定する
                                                                      • Openflow Connector for Microsoft Dataverse
                                                                        1. コネクタについて
                                                                          • コネクタを設定する
                                                                          • Openflow Connector for MySQL
                                                                            1. コネクタについて
                                                                              • コネクタを設定する
                                                                              • Openflow Connector for PostgreSQL
                                                                                1. コネクタについて
                                                                                  • コネクタを設定する
                                                                                  • Openflow Connector for SharePoint
                                                                                    1. コネクタについて
                                                                                      • コネクタを設定する
                                                                                      • Openflow Connector for Slack
                                                                                        1. コネクタについて
                                                                                          • コネクタを設定する
                                                                                          • SnowflakeとKafkaの連携用Openflakeコネクタ
                                                                                            1. コネクタについて
                                                                                              • コネクタを設定する
                                                                                              • SQL Server向けOpenflowコネクタ
                                                                                                1. コネクタについて
                                                                                                  • コネクタを設定する
                                                                                                  • Openflow Connector for Workday
                                                                                                    1. コネクタについて
                                                                                                      • コネクタを設定する
                                                                                                    2. Openflowを管理する
                                                                                                      • オープンフローの監視
                                                                                                        • Openflowのトラブルシューティング
                                                                                                          • プロセッサー
                                                                                                            • コントローラー
                                                                                                          • データのロード
                                                                                                          • 動的テーブル
                                                                                                          • ストリームおよびタスク
                                                                                                          • データのアンロード
                                                                                                          • 移行ツール
                                                                                                          • クエリ
                                                                                                          • リスト
                                                                                                          • コラボレーション
                                                                                                          • Snowflake AI & ML
                                                                                                              1. クロスリージョン推論
                                                                                                                • Cortex AISQL
                                                                                                                • Cortex Agents
                                                                                                                • Cortex Analyst
                                                                                                                • Cortex Search
                                                                                                                    1. Cortex Search Serviceにクエリする
                                                                                                                      • コストについて
                                                                                                                        • チュートリアル
                                                                                                                    2. Cortexナレッジ拡張
                                                                                                                    3. AI 可観測性
                                                                                                                    4. ML 関数
                                                                                                                    5. ドキュメント AI
                                                                                                                    6. プロビジョンドスループット
                                                                                                                      • ML 開発および ML 管理
                                                                                                                    7. アラートおよび通知
                                                                                                                    8. セキュリティ
                                                                                                                    9. データガバナンス
                                                                                                                    10. プライバシー
                                                                                                                    11. 組織およびアカウント
                                                                                                                    12. ビジネス継続性およびデータ復旧
                                                                                                                    13. パフォーマンスの最適化
                                                                                                                    14. コストと請求
                                                                                                                    ガイドSnowflake AI & MLCortex Search

                                                                                                                    Cortex Search¶

                                                                                                                    この機能のサポートは、ほとんどのSnowflakeリージョンのアカウントで利用可能です。全リージョンのリストについては、 リージョンの可用性 のセクションをご参照ください。

                                                                                                                    概要¶

                                                                                                                    Cortex Searchは、Snowflakeデータに対して低遅延で高品質な「ファジー」検索を可能にします。Cortex Searchは、 検索拡張世代(RAG) 大規模言語モデル(LLMs)を活用したアプリケーションなど、Snowflakeユーザーのための幅広い検索体験を提供します。

                                                                                                                    Cortex Searchは、埋め込み、インフラストラクチャのメンテナンス、検索品質パラメーターのチューニング、継続的なインデックスの更新を心配することなく、数分でテキストデータのハイブリッド(ベクトルとキーワード)検索エンジンを立ち上げ、実行することができます。つまり、インフラや検索品質のチューニングに費やす時間を減らし、データを活用した高品質なチャットや検索体験の開発に多くの時間を費やすことができます。 Cortex Searchチュートリアル で、Cortex Searchを使用して AI チャットおよび検索アプリケーションをパワーアップするためのステップバイステップの手順をご覧ください。

                                                                                                                    Cortex Searchの使用時期¶

                                                                                                                    Cortex Searchの2つの主なユースケースは、検索拡張世代(RAG)とエンタープライズ検索です。

                                                                                                                    • LLM チャットボット用 RAG エンジン: Cortex Searchは、セマンティック検索を活用することで、カスタマイズされた文脈に応じた応答を実現し、テキストデータを使用したチャットアプリケーションの RAG エンジンとして使用できます。

                                                                                                                    • エンタープライズ検索: Cortex Searchを、アプリケーションに埋め込まれた高品質の検索バーのバックエンドとして使用します。

                                                                                                                    RAG 向けのCortex Search¶

                                                                                                                    検索拡張生成(RAG)は、大規模言語モデルの生成応答を拡張するために、知識ベースからデータを検索する技術です。次のアーキテクチャ図は、Cortex Searchと Cortex LLM 関数 を組み合わせて、Snowflakeデータをナレッジベースとして使用する RAG エンタープライズチャットボットを作成する方法を示しています。

                                                                                                                    Snowflakeで RAG、Cortex Searchを使用する

                                                                                                                    Cortex Searchは、L大規模言語モデルに必要なコンテキストを提供し、最新の独自データに基づいた回答を返す検索エンジンです。

                                                                                                                    例¶

                                                                                                                    この例では、Cortex Search Serviceを作成し、 REST API を使ってクエリする手順を説明します。サービスのクエリの詳細については、 「Cortex Search Serviceのクエリ」 をご参照ください。

                                                                                                                    この例では、カスタマーサポートのトランスクリプトデータセットのサンプルを使用します。

                                                                                                                    以下のコマンドを実行して、サンプルのデータベースとスキーマを設定します。

                                                                                                                    CREATE DATABASE IF NOT EXISTS cortex_search_db;
                                                                                                                    
                                                                                                                    CREATE OR REPLACE WAREHOUSE cortex_search_wh WITH
                                                                                                                       WAREHOUSE_SIZE='X-SMALL';
                                                                                                                    
                                                                                                                    CREATE OR REPLACE SCHEMA cortex_search_db.services;
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    以下の SQL コマンドを実行してデータセットを作成します。

                                                                                                                    CREATE OR REPLACE TABLE support_transcripts (
                                                                                                                        transcript_text VARCHAR,
                                                                                                                        region VARCHAR,
                                                                                                                        agent_id VARCHAR
                                                                                                                    );
                                                                                                                    
                                                                                                                    INSERT INTO support_transcripts VALUES
                                                                                                                        ('My internet has been down since yesterday, can you help?', 'North America', 'AG1001'),
                                                                                                                        ('I was overcharged for my last bill, need an explanation.', 'Europe', 'AG1002'),
                                                                                                                        ('How do I reset my password? The email link is not working.', 'Asia', 'AG1003'),
                                                                                                                        ('I received a faulty router, can I get it replaced?', 'North America', 'AG1004');
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    変更追跡は、Cortex Search Serviceを構築するために必要です。このテーブルの所有権を持たないロールを使用して検索サービスを作成する場合は、以下のステートメントを実行してテーブルの変更追跡を有効にしてください。

                                                                                                                    ALTER TABLE support_transcripts SET
                                                                                                                      CHANGE_TRACKING = TRUE;
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    変更追跡の有効化の詳細については、 変更の追跡を有効にする をご参照ください。

                                                                                                                    サービスの作成¶

                                                                                                                    Cortex Search Serviceは、単一の SQL クエリ、またはSnowflake AI & ML Studioから作成できます。Cortex Search Serviceを作成すると、Snowflakeはソースデータに対して変換を実行し、低レイテンシでサービングできるようにします。以下のセクションでは、 SQL と、 Snowsight のSnowflake AI & ML Studioの両方を使用してサービスを作成する方法を示します。

                                                                                                                    注釈

                                                                                                                    検索サービスを作成すると、作成プロセスの一部として検索インデックスが構築されます。これは、 CREATE CORTEX SEARCH SERVICE ステートメントが大きなデータセットの場合、完了までに時間がかかる可能性があることを意味します。

                                                                                                                    SQL を使用する¶

                                                                                                                    次の例は、前のセクションで作成したサンプルカスタマーサポートのトランスクリプトデータセットに CREATE CORTEX SEARCH SERVICE、Cortex Search Serviceを作成する方法を示しています。

                                                                                                                    CREATE OR REPLACE CORTEX SEARCH SERVICE transcript_search_service
                                                                                                                      ON transcript_text
                                                                                                                      ATTRIBUTES region
                                                                                                                      WAREHOUSE = cortex_search_wh
                                                                                                                      TARGET_LAG = '1 day'
                                                                                                                      EMBEDDING_MODEL = 'snowflake-arctic-embed-l-v2.0'
                                                                                                                      AS (
                                                                                                                        SELECT
                                                                                                                            transcript_text,
                                                                                                                            region,
                                                                                                                            agent_id
                                                                                                                        FROM support_transcripts
                                                                                                                    );
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    このコマンドは、データの検索サービスを構築するトリガーとなります。この例では:

                                                                                                                    • 同サービスへの問い合わせは、 transcript_text 列で一致するものを検索します。

                                                                                                                    • TARGET_LAG パラメーターは、Cortex Search Serviceがベーステーブル support_transcripts の更新を1日に1回程度チェックすることを指示します。

                                                                                                                    • 列 region と agent_id は、 transcript_text 列に対するクエリの結果とともに返されるようにインデックスが付けられます。

                                                                                                                    • 列 region は、 transcript_text 列をクエリする際にフィルター列として利用できるようになります。

                                                                                                                    • ウェアハウス cortex_search_wh は、指定されたクエリの結果を最初にマテリアライズするために使用され、ベーステーブルが変更されるたびに使用されます。

                                                                                                                    注釈

                                                                                                                    • クエリで指定されたウェアハウスのサイズとテーブルの行数によっては、この CREATE コマンドの完了に数時間かかる場合があります。

                                                                                                                    • Snowflakeでは、 MEDIUM 以下のサイズの専用ウェアハウスを各サービスに使用することを推奨しています。

                                                                                                                    • ATTRIBUTES フィールドの列は、明示的な列挙またはワイルドカード( * )によって、ソースクエリに含まれている必要があります。

                                                                                                                    Snowsight を使用する¶

                                                                                                                    Snowsight でCortex Search Serviceを作成するには、以下の手順に従います。

                                                                                                                    1. Snowsight にサインインします。

                                                                                                                    2. SNOWFLAKE.CORTEX_USER データベースロールが付与されているロールを選択します。

                                                                                                                    3. ナビゲーションメニューで AI & ML » Studio を選択します。

                                                                                                                    4. Create a Cortex Search Service ボックスから + Create を選択します。

                                                                                                                    5. ロールとウェアハウスを選択します。このロールには、 SNOWFLAKE.CORTEX_USER データベースロールが付与されていなければならなりません。ウェアハウスは、サービスが作成され更新されるときに、ソースクエリの結果を実体化するために使用されます。

                                                                                                                    6. サービスを定義するデータベースとスキーマを選択します。

                                                                                                                    7. サービス名を入力し、 Let's go を選択します。

                                                                                                                    8. 検索用にインデックスを作成するテキストデータを含むテーブルまたはビューを選択し、 Next を選択します。この例では、 support_transcripts テーブルを選択します。

                                                                                                                      注釈

                                                                                                                      サービス定義時に複数のデータソースを指定したり、変換を実行したりしたい場合は、 SQL を使用してください。

                                                                                                                    9. 検索結果に含めたい列、 transcript_text、 region、 agent_id を選択し、 Next を選択します。

                                                                                                                    10. 検索する列、 transcript_text を選択し、 Next を選択します。

                                                                                                                    11. 特定の列に基づいて検索結果をフィルタリングしたい場合は、それらの列を選択し、 Next を選択します。フィルターが不要な場合は、 Skip this option を選択してください。この例では、このステップは省略できます。

                                                                                                                    12. ターゲットラグ(サービスコンテンツがベースデータの更新から遅れる時間)を設定し、 Create search service を選択します。

                                                                                                                    最後のステップでは、サービスが作成されたことを確認し、サービス名とそのデータソースを表示します。

                                                                                                                    注釈

                                                                                                                    Snowsight からサービスを作成する場合、サービス名は二重引用符で囲まれます。SQL でサービスを参照する際の意味については、 二重引用符で囲まれた識別子 をご参照ください。

                                                                                                                    使用許可の付与¶

                                                                                                                    サービスとインデックスを作成した後、customer_supportのような他のロールにサービス、そのデータベース、スキーマの使用を許可することができます。

                                                                                                                    GRANT USAGE ON DATABASE cortex_search_db TO ROLE customer_support;
                                                                                                                    GRANT USAGE ON SCHEMA services TO ROLE customer_support;
                                                                                                                    
                                                                                                                    GRANT USAGE ON CORTEX SEARCH SERVICE transcript_search_service TO ROLE customer_support;
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    サービスのプレビュー¶

                                                                                                                    サービスにデータが正しく入力されていることを確認するには、 SQL 環境から SEARCH_PREVIEW 関数 を使用してサービスをプレビューできます。

                                                                                                                    SELECT PARSE_JSON(
                                                                                                                      SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
                                                                                                                          'cortex_search_db.services.transcript_search_service',
                                                                                                                          '{
                                                                                                                            "query": "internet issues",
                                                                                                                            "columns":[
                                                                                                                                "transcript_text",
                                                                                                                                "region"
                                                                                                                            ],
                                                                                                                            "filter": {"@eq": {"region": "North America"} },
                                                                                                                            "limit":1
                                                                                                                          }'
                                                                                                                      )
                                                                                                                    )['results'] as results;
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    成功したクエリ応答のサンプル:

                                                                                                                    [
                                                                                                                      {
                                                                                                                      "transcript_text" : "My internet has been down since yesterday, can you help?",
                                                                                                                      "region" : "North America"
                                                                                                                      }
                                                                                                                    ]
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    この応答は、サービスにデータが入力され、指定されたクエリに対して妥当な結果が提供されていることを確認します。

                                                                                                                    CORTEX_SEARCH_DATA_SCAN テーブル関数を使用して、サービスのコンテンツを検査することもできます。

                                                                                                                    SELECT
                                                                                                                      *
                                                                                                                    FROM
                                                                                                                      TABLE (
                                                                                                                        CORTEX_SEARCH_DATA_SCAN (
                                                                                                                          SERVICE_NAME => 'transcript_search_service'
                                                                                                                        )
                                                                                                                      );
                                                                                                                    
                                                                                                                    Copy
                                                                                                                    + ---------------------------------------------------------- + --------------- + -------- + ------------------------------ +
                                                                                                                    |                      transcript_text                       |     region      | agent_id | _GENERATED_EMBEDDINGS_MY_MODEL |
                                                                                                                    | ---------------------------------------------------------- | --------------- | -------- | ------------------------------ |
                                                                                                                    | 'My internet has been down since yesterday, can you help?' | 'North America' | 'AG1001' | [0.1, 0.2, 0.3, 0.4]           |
                                                                                                                    | 'I was overcharged for my last bill, need an explanation.' | 'Europe'        | 'AG1002' | [0.1, 0.2, 0.3, 0.4]           |
                                                                                                                    + ---------------------------------------------------------- + --------------- + -------- + ------------------------------ +
                                                                                                                    

                                                                                                                    アプリケーションからサービスをクエリする¶

                                                                                                                    検索サービスを作成し、自分のロールに使用許可を付与し、プレビューしたら、 Python API を使ってアプリケーションからクエリすることができます。

                                                                                                                    次のコードは、 internet issues に関するクエリに最も関連するサポートチケットを取得するためにPython API を使用し、 North America リージョン内の結果を返すようにフィルタリングしています。

                                                                                                                    from snowflake.core import Root
                                                                                                                    from snowflake.snowpark import Session
                                                                                                                    
                                                                                                                    CONNECTION_PARAMETERS = {"..."}
                                                                                                                    
                                                                                                                    session = Session.builder.configs(CONNECTION_PARAMETERS).create()
                                                                                                                    root = Root(session)
                                                                                                                    
                                                                                                                    transcript_search_service = (root
                                                                                                                      .databases["cortex_search_db"]
                                                                                                                      .schemas["services"]
                                                                                                                      .cortex_search_services["transcript_search_service"]
                                                                                                                    )
                                                                                                                    
                                                                                                                    resp = transcript_search_service.search(
                                                                                                                      query="internet issues",
                                                                                                                      columns=["transcript_text", "region"],
                                                                                                                      filter={"@eq": {"region": "North America"} },
                                                                                                                      limit=1
                                                                                                                    )
                                                                                                                    print(resp.to_json())
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    成功したクエリ応答のサンプル:

                                                                                                                    {
                                                                                                                      "results": [
                                                                                                                        {
                                                                                                                          "transcript_text": "My internet has been down since yesterday, can you help?",
                                                                                                                          "region": "North America"
                                                                                                                        }
                                                                                                                      ],
                                                                                                                      "request_id": "5d8eaa5a-800c-493c-a561-134c712945ba"
                                                                                                                    }
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    Cortex Search Serviceは、クエリの columns フィールドで指定されたすべての列を返します。

                                                                                                                    必要な権限¶

                                                                                                                    • Cortex Search Serviceを作成するには、ロールがCortex LLM 関数に必要な CORTEX_USER データベースロールを持っている必要があります。このロールの付与と取り消しについては、 Cortex LLM 権限が必須の関数 をご参照ください。

                                                                                                                    • Cortex Search Serviceにクエリを実行するには、クエリを実行するユーザーのロールが、サービス自体、およびサービスが存在するデータベースとスキーマに対して、 USAGE 権限を持っている必要があります。 Cortex Searchアクセス制御の要件 をご参照ください。

                                                                                                                    • ALTER コマンドを使用してCortex Search Serviceを一時停止または再開するには、クエリするユーザーのロールがサービス上で OPERATE 権限を持っている必要があります。 ALTER CORTEX SEARCH SERVICE をご参照ください。

                                                                                                                    重要

                                                                                                                    Cortex Search Serviceは、 所有者権限 で検索を実行し、所有者権限で実行される他のSnowflakeオブジェクトと同じセキュリティモデルに従います。詳細情報については、 Cortex Search アクセス制御要件 を参照してください。

                                                                                                                    Cortex Searchの品質を理解する¶

                                                                                                                    Cortex Searchは、検索とランキングモデルのアンサンブルを活用し、ほとんどチューニングの必要なく、高レベルの検索品質を提供します。Cortex Searchは、文書の検索とランキングに「ハイブリッド」なアプローチをとっています。各検索クエリは、以下のものを利用します。

                                                                                                                    • 意味的に類似した文書を検索するための ベクトル検索

                                                                                                                    • 語彙的に類似した文書を検索するための キーワード検索

                                                                                                                    • 結果セットの中で最も関連性の高い文書を再ランク付けするための セマンティック再ランク付け

                                                                                                                    このハイブリッド検索アプローチは、セマンティックリランキングステップと相まって、幅広いデータセットとクエリにおいて高い検索品質を達成しています。

                                                                                                                    Cortex Search埋め込みモデル¶

                                                                                                                    Cortex Searchでは、検索のベクトル検索ステージで利用する埋め込みモデルをユーザーが選択できます。Cortex Searchでは、以下の埋め込みモデルが可用性です。

                                                                                                                    重要

                                                                                                                    モデルによって価格が異なります。Canonicalモデルの価格は、 Snowflake Service Consumption Table で利用可能です。以下に記載された価格が、Snowflakeサービス消費表に記載されたモデルの価格と異なる場合は、Snowflake Service Consumption Tableが適用されるものとします。

                                                                                                                    モデル名

                                                                                                                    出力次元

                                                                                                                    言語サポート

                                                                                                                    100万トークンあたりのクレジットコスト

                                                                                                                    説明

                                                                                                                    snowflake-arctic-embed-m-v1.5 (デフォルト)

                                                                                                                    768

                                                                                                                    英語のみ

                                                                                                                    0.03

                                                                                                                    Snowflakeの最も実用的な、英語のみのエンベッディングモデルです。このオープンソースの110Mパラメータ・モデルは、Cortex Searchの可用性モデルの中で最速のインデックス作成時間を実現します。詳細情報については、 Arctic Embed 1.5 ブログ記事 および Arctic Embed 1.5 モデルカード を参照してください。

                                                                                                                    snowflake-arctic-embed-l-v2.0

                                                                                                                    1024

                                                                                                                    多言語

                                                                                                                    0.05

                                                                                                                    Snowflakeの価格性能に優れた多言語埋め込みモデル。このオープンソースの568Mパラメータモデルは、英語と非英語の両方のデータセットで高い品質をもたらします。詳細情報については、 Arctic Embed 2 ブログ記事 および Arctic Embed 2 モデルカード を参照してください。

                                                                                                                    voyage-multilingual-2

                                                                                                                    1024

                                                                                                                    多言語

                                                                                                                    0.07

                                                                                                                    Voyageの多言語埋め込みモデル。このモデルは、英語データセットと非英語データセットの両方で高い品質をもたらします。詳細情報については、 Voyage Multilingual 2 のブログ記事をご覧ください。

                                                                                                                    一部の埋め込みモデルは、Cortex Searchの特定のクラウドリージョンでのみ利用可能です。リージョン/モデル別の可用性リストについては、 Cortex Searchリージョン別可用性 をご参照ください。

                                                                                                                    モデルごとにパフォーマンス、コスト、品質の特徴が異なります。モデルの仕様を注意深く確認し、特定のワークロードに最適なモデルを決定してください。各モデルのコスト(100万トークンあたりのクレジット)を最も正確に表示するには、 Snowflake Service Consumption Table を参照してください。

                                                                                                                    トークン制限とテキスト分割¶

                                                                                                                    Cortex Searchで最適な検索結果を得るために、Snowflakeは検索列のテキストを512トークン(約385英単語)以下のチャンクに分割することを推奨します。検索列のエントリーが512以上のトークンを含む場合、Cortex Searchはテキスト全体に対してキーワードベースの検索を実行しますが、セマンティック(つまりベクトルベース)検索には最初の512トークンのみを使用します。

                                                                                                                    トークンは文字の並びで、大容量言語モデルで処理できるテキストの最小単位です。近似値として、1トークンは英単語の約3/4、つまり約4文字に相当します。文字列の正確なトークン数を計算するには、 COUNT_TOKENS Cortex関数 を使用できます。例えば、 snowflake-arctic-embed-m-v1.5 モデルで埋め込む文字列のトークンを計算するとします。

                                                                                                                    SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS('snowflake-arctic-embed-m', '<input_text>') as token_count
                                                                                                                    
                                                                                                                    Copy

                                                                                                                    セマンティック検索トークンの制限を理解する¶

                                                                                                                    512トークン以下のチャンクの推奨は、 チャンクサイズが小さいほど、一般的に検索やダウンストリーム LLM の応答性能が高くなる という研究結果によるものです。現在、 arctic-embed-m-long のような、より長いコンテキストの埋め込みモデルもありますが、Cortex Searchは、より高い検索品質をすぐに提供するために、より小さなコンテキストウィンドウを持つ埋め込みモデルを選択します。

                                                                                                                    このコンセプトの背後にある直感は、より小さなチャンクを使えば、与えられたクエリに対してより正確な検索ができるということです。これは、チャンクとクエリの埋め込みベクトルを生成する際に、「平均化」するトークンが少なくなるためです。さらに、チャンクが小さいと、モデルへのプロンプトで提供される潜在的にノイズとなるテキストが少なくなるため、下流の LLM、必要な情報だけを提供することができます。

                                                                                                                    公開されているQ&Aスタイルのベンチマークデータセットでは、一般的に小さなチャンクの方が良い結果を示すという研究結果を、 こちら でご覧いただけます。

                                                                                                                    リフレッシュ¶

                                                                                                                    Cortex Search Serviceで提供されるコンテンツは、特定のクエリの結果に基づいています。Cortex Search Serviceの基礎となるデータが変更されると、サービスはその変更を反映して更新されます。これらの更新は リフレッシュ と呼ばれます。このプロセスは自動化されており、テーブルの基礎となるクエリを分析します。

                                                                                                                    Cortex Search Serviceは動的テーブルと同じ更新プロパティを持っています。Cortex Search Serviceのリフレッシュの特徴については、 動的なテーブルの初期化とリフレッシュの理解 のトピックをご参照ください。

                                                                                                                    Cortex Search Serviceのソースクエリは、動的テーブルの増分リフレッシュの候補でなければなりません。これらの要件の詳細については、 増分リフレッシュのサポート をご参照ください。この制限は、ベクトル埋め込み計算に伴う不要なコストの暴走を防ぐためのものです。動的テーブルの増分リフレッシュでサポートされないコンストラクトの詳細については、 動的テーブルでサポートされるクエリ をご参照ください。

                                                                                                                    インデックス作成とサービングの停止¶

                                                                                                                    動的テーブルと同様に、Cortex Search Serviceは、ソースクエリに関連するリフレッシュが5回連続して失敗した場合、インデックス作成状態を自動的に中断します。お客様のサービスでこのエラーが発生した場合、 DESCRIBE CORTEX SEARCH SERVICE または CORTEX_SEARCH_SERVICES ビュー のいずれかを使用して、特定の SQL エラーを表示できます。両者の出力には以下の列が含まれます。

                                                                                                                    • INDEXING_STATE 列の値は SUSPENDED となります。

                                                                                                                    • INDEXING_ERROR 列には、ソースクエリで発生した特定の SQL エラーが格納されます。

                                                                                                                    ルート問題が解決すれば、 ALTER CORTEX SEARCH SERVICE <名前> RESUME INDEXING でサービスを再開できます。詳細な構文については、 ALTER CORTEX SEARCH SERVICE をご参照ください。

                                                                                                                    コストの考慮事項¶

                                                                                                                    Cortex Search Serviceでは、以下のようなコストが発生します。

                                                                                                                    カテゴリ

                                                                                                                    説明

                                                                                                                    バーチャルウェアハウスコンピューティング

                                                                                                                    Cortex Search Serviceは、サービスをリフレッシュするために 仮想ウェアハウス を必要とします。これは、テキスト埋め込みジョブのオーケストレーションや検索インデックスの構築など、初期化およびリフレッシュ時にベースオブジェクトに対してクエリを実行するためです。これらのオペレーションはコンピューティングリソースを使用しますが、これが クレジット を消費します。リフレッシュ中に変更が識別されなかった場合、リフレッシュする新しいデータがないため、仮想ウェアハウスクレジットは消費されません。

                                                                                                                    EMBED_TEXT トークン計算

                                                                                                                    Cortex Search Serviceは、 ON パラメーターで指定された検索列の各テキスト行を自動的にベクトル空間に埋め込み、セマンティック検索を可能にします。これは、埋め込まれたトークンごとにクレジットコストが発生します。これは、 EMBED_TEXT_768 、または EMBED_TEXT_1024 、各ドキュメントをその意味を符号化する一連の数字として変換するために呼び出すことを含みます。埋め込みは、行が挿入または更新されるたびに計算されます。埋め込みはソースクエリの評価の中で段階的に処理されるため、埋め込みコストは追加または変更された文書に対してのみ発生します。ベクター埋め込みコストに関する詳細については、 ベクトル埋め込み をご参照ください。

                                                                                                                    使用中コンピュート

                                                                                                                    Cortex Search Serviceは、ユーザーが提供する仮想ウェアハウスとは別に、マルチテナントのサービングコンピュータを使用し、低レイテンシーで高スループットのサービスを確立します。このコンポーネントの計算コストは、 GB/月 (GB/月) の非圧縮インデックスデータあたりで発生します。インデックスデータとは、Cortex Searchソースクエリ内のユーザー提供データと、ユーザーに代わって計算されたベクトル埋め込みです。クエリに応答するためにサービスが利用可能である間、一定の期間にクエリが提供されなかった場合でも、これらのコストが発生します。インデックスされたデータ GB/月あたりのCortex Search Servingクレジットレートについては、 Snowflake Service Consumption Table をご参照ください。

                                                                                                                    ストレージ

                                                                                                                    Cortex Search Serviceは、ソースクエリをお客様のアカウントに保存されているテーブルに実体化します。このテーブルは、低レイテンシ配信に最適化されたデータ構造に変換され、お客様のアカウントにも保存されます。テーブルと中間データ構造のストレージは、1テラバイトあたりの定額制(TB)基づいています。

                                                                                                                    クラウドサービス コンピュート

                                                                                                                    Cortex Search Servicesは、 Cloud Servicesのコンピュート を使用して、基になるオブジェクトの変更と、仮想ウェアハウスを呼び出す必要があるかどうかを識別します。クラウドサービスのコンピューティングコストには、日次クラウドサービスコストがアカウントの日次ウェアハウスコストの10%より大きい場合にのみ、Snowflakeによって請求されるという制約が適用されます。

                                                                                                                    Cortex Search Serviceのコスト管理のベストプラクティスについては、 Cortex Search Serviceのコストについて を参照してください。

                                                                                                                    アカウントの各Cortex Search Serviceの AI サービス 関連の消費コストを日次で集計して表示するには、 CORTEX_SEARCH_DAILY_USAGE_HISTORY ビュー をご覧ください。

                                                                                                                    既知の制限¶

                                                                                                                    Cortex Searchの使用には以下の制限があります。

                                                                                                                    • ベース・テーブル・サイズ: 検索サービスのマテリアライズド・クエリの結果は、最適なパフォーマンスを維持するために、100M行未満のサイズである必要があります。クエリのマテリアライズド結果が 100M 行を超える場合、作成クエリはエラーで失敗します。

                                                                                                                      注釈

                                                                                                                      連絡先Cortex Search Serviceの行スケーリング制限を100M以上に増やすには、Snowflakeアカウントチームまでご連絡ください。

                                                                                                                    • クエリ構造: Cortex Search Serviceのソースクエリは、動的テーブルと同じクエリ制限に従わなければなりません。詳細については 動的テーブルの制限 をご覧ください。

                                                                                                                    • 複製とクローニング: Cortex Search Serviceは、 複製 または クローニング をサポートしていません。これらの機能は将来のリリースでサポートされる予定です。

                                                                                                                    重要

                                                                                                                    作成したCortex Searchごとに、2つの動的テーブルエンティティが 動的テーブル用Snowsightモニタリング UI に表示されます。この2つのエンティティは、 _CORTEX_SEARCH_SOURCE_* と _CORTEX_SEARCH_REFRESH_* という形式です。これらのエンティティは動的テーブル情報スキーマビューにも表示されますが、動的テーブル SHOW/DESC コマンドには表示されません。Snowsight UI でこれらのエンティティを選択すると、 Dynamic Table not found メッセージが表示されます。これは想定内の動作です。Cortex Search関連のエンティティは、今後のリリースでSnowsight 動的テーブルのモニタリング UI から削除されます。

                                                                                                                    リージョンの可用性¶

                                                                                                                    この機能のサポートは、以下のSnowflakeリージョンのアカウントで利用可能です。リージョン内の特定の埋め込みモデルの可用性は、チェックマークで示されます。

                                                                                                                    クラウドプロバイダー
                                                                                                                    リージョン
                                                                                                                    snowflake-arctic-embed-m-v1.5
                                                                                                                    snowflake-arctic-embed-l-v2.0
                                                                                                                    voyage-multilingual-2
                                                                                                                    AWS
                                                                                                                    US 西部2(オレゴン州)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    US 東部2(オハイオ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    US 東部1(北部バージニア)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    カナダ(中部)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    南米(サンパウロ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    ヨーロッパ(アイルランド)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    ヨーロッパ(ロンドン)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    ヨーロッパ中部1(フランクフルト)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    ヨーロッパ(ストックホルム)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    アジア太平洋(東京)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    アジア太平洋(ムンバイ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    アジア太平洋(シドニー)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    アジア太平洋(ジャカルタ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    AWS
                                                                                                                    アジア太平洋(ソウル)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    東 US 2(バージニア)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    西 US 2(ワシントン)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    南中央 US (テキサス)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    UK 南部(ロンドン)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    北ヨーロッパ(アイルランド)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    西ヨーロッパ(オランダ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    スイス北部(チューリッヒ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    インド中部(プネー)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    日本東部(東京)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    東南アジア(シンガポール)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    Azure
                                                                                                                    オーストラリア東部(ニューサウスウェールズ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    ヨーロッパ西部2(ロンドン)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    ヨーロッパ西部3(フランクフルト)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    ヨーロッパ西部4(オランダ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    中東セントラル2(ダンマーム)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    US 中央部1(アイオワ)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    GCP
                                                                                                                    US 東部4(北部バージニア)

                                                                                                                    ✔

                                                                                                                    ✔

                                                                                                                    注釈

                                                                                                                    上記のリージョンのいずれかで、 クロスリージョン推論パラメーター を指定することで、デフォルトリージョンでは直接サポートされていないモデルにアクセスすることができます。

                                                                                                                    Cortex Searchはクロスリージョン推論を使用する場合 のみ、以下のリージョンで利用可能です。クロスリージョン推論でCortex Searchを使用するには、 クロスリージョン推論パラメーター を使います。

                                                                                                                    • AWS ヨーロッパ(パリ)

                                                                                                                    • AWS ヨーロッパ(チューリッヒ)

                                                                                                                    • AWS アジア太平洋(シンガポール)

                                                                                                                    • AWS アジア太平洋(大阪)

                                                                                                                    • Azureカナダ中部(トロント)

                                                                                                                    • Azure中部US(アイオワ)

                                                                                                                    • Azure UAE 北部(ドバイ)

                                                                                                                    注釈

                                                                                                                    クロスリージョン推論を使用する場合、リージョン間のクエリ遅延はクラウドプロバイダーのインフラストラクチャとネットワークステータスに依存します。Snowflakeでは、クロスリージョン推論を有効にして特定のユースケースをテストすることを推奨しています。

                                                                                                                    法的通知¶

                                                                                                                    インプットとアウトプットのデータ分類は以下の表の通りです。

                                                                                                                    入力データの分類

                                                                                                                    出力データの分類

                                                                                                                    指定

                                                                                                                    Usage Data

                                                                                                                    Customer Data

                                                                                                                    一般的に利用可能な関数は、カバーされている AI 機能です。プレビュー関数は、 AI 機能をプレビューします。 [1]

                                                                                                                    [1]

                                                                                                                    AI 利用規約で使用される定義された用語を表します。

                                                                                                                    詳細については、 Snowflake AI と ML をご参照ください。

                                                                                                                    このページは役に立ちましたか?

                                                                                                                    Snowflakeに移動する
                                                                                                                    会話に参加する
                                                                                                                    Snowflakeで開発する
                                                                                                                    フィードバックを共有する
                                                                                                                    ブログでの最新情報を表示する
                                                                                                                    独自の認定を取得する
                                                                                                                    プライバシー通知サイト規約© 2025 Snowflake, Inc. All Rights Reserved.
                                                                                                                    1. 概要
                                                                                                                    2. Cortex Searchの使用時期
                                                                                                                    3. 例
                                                                                                                    4. 必要な権限
                                                                                                                    5. Cortex Searchの品質を理解する
                                                                                                                    6. トークン制限とテキスト分割
                                                                                                                    7. リフレッシュ
                                                                                                                    8. インデックス作成とサービングの停止
                                                                                                                    9. コストの考慮事項
                                                                                                                    10. 既知の制限
                                                                                                                    11. リージョンの可用性
                                                                                                                    12. 法的通知
                                                                                                                    1. ALTER CORTEX SEARCH SERVICE
                                                                                                                    2. CREATE CORTEX SEARCH SERVICE
                                                                                                                    3. DESCRIBE CORTEX SEARCH SERVICE
                                                                                                                    4. DROP CORTEX SEARCH SERVICE
                                                                                                                    5. SHOW CORTEX SEARCH SERVICES
                                                                                                                    言語: 日本語
                                                                                                                    • English
                                                                                                                    • Français
                                                                                                                    • Deutsch
                                                                                                                    • 日本語
                                                                                                                    • 한국어
                                                                                                                    • Português