DOCUMENTATION
/
Erste Schritte
Benutzerhandbücher
Entwickler
Referenz
Releases
Tutorials
Snowflake Open Catalog
Status
  1. Übersicht
    • Snowflake Horizon Catalog
      • Applications and tools for connecting to Snowflake
      • Virtuelle Warehouses
      • Datenbanken, Tabellen und Ansichten
      • Datentypen
        • Laden von Daten
        • Dynamische Tabellen
        • Streams und Aufgaben
        • Entladen von Daten
        • Abfragen
        • Zusammenarbeit
        • Snowflake AI & ML
            1. Regionenübergreifende Inferenz
              • Cortex LLM-Funktionen
              • Cortex Analyst
              • Cortex Search
                  1. Abfrage eines Cortex Search Service
                    • Tutorials
                • ML-Funktionen
                • Dokumenten-KI (Document AI)
                • ML-Entwicklung und ML-Ops
              • Alerts und Benachrichtigungen
              • Sicherheit
              • Data Governance
              • Datenschutz
              • Organisationen und Konten
              • Business continuity & data recovery
              • Leistungsoptimierung
              • Kosten und Abrechnung
              BenutzerhandbücherSnowflake AI & MLCortex Search

              Cortex Search¶

              Dieses Feature ist für Konten in den meisten Snowflake Regionen verfügbar. Im Abschnitt Regionale Verfügbarkeit finden Sie eine vollständige Liste der Regionen.

              Überblick¶

              Cortex Search ermöglicht eine qualitativ hochwertige „unscharfe“ Suche mit geringer Latenz in Ihren Snowflake-Daten. Cortex Search ermöglicht Snowflake-Benutzern ein breites Array an Suchmöglichkeiten, darunter Retrieval Augmented Generation (RAG) Anwendungen, die Large Language Models (LLMs) nutzen.

              Mit Cortex Search können Sie eine hybride (Vektor- und Schlüsselwort-) Suchmaschine für Ihre Textdaten in wenigen Minuten in Betrieb nehmen, ohne sich um die Einbettung, die Wartung der Infrastruktur, die Abstimmung der Parameter für die Suchqualität oder die laufende Indexaktualisierung kümmern zu müssen. Das bedeutet, dass Sie weniger Zeit für die Optimierung der Infrastruktur und der Suchqualität aufwenden müssen und mehr Zeit für die Entwicklung hochwertiger Chat- und Sucherlebnisse unter Verwendung Ihrer Daten haben. In den Cortex Search Tutorials finden Sie Schritt-für-Schritt-Anweisungen zur Verwendung von Cortex Search für AI-Chat- und Suchanwendungen.

              Wann Sie Cortex Search verwenden sollten¶

              Die beiden Hauptanwendungsfälle für Cortex Search sind das Abrufen von Augmented Generation (RAG) und die Unternehmenssuche.

              • RAG Engine für LLM Chatbots: Verwenden Sie Cortex Search als RAG-Engine für Chat-Anwendungen mit Ihren Textdaten, indem Sie die semantische Suche für individuelle, kontextbezogene Antworten nutzen.

              • Enterprise-Suche: Verwenden Sie Cortex Search als Backend für eine hochwertige, in Ihre Anwendung eingebettete Suchleiste.

              Cortex Search für RAG¶

              Retrieval Augmented Generation (RAG) ist eine Technik zum Abrufen von Daten aus einer Wissensdatenbank, um die generierte Antwort eines großen Sprachmodells zu verbessern. Das folgende Architekturdiagramm zeigt, wie Sie Cortex Search mit Cortex LLM-Funktionen kombinieren können, um Unternehmens-Chatbots mit RAG zu erstellen, die Ihre Snowflake-Daten als Wissensdatenbank nutzen.

              Verwendung von Cortex Search für RAG in Snowflake

              Cortex Search ist die Suchmaschine, die das Large Language Model mit dem nötigen Kontext versorgt, um Antworten zu liefern, die auf Ihren aktuellsten proprietären Daten beruhen.

              Beispiel¶

              Dieses Beispiel führt Sie durch die Schritte zur Erstellung eines Cortex Search Service und dessen Abfrage mithilfe der REST API. Weitere Einzelheiten zur Abfrage des Services finden Sie unter Abfrage eines Cortex Search Service.

              Dieses Beispiel verwendet ein Beispieldatenset für ein Kundensupport-Transkript.

              Führen Sie die folgenden Befehle aus, um die Beispieldatenbank und das Schema einzurichten.

              CREATE DATABASE IF NOT EXISTS cortex_search_db;
              
              CREATE OR REPLACE WAREHOUSE cortex_search_wh WITH
                 WAREHOUSE_SIZE='X-SMALL';
              
              CREATE OR REPLACE SCHEMA cortex_search_db.services;
              
              Copy

              Führen Sie die folgenden SQL-Befehle aus, um das Datenset zu erstellen.

              CREATE OR REPLACE TABLE support_transcripts (
                  transcript_text VARCHAR,
                  region VARCHAR,
                  agent_id VARCHAR
              );
              
              INSERT INTO support_transcripts VALUES
                  ('My internet has been down since yesterday, can you help?', 'North America', 'AG1001'),
                  ('I was overcharged for my last bill, need an explanation.', 'Europe', 'AG1002'),
                  ('How do I reset my password? The email link is not working.', 'Asia', 'AG1003'),
                  ('I received a faulty router, can I get it replaced?', 'North America', 'AG1004');
              
              Copy

              Die Änderungsverfolgung ist eine Anforderung für den Aufbau des Cortex Search Service. Wenn Sie eine Rolle verwenden, die nicht die Eigentümerschaft für diese Tabelle hat, um den Search Service zu erstellen, führen Sie die folgende Anweisung aus, um die Änderungsverfolgung für die Tabelle zu aktivieren:

              ALTER TABLE support_transcripts SET
                CHANGE_TRACKING = TRUE;
              
              Copy

              Weitere Informationen zur Aktivierung der Änderungsverfolgung finden Sie unter Änderungsverfolgung aktivieren.

              Dienst erstellen¶

              Sie können einen Cortex Search Service mit einer einzelnen SQL-Abfrage oder über das Snowflake AI & ML-Studio erstellen. Wenn Sie einen Cortex Search Service erstellen, führt Snowflake Transformationen an Ihren Quelldaten durch, um sie für die Bereitstellung mit niedriger Latenz bereit zu machen. In den folgenden Abschnitten wird gezeigt, wie Sie einen Service sowohl mit SQL als auch im Snowflake AI & ML-Studio über die Snowsight erstellen.

              Bemerkung

              Wenn Sie einen Service erstellen, wird der Suchindex als Teil des Erstellungsprozesses erstellt. Das bedeutet, dass die Anweisung CREATE CORTEX SEARCH SERVICE bei größeren Datensets länger dauern kann.

              Verwenden von SQL¶

              Das folgende Beispiel veranschaulicht, wie ein Cortex Search Service mit CREATE CORTEX SEARCH SERVICE anhand des im vorherigen Abschnitt erstellten Beispiel-Datensets für Kundensupport-Transkripte erstellt wird.

              CREATE OR REPLACE CORTEX SEARCH SERVICE transcript_search_service
                ON transcript_text
                ATTRIBUTES region
                WAREHOUSE = cortex_search_wh
                TARGET_LAG = '1 day'
                EMBEDDING_MODEL = 'snowflake-arctic-embed-l-v2.0'
                AS (
                  SELECT
                      transcript_text,
                      region,
                      agent_id
                  FROM support_transcripts
              );
              
              Copy

              Dieser Befehl löst den Aufbau des Search Services für Ihre Daten aus. In diesem Beispiel:

              • Bei Abfragen an den Dienst wird nach Übereinstimmungen in der Spalte transcript_text gesucht.

              • Der Parameter TARGET_LAG legt fest, dass der Cortex Search Service etwa einmal pro Tag nach Aktualisierungen der Basistabelle support_transcripts sucht.

              • Die Spalten region und agent_id werden indiziert, sodass sie zusammen mit den Ergebnissen von Abfragen in der Spalte transcript_text zurückgegeben werden können.

              • Die Spalte region steht bei der Abfrage der Spalte transcript_text als Filterspalte zur Verfügung.

              • Das Warehouse cortex_search_wh wird verwendet, um die Ergebnisse der angegebenen Abfrage anfänglich und bei jeder Änderung der Basistabelle zu materialisieren.

              Bemerkung

              • Abhängig von der Größe des in der Abfrage angegebenen Warehouse und der Anzahl der Zeilen in Ihrer Tabelle kann dieser CREATE-Befehl bis zu mehreren Stunden in Anspruch nehmen.

              • Snowflake empfiehlt, für jeden Service ein eigenes Warehouse zu verwenden, das nicht größer als MEDIUM ist.

              • Die Spalten im Feld ATTRIBUTES müssen in der Abfrage enthalten sein, entweder über eine explizite Aufzählung oder einen Platzhalter (*).

              Verwenden von Snowsight¶

              Folgen Sie diesen Schritten, um einen Cortex Search Service in Snowsight zu erstellen:

              1. Melden Sie sich bei Snowsight an.

              2. Wählen Sie eine Rolle, die die Datenbankrolle SNOWFLAKE.CORTEX_USER hat.

              3. Wählen Sie im Navigationsmenü die Option AI & ML » Studio aus.

              4. Wählen Sie + Create aus dem Feld Create a Cortex Search Service.

              5. Wählen Sie eine Rolle und ein Warehouse. Der Rolle muss die Datenbankrolle SNOWFLAKE.CORTEX_USER zugewiesen sein. Das Warehouse wird für die Materialisierung der Ergebnisse der Quellabfrage verwendet, wenn der Service erstellt und aktualisiert wird.

              6. Wählen Sie eine Datenbank und ein Schema, in dem der Dienst definiert ist.

              7. Geben Sie einen Namen für Ihren Dienst ein und wählen Sie dann Let’s go aus.

              8. Wählen Sie die Tabelle oder Ansicht, die die Textdaten enthält, die für die Suche indiziert werden sollen, und wählen Sie dann Next aus. Wählen Sie für dieses Beispiel die Tabelle support_transcripts aus.

                Bemerkung

                Wenn Sie bei der Definition Ihres Dienstes mehrere Datenquellen angeben oder Transformationen durchführen möchten, verwenden Sie SQL.

              9. Markieren Sie die Spalten, die in den Suchergebnissen enthalten sein sollen, transcript_text, region und agent_id, und wählen Sie dann Next aus.

              10. Markieren Sie die Spalte, die durchsucht werden soll, transcript_text, und wählen Sie dann Next aus.

              11. Wenn Sie Ihre Suchergebnisse nach einer oder mehreren bestimmten Spalten filtern möchten, markieren Sie diese Spalten und wählen dann Next aus. Wenn Sie keine Filter benötigen, wählen Sie Skip this option. Für dieses Beispiel können Sie diesen Schritt auslassen.

              12. Legen Sie Ihr Ziel fest, d. h. die Zeitspanne, die Ihr Inhalt Ihres Dienstes hinter den Aktualisierungen der Basisdaten zurückbleiben soll, und wählen Sie dann Create search service aus.

              Der letzte Schritt bestätigt, dass Ihr Service erstellt wurde und zeigt den Namen des Service und seine Datenquelle an.

              Bemerkung

              Wenn Sie den Dienst von der Snowsight aus erstellen, wird der Name des Dienstes in doppelten Anführungszeichen angegeben. Was das bedeutet, wenn Sie den Dienst in SQL referenzieren, erfahren Sie unter Bezeichner mit doppelten Anführungszeichen.

              Berechtigungen für die Nutzung erteilen¶

              Nachdem der Service und der Index erstellt wurden, können Sie anderen Rollen wie customer_support die Nutzung des Services, seiner Datenbank und seines Schemas gestatten.

              GRANT USAGE ON DATABASE cortex_search_db TO ROLE customer_support;
              GRANT USAGE ON SCHEMA services TO ROLE customer_support;
              
              GRANT USAGE ON CORTEX SEARCH SERVICE transcript_search_service TO ROLE customer_support;
              
              Copy

              Vorschau auf den Dienst¶

              Um zu bestätigen, dass der Service ordnungsgemäß mit Daten gefüllt ist, können Sie eine Vorschau des Services über die Funktion SEARCH_PREVIEW aus einer SQL Umgebung heraus anzeigen:

              SELECT PARSE_JSON(
                SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
                    'cortex_search_db.services.transcript_search_service',
                    '{
                      "query": "internet issues",
                      "columns":[
                          "transcript_text",
                          "region"
                      ],
                      "filter": {"@eq": {"region": "North America"} },
                      "limit":1
                    }'
                )
              )['results'] as results;
              
              Copy

              Beispiel für eine erfolgreiche Antwort auf eine Abfrage:

              [
                {
                "transcript_text" : "My internet has been down since yesterday, can you help?",
                "region" : "North America"
                }
              ]
              
              Copy

              Diese Antwort bestätigt, dass der Service mit Daten gefüllt ist und angemessene Ergebnisse für die gegebene Abfrage liefert.

              Sie können auch die Tabellenfunktion CORTEX_SEARCH_DATA_SCAN verwenden, um den Inhalt des Dienstes zu überprüfen.

              SELECT
                *
              FROM
                TABLE (
                  CORTEX_SEARCH_DATA_SCAN (
                    SERVICE_NAME => 'transcript_search_service'
                  )
                );
              
              Copy
              + ---------------------------------------------------------- + --------------- + -------- + ------------------------------ +
              |                      transcript_text                       |     region      | agent_id | _GENERATED_EMBEDDINGS_MY_MODEL |
              | ---------------------------------------------------------- | --------------- | -------- | ------------------------------ |
              | 'My internet has been down since yesterday, can you help?' | 'North America' | 'AG1001' | [0.1, 0.2, 0.3, 0.4]           |
              | 'I was overcharged for my last bill, need an explanation.' | 'Europe'        | 'AG1002' | [0.1, 0.2, 0.3, 0.4]           |
              + ---------------------------------------------------------- + --------------- + -------- + ------------------------------ +
              

              Abfrage des Dienstes von Ihrer Anwendung aus¶

              Nachdem Sie den Search Service erstellt, Ihrer Rolle die Nutzung gewährt und eine Vorschau angezeigt haben, können Sie ihn nun von Ihrer Anwendung aus mit Python API abfragen.

              Der folgende Code zeigt die Verwendung von Python API zum Abrufen des Support-Tickets, das für eine Abfrage über internet issues am relevantesten ist, gefiltert, um Ergebnisse in der Region North America zurückzugeben:

              from snowflake.core import Root
              from snowflake.snowpark import Session
              
              CONNECTION_PARAMETERS = {"..."}
              
              session = Session.builder.configs(CONNECTION_PARAMETERS).create()
              root = Root(session)
              
              transcript_search_service = (root
                .databases["cortex_search_db"]
                .schemas["services"]
                .cortex_search_services["transcript_search_service"]
              )
              
              resp = transcript_search_service.search(
                query="internet issues",
                columns=["transcript_text", "region"],
                filter={"@eq": {"region": "North America"} },
                limit=1
              )
              print(resp.to_json())
              
              Copy

              Beispiel für eine erfolgreiche Antwort auf eine Abfrage:

              {
                "results": [
                  {
                    "transcript_text": "My internet has been down since yesterday, can you help?",
                    "region": "North America"
                  }
                ],
                "request_id": "5d8eaa5a-800c-493c-a561-134c712945ba"
              }
              
              Copy

              Cortex Search Services geben alle Spalten zurück, die im Feld columns in Ihrer Abfrage angegeben sind.

              Erforderliche Berechtigungen¶

              • Um einen Cortex Search Service zu erstellen, muss Ihre Rolle über die Datenbankrolle CORTEX_USER verfügen, die für die Cortex LLM-Funktionen erforderlich ist. Informationen zum Zuweisen und Widerrufen dieser Rolle finden Sie unter Erforderliche Berechtigungen für Cortex LLM-Funktionen.

              • Um einen Cortex Search Service abzufragen, muss die Rolle des abfragenden Benutzer USAGE-Berechtigung für den Dienst selbst sowie für die Datenbank und das Schema, in dem sich der Dienst befindet, verfügen. Siehe Anforderungen an die Cortex Search-Zugriffssteuerung Anforderungen.

              • Um einen Cortex Search Service mit dem Befehl ALTER auszusetzen oder wieder fortzusetzen, muss die Rolle des abfragenden Benutzers die Berechtigung OPERATE für den Service haben. Siehe ALTER CORTEX SEARCH SERVICE.

              Die Qualität von Cortex Search verstehen¶

              Cortex Search nutzt eine Reihe von Abruf- und Ranking-Modellen, um Ihnen ein hohes Maß an Suchqualität zu bieten, wobei nur wenig bis gar keine Anpassung erforderlich ist. Im Hintergrund verfolgt Cortex Search einen „hybriden“ Ansatz zum Abrufen und Rankint von Dokumenten. Jede Suchabfrage verwendet:

              • Vektorsuche zum Abrufen von semantisch ähnlichen Dokumenten.

              • Schlüsselwortsuche zum Abrufen von lexikalisch ähnlichen Dokumenten.

              • Semantische Neusortierung zur Neusortierung der relevantesten Dokumente in der Ergebnismenge

              Dieser hybride Abrufansatz, gekoppelt mit einem semantischen Reranking-Schritt, erreicht eine hohe Suchqualität über eine breite Palette von Datasets und Abfragen.

              Cortex Search-Einbettungsmodelle¶

              Cortex Search ermöglicht es Benutzern, ein Einbettungsmodell auszuwählen, das im Stagingbereich der Vektorsuche verwendet werden soll.

              Einige Einbettungsmodelle sind für Cortex Search nur in bestimmten Regionen der Cloud verfügbar. Eine Liste der Verfügbarkeit nach Modell und Region finden Sie unter Regionale Verfügbarkeit von Cortex Search.

              Jedes Modell hat unterschiedliche Leistungs-, Kosten- und Qualitätsmerkmale. Prüfen Sie die Modellspezifikationen sorgfältig, um das beste Modell für Ihre spezielle Arbeitslast zu finden. Die Kosten für jede Funktion in Credits pro Million Token finden Sie in der Snowflake Service Consumption Table.

              Token-Beschränkungen und Textsplitting¶

              Für optimale Suchergebnisse mit der Cortex Search empfiehlt Snowflake, den Text in Ihrer Suchspalte in Blöcke von nicht mehr als 512 Token (etwa 385 englische Wörter) aufzuteilen. Wenn ein Eintrag in der Suchspalte mehr als 512 Token enthält, führt Cortex Search eine schlüsselwortbasierte Suche im gesamten Textkörper durch, verwendet jedoch nur die ersten 512 Token für die semantische (d. h. vektorbasierte) Suche.

              Ein Token ist eine Sequenz von Zeichen und ist die kleinste Einheit, die von einem großen Sprachmodell (Large Language Model) verarbeitet werden kann. Ein Token entspricht ungefähr 3/4 eines englischen Wortes, also etwa 4 Zeichen. Um die genaue Anzahl der Token in einer Zeichenfolge zu berechnen, können Sie die COUNT_TOKENS Cortex-Funktion verwenden. Zum Beispiel die Berechnung der Token für eine Zeichenfolge, die mit dem Modell snowflake-arctic-embed-m-v1.5 eingebettet werden soll:

              SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS('snowflake-arctic-embed-m-v1.5', '<input_text>') as token_count
              
              Copy

              Beschränkungen bei der semantischen Suche mit Token verstehen¶

              Die Empfehlung für Blöcke mit einer Größe von 512 Token oder weniger beruht auf Forschungsergebnissen, die zeigen, dass eine geringere Größe von Blöcken in der Regel zu einer höheren Abruf- und nachgelagerten LLM-Antwortqualität führt. Obwohl es heute Modelle zur Einbettung in einen längeren Kontext gibt, wie z. B. arctic-embed-m-long, aber Cortex Search entscheidet sich für ein Einbettungsmodell mit einem kleineren Kontextfenster, um von Anfang an eine höhere Suchqualität zu bieten.

              Die Idee hinter diesem Konzept ist, dass bei kleineren Datenpaketen die Abfrage für eine bestimmte Suchanfrage präziser sein kann. Dies liegt daran, dass es weniger Token gibt, über die „gemittelt“ werden muss, wenn die Vektoreinbettungen für den Block und die Abfrage generiert werden. Mit kleineren Blöcken kann das nachgelagerte LLM zudem nur die Informationen erhalten, die es benötigt, da in der Eingabeaufforderung für das Modell weniger potenziell verrauschter Text enthalten ist.

              Hier finden Sie eine Studie, die zeigt, dass kleinere Blöcke in der Regel bei öffentlichen Benchmark-Datensätzen im Q&A-Stil besser abschneiden.

              Aktualisierungen¶

              Der Inhalt, der in einem Cortex Search Service angeboten wird, basiert auf den Ergebnissen einer bestimmten Abfrage. Wenn sich die einem Cortex Search Service zugrunde liegenden Daten ändern, wird der Service aktualisiert, um diese Änderungen widerzuspiegeln. Diese Aktualisierungen werden als Auffrischung (engl. refresh) bezeichnet. Dieser Prozess ist automatisiert und umfasst die Analyse der Abfrage, die der Tabelle zugrunde liegt.

              Die Cortex Search Services haben die gleichen Eigenschaften wie die dynamische Tabellen. Unter Erläuterungen zum Aktualisieren von dynamischen Tabellen finden Sie Informationen zu den Aktualisierungsmerkmalen eines Cortex Search Service.

              Die Quellabfrage für einen Cortex Search Service muss ein Kandidat für die dynamische inkrementelle Tabellenaktualisierung sein. Einzelheiten zu diesen Anforderungen finden Sie unter Unterstützung von inkrementellen Aktualisierungen. Diese Einschränkung soll verhindern, dass die Kosten für die Berechnung der Vektoreinbettung unkontrolliert steigen. Weitere Informationen über die Konstrukte, die für die dynamische inkrementelle Aktualisierung von Tabellen nicht unterstützt werden, finden Sie unter Nicht unterstützte Konstrukte, Operatoren und Funktionen.

              Anhalten der Indizierung und Bereitstellung¶

              Ähnlich wie bei Dynamic Tables setzt Cortex Search Services den Indizierungsstatus automatisch aus, wenn fünf aufeinanderfolgende Aktualisierungsfehler in Bezug auf die Ausgangsabfrage festgestellt werden. Wenn dieser Fehler bei Ihrem Service auftritt, können Sie den spezifischen SQL-Fehler entweder unter DESCRIBE CORTEX SEARCH SERVICE oder unter Ansicht CORTEX_SEARCH_SERVICES anzeigen. Die Ausgabe von beiden umfasst die folgenden Spalten:

              • Die Spalte INDEXING_STATE wird den Wert SUSPENDED haben.

              • Die Spalte INDEXING_ERROR enthält den spezifischen SQL-Fehler, der in der Quellabfrage aufgetreten ist.

              Sobald die Ursache behoben ist, können Sie den Dienst unter ALTER CORTEX SEARCH SERVICE <name> RESUME INDEXING fortsetzen. Für eine detaillierte Syntax siehe ALTER CORTEX SEARCH SERVICE.

              Hinweise zu Kosten¶

              Ein Cortex Search Service verursacht Kosten auf folgende Weise:

              Kostenkategorie

              Beschreibung

              AI-Dienste – Bereitstellungskosten

              Cortex Search Services nutzen mandantenfähige Rechenleistung, die von einem vom Benutzer bereitgestellten virtuellen Warehouse getrennt ist, um Suchabfragen mit geringer Latenzzeit zu ermöglichen. Die Kosten für die Berechnung fallen pro GB pro Monat (GB/mo) indizierter Daten an, wobei indizierte Daten die vom Benutzer in der Cortex Search-Quellabfrage bereitgestellten Daten plus die im Namen des Benutzers berechneten Vektoreinbettungen sind. Bei den Berechnungen zur Abrechnung der Bereitstellung wird der Verbrauch auf der zweiten Ebene gemessen, wobei von 30,5 Tagen im Monat ausgegangen wird.

              Schätzungsweise entspricht die Größe der indizierten Daten in Bytes ungefähr num_rows * (768*4 + 1000), wobei num_rows die Anzahl der vom Dienst indizierten Zeilen ist und durchschnittlich 1000 Bytes unkomprimierter, vom Benutzer bereitgestellter Daten pro Zeile vorhanden sind.

              Die Kosten für die Bereitstellung von Cortex Search können Sie in der Ansicht CORTEX_SEARCH_SERVING_USAGE_HISTORY anzeigen, die den stündlichen Token-Verbrauch für jeden Cortex Search Service in Ihrem Konto anzeigt.

              Die Kosten für die Bereitstellung von Cortex Search sind zusätzlich in der Gesamtsumme von AI_SERVICES in der Ansicht METERING_HISTORY enthalten.

              Die Credit-Rate pro GB/mo indizierter Daten finden Sie in der Snowflake Service Consumption Table.

              AI-Dienste – Kosten für die Einbettungskosten

              Cortex Search Services betten jedes Dokument in der Suchspalte in den Vektorraum ein, was pro eingebettetem Token Credit-Kosten verursacht. Die Einbettungen werden bei der Auswertung der Abfrage inkrementell verarbeitet, sodass die Einbettungskosten nur für hinzugefügte oder geänderte Dokumente anfallen. Weitere Informationen zu den Kosten der Vektoreinbettung finden Sie unter Vektoreinbettungen.

              Die Kosten für die Einbettung von Cortex Search sind zusätzlich in der Gesamtsumme von AI_SERVICES in der Ansicht METERING_HISTORY enthalten.

              Virtual Warehouse-Computing

              Cortex Search Services erfordern ein vom Benutzer bereitgestelltes virtuelles Warehouse. Für dieses Warehouse fallen Kosten, wenn der Benutzer den Dienst erstellt und jedes Mal, wenn der Dienst aktualisiert wird.

              Speicher

              Cortex Search Services materialisiert die Abfrage in einer Tabelle, die in Ihrem Konto gespeichert ist. Diese Tabelle wird in Datenstrukturen umgewandelt, die für eine niedrige Latenzzeit optimiert sind und ebenfalls in Ihrem Konto gespeichert werden. Der Speicher für die Tabelle und die dazwischen liegenden Strukturen basiert auf einer Pauschale pro Terabyte (TB).

              Cloud Services Compute

              Cortex Search Services verwenden Cloudservices, um Aktualisierungen auszulösen, wenn sich ein zugrunde liegendes Basisobjekt geändert hat. Die Computekosten für Clouddienste-Computing unterliegen der Einschränkung, dass Snowflake diese nur abrechnet, wenn die täglichen Kosten der Clouddienste mehr als 10 % der täglichen Warehouse-Kosten für das Konto betragen.

              Um die AI Services-bezogenen Verbrauchskosten für jeden Cortex Search Service in Ihrem Konto, täglich aggregiert, anzuzeigen, besuchen Sie die Ansicht CORTEX_SEARCH_DAILY_USAGE_HISTORY

              Tipp

              Snowflake empfiehlt für einen Cortex Search Service eine Warehouse-Größe, die nicht größer ist als MEDIUM. Diese Empfehlung gilt möglicherweise in Zukunft nicht mehr, da Produktaktualisierungen anstehen.

              Bekannte Einschränkungen¶

              Die Verwendung von Cortex Search unterliegt den folgenden Beschränkungen:

              • Größe der Basistabelle: Das Ergebnis der materialisierten Abfrage im Search Service muss kleiner als 50 Millionen Zeilen sein, um eine optimale Leistung zu gewährleisten. Wenn das materialisierte Ergebnis Ihrer Abfrage mehr als 50 Mio. Zeilen enthält, tritt bei der Erstellungsabfrage ein Fehler auf.

                Bemerkung

                Wenn Sie die Beschränkungen der Zeilenskalierung bei einem Cortex Search Service über 50 Mio. erhöhen möchten, wenden Sie sich bitte an Ihren Snowflake-Kundenbetreuer.

              • Abfragekonstrukte: Die Abfragen des Cortex Search Service müssen denselben Abfragebeschränkungen unterliegen wie die dynamischen Tabellen. Weitere Informationen finden Sie unter Bekannte Einschränkungen für dynamische Tabellen.

              • Replikation und Klonen: Die Cortex Search Services unterstützen Replikation oder Klonen nicht. Die Unterstützung für diese Features wird in einem zukünftigen Release verfügbar sein.

              Wichtig

              Für jeden Cortex Search Service, den Sie erstellen, werden zwei dynamische Tabellenentitäten in der Snowsight-Überwachung UI für dynamische Tabellen angezeigt. Diese beiden Entitäten haben das Format _CORTEX_SEARCH_SOURCE_* und _CORTEX_SEARCH_REFRESH_*. Diese Entitäten erscheinen auch in den Ansichten des dynamischen Tabelleninformationsschemas, jedoch nicht in den SHOW/DESC-Befehlen für dynamische Tabellen. Wenn Sie eine dieser Entitäten in der Snowsight UI auswählen, wird die Meldung Dynamic Table not found angezeigt. Dies ist ein erwartetes Verhalten. Die Entitäten, die sich auf die Cortex Search beziehen, werden in zukünftigen Releases des Produkts aus dem Snowsight Dynamic Tables Monitoring-UI entfernt.

              Regionale Verfügbarkeit¶

              Dieses Feature ist für Konten in den folgenden Snowflake-Regionen verfügbar: Die Verfügbarkeit für bestimmte Einbettungsmodelle innerhalb einer Region ist durch ein Häkchen gekennzeichnet.

              Cloudanbieter
              Region
              snowflake-arctic-embed-m-v1.5
              snowflake-arctic-embed-l-v2.0
              voyage-multilingual-2
              AWS
              US West 2 (Oregon)

              ✔

              ✔

              ✔

              AWS
              US East 2 (Ohio)

              ✔

              ✔

              AWS
              US East 1 (N. Virginia)

              ✔

              ✔

              ✔

              AWS
              Canada (Central)

              ✔

              ✔

              AWS
              South America (São Paulo)

              ✔

              ✔

              AWS
              Europa (Irland)

              ✔

              ✔

              AWS
              Europe (London)

              ✔

              ✔

              AWS
              Europe Central 1 (Frankfurt)

              ✔

              ✔

              ✔

              AWS
              Europe (Stockholm)

              ✔

              ✔

              AWS
              Asia Pacific (Tokio)

              ✔

              ✔

              ✔

              AWS
              Asia Pacific (Mumbai)

              ✔

              ✔

              AWS
              Asia Pacific (Sydney)

              ✔

              ✔

              AWS
              Asia Pacific (Jakarta)

              ✔

              ✔

              AWS
              Asia Pacific (Seoul)

              ✔

              ✔

              Azure
              East US 2 (Virginia)

              ✔

              ✔

              Azure
              West US 2 (Washington)

              ✔

              ✔

              Azure
              South Central US (Texas)

              ✔

              ✔

              Azure
              UK South (London)

              ✔

              ✔

              Azure
              North Europe (Irland)

              ✔

              ✔

              Azure
              West Europe (Niederlande)

              ✔

              ✔

              ✔

              Azure
              Switzerland North (Zürich)

              ✔

              ✔

              Azure
              Central India (Pune)

              ✔

              ✔

              Azure
              Japan East (Tokyo, Saitama)

              ✔

              ✔

              Azure
              Southeast Asia (Singapur)

              ✔

              ✔

              Azure
              Australia East (New South Wales)

              ✔

              ✔

              GCP
              Europe West 2 (London)

              ✔

              ✔

              GCP
              Europe West 3 (Frankfurt)

              ✔

              ✔

              GCP
              Europe West 4 (Niederlande)

              ✔

              ✔

              GCP
              US Central 1 (Iowa)

              ✔

              ✔

              GCP
              US East 4 (N. Virginia)

              ✔

              ✔

              Bemerkung

              Sie können den regionenübergreifenden Inferenzparameter in jeder der oben genannten Regionen nutzen, um auf Modelle zuzugreifen, die nicht direkt von Ihrer Standardregion unterstützt werden.

              Cortex Search ist in den folgenden Regionen nur mit regionenübergreifender Inferenz verfügbar. Um die Cortex Search mit regionenübergreifender Inferenz zu nutzen, verwenden Sie den Parameter regionenübergreifende Inferenz.

              • Azure UAE North (Dubai)

              • AWS Europa (Paris)

              • Azure Canada Central (Toronto)

              Bemerkung

              Bei der regionenübergreifenden Inferenz hängt die Latenz bei Abfragen zwischen Regionen von der Infrastruktur des Cloudanbieters und dem Netzwerkstatus ab. Snowflake empfiehlt, dass Sie Ihren speziellen Anwendungsfall mit aktivierter regionsübergreifender Inferenz testen.

              Rechtliche Hinweise¶

              Die Datenklassifizierung der Eingaben und Ausgaben ist in der folgenden Tabelle aufgeführt.

              Klassifizierung von Eingabedaten

              Klassifizierung von Ausgabedaten

              Benennung

              Usage Data

              Customer Data

              Covered AI Features [1]

              [1]

              Stellt den definierten Begriff dar, der in den KI-Bedingungen (AI Terms) und in der Richtlinie zur akzeptablen Nutzung (Acceptable Use Policy) verwendet wird

              Weitere Informationen dazu finden Sie unter KI und ML in Snowflake.

              War diese Seite hilfreich?

              Besuchen Sie Snowflake
              An Diskussion beteiligen
              Mit Snowflake entwickeln
              Teilen Sie Ihr Feedback mit
              Lesen Sie Neuigkeiten in unserem Blog
              Eigene Zertifizierung erhalten
              DatenschutzNutzungsbedingungen© 2025 Snowflake, Inc. Alle Rechte vorbehalten.
              1. Überblick
              2. Wann Sie Cortex Search verwenden sollten
              3. Beispiel
              4. Erforderliche Berechtigungen
              5. Die Qualität von Cortex Search verstehen
              6. Token-Beschränkungen und Textsplitting
              7. Aktualisierungen
              8. Anhalten der Indizierung und Bereitstellung
              9. Hinweise zu Kosten
              10. Bekannte Einschränkungen
              11. Regionale Verfügbarkeit
              12. Rechtliche Hinweise
              1. ALTER CORTEX SEARCH SERVICE
              2. CREATE CORTEX SEARCH SERVICE
              3. DESCRIBE CORTEX SEARCH SERVICE
              4. DROP CORTEX SEARCH SERVICE
              5. SHOW CORTEX SEARCH SERVICES
              Sprache: Deutsch
              • English
              • Français
              • Deutsch
              • 日本語
              • 한국어
              • Português