Snowflake Cortex AI-Funktionen (einschließlich LLM-Funktionen)¶

Verwenden Sie Cortex-AI-Funktionen in Snowflake zur Durchführung unstrukturierter Analysen von Text und Bildern mit branchenführenden LLMs von OpenAI, Anthropic, Meta, Mistral AI und DeepSeek. AI-Funktionen unterstützen Fälle wie die folgenden:

Extrahieren von Entitäten zur Anreicherung von Metadaten und Optimierung der Validierung
Aggregieren von Erkenntnissen über Kundentickets
Filtern und Klassifizieren von Inhalten durch natürliche Sprache
Sentiment- und aspektbasierte Analyse zur Verbesserung von Diensten
Übersetzen und Lokalisieren mehrsprachiger Inhalte
Parsing von Dokumenten für Analysen und RAG-Pipelines

Alle Modelle werden vollständig in Snowflake gehostet, so dass Leistung, Skalierbarkeit und Governance gewährleistet sind, während Ihre Daten sicher und an ihrem Platz bleiben.

Verfügbare Funktionen¶

Snowflake Cortex-Features werden als SQL-Funktionen bereitgestellt und sind auch in Python verfügbar. Cortex AI-Funktionen lassen sich in die folgenden Kategorien einteilen:

Cortex AI-Funktionen
Hilfreiche Funktionen

Cortex AI-Funktionen¶

Diese aufgabenspezifischen Funktionen sind speziell entwickelte und verwaltete Funktionen, die Routineaufgaben automatisieren, wie z. B. einfache Zusammenfassungen und schnelle Übersetzungen, die keine Anpassung erfordern.

AI_COMPLETE: Erzeugt eine Vervollständigung für eine gegebene Textzeichenfolge oder ein Bild unter Verwendung eines ausgewählten LLM. Verwenden Sie diese Funktion für die meisten generativen AI-Aufgaben.
- AI_COMPLETE ist die aktualisierte Version von COMPLETE (SNOWFLAKE.CORTEX).
AI_CLASSIFY: Klassifiziert Text oder Bilder in benutzerdefinierte Kategorien.
- AI_CLASSIFY ist die aktualisierte Version von CLASSIFY_TEXT (SNOWFLAKE.CORTEX) mit Unterstützung für Multi-Label- und Bild-Klassifizierung.
AI_FILTER: Gibt True oder False für eine gegebene Text- oder Bildeingabe zurück, so dass Sie die Ergebnisse in den Klauseln SELECT, WHERE oder JOIN ... ON filtern können.
AI_AGG: Aggregiert eine Textspalte und liefert auf der Grundlage einer benutzerdefinierten Aufforderung Erkenntnisse über mehrere Zeilen. Diese Funktion unterliegt nicht den Beschränkungen des Kontextfensters.
AI_EMBED: Generiert einen Einbettungsvektor für eine Text- oder Bildeingabe, der für Ähnlichkeitssuche, Clustering und Klassifizierungsaufgaben verwendet werden kann.
- AI_EMBED ist die aktualisierte Version von EMBED_TEXT_1024 (SNOWFLAKE.CORTEX).
AI_EXTRACT: Extrahiert Informationen aus einer Eingabezeichenfolge oder -datei, z. B. Text, Bilder und Dokumente. Unterstützt mehrere Sprachen.
- AI_EXTRACT ist die aktualisierte Version von EXTRACT_ANSWER (SNOWFLAKE.CORTEX).
AI_SENTIMENT: Extrahiert die Stimmung aus dem Text.
- AI_SENTIMENT ist die aktualisierte Version von SENTIMENT (SNOWFLAKE.CORTEX).
AI_SUMMARIZE_AGG: Aggregiert eine Textspalte und liefert eine Zusammenfassung über mehrere Zeilen. Diese Funktion unterliegt nicht den Beschränkungen des Kontextfensters.
AI_SIMILARITY: Berechnet die Ähnlichkeit der Einbettung zwischen zwei Eingaben.
AI_TRANSCRIBE: Transkribiert in einem Stagingbereich gespeicherte Audio- und Videodateien und extrahiert dabei Text, Zeitstempel und Sprecherinformationen.
AI_PARSE_DOCUMENT: Extrahiert Text (mit dem OCR-Modus) oder Text mit Layoutinformationen (mit dem LAYOUT-Modus) von Dokumenten in einem internen oder externen Stagingbereich. Kann auch Bilder extrahieren, die in einem Dokument gefunden wurden.
- AI_PARSE_DOCUMENT ist die aktualisierte Version von PARSE_DOCUMENT (SNOWFLAKE.CORTEX).
AI_REDACT: Blendet persönlich identifizierbare Informationen (Personally Identifiable Information, PII) im Text aus.
AI_TRANSLATE: Übersetzt Text zwischen unterstützten Sprachen.
- AI_TRANSLATE ist die aktualisierte Version von TRANSLATE (SNOWFLAKE.CORTEX).
SUMMARIZE (SNOWFLAKE.CORTEX): Liefert eine Zusammenfassung des Textes, den Sie angegeben haben.

Hilfreiche Funktionen¶

Hilfsfunktionen sind speziell entwickelte und verwaltete Funktionen, die Fehler bei der Ausführung anderer Cortex AI-Funktionen reduzieren, indem sie z. B. die Anzahl der Token in einer Eingabeaufforderung abfragen, um sicherzustellen, dass der Aufruf eine Modellbeschränkung nicht überschreitet.

TO_FILE: Erstellt einen Verweis auf eine Datei in einem internen oder externen Stagingbereich zur Verwendung mit AI_COMPLETE und anderen Funktionen, die Dateien akzeptieren.
AI_COUNT_TOKENS: Gibt bei einer Texteingabe die Anzahl der Token auf der Grundlage des angegebenen Modells oder der angegebenen Cortex-Funktion zurück.
- AI_COUNT_TOKENS ist die aktualisierte Version von COUNT_TOKENS (SNOWFLAKE.CORTEX).
PROMPT: Unterstützt Sie beim Erstellen von Eingabeaufforderungsobjekten zur Verwendung mit AI_COMPLETE und anderen Funktionen.
TRY_COMPLETE (SNOWFLAKE.CORTEX): Funktioniert wie die COMPLETE-Funktion, gibt aber, wenn die Funktion nicht ausgeführt werden konnte, anstatt eines Fehlercodes NULL zurück.

Cortex Guard¶

Cortex Guard ist eine Option der Funktion AI_COMPLETE (oder SNOWFLAKE.CORTEX.COMPLETE), die dazu dient, mögliche unsichere und schädliche Antworten aus einem Sprachmodell herauszufiltern. Cortex Guard wird derzeit mit Llama Guard 3 von Meta erstellt. Cortex Guard wertet die Antworten eines Sprachmodells aus, bevor die Ausgabe an die Anwendung zurückgegeben wird. Sobald Sie Cortex Guard aktivieren, werden Antworten des Sprachmodells, die mit Gewaltverbrechen, Hass, sexuellen Inhalten, Selbstverletzung und mehr in Verbindung gebracht werden können, automatisch gefiltert. Siehe COMPLETE Argumente für Syntax und Beispiele.

Bemerkung

Für die Nutzung von Cortex Guard fallen Computekosten an, die sich nach der Anzahl der verarbeiteten Eingabetoken richten, zusätzlich zu den Kosten für die AI_COMPLETE-Funktion.

Hinweise zur Performance¶

Cortex AI-Funktionen sind für Durchsatz optimiert. Wir empfehlen die Verwendung dieser Funktionen, um umfangreiche Eingaben zu verarbeiten, wie z. B. Text aus großen SQL-Tabellen. Die Batchverarbeitung ist in der Regel besser für AI-Funktionen geeignet. Für interaktivere Anwendungsfälle, bei denen Latenz eine wichtige Rolle spielt, verwenden Sie die REST API. Diese sind für einfache Inferenz verfügbar (Complete API), Einbettung (Embed API) und Agentenanwendungen (Agents API).

Cortex LLM-Berechtigungen¶

Dieser Abschnitt beschreibt die Berechtigungen, die Benutzer für den Zugriff auf Snowflake Cortex AI-Funktionen benötigen. Es behandelt, wie Sie diese Funktionen mithilfe von Rollen und Berechtigungen auf Kontoebene steuern und Zugriff darauf gewähren können.

USE AI FUNCTIONS für die Kontoberechtigung¶

Wichtig

Your users need both the USE AI FUNCTIONS account-level privilege and one of the CORTEX_USER or AI_FUNCTIONS_USER database roles to use Snowflake Cortex AI Functions. Because USE AI FUNCTIONS is granted to the PUBLIC role by default, no additional action is needed for this privilege unless it has been revoked.

Die USE AI FUNCTIONS-Berechtigung auf Kontoebene umfasst die Berechtigungen, die es Ihren Benutzern erlauben, Snowflake Cortex AI-Funktionen aufzurufen. Die Berechtigung USE AI FUNCTIONS ist standardmäßig der Rolle PUBLIC zugewiesen. Die Rolle PUBLIC wird automatisch allen Benutzenden und Rollen zugewiesen, sodass allen Benutzenden in Ihrem Konto die Nutzung der Snowflake Cortex-Funktionen-AI ermöglicht wird. Wenn Sie nicht möchten, dass alle Benutzenden diese Berechtigung haben, können Sie der Rolle PUBLIC die Berechtigung entziehen und den Zugriff anderen Rollen gewähren.

In diesem Abschnitt wird erklärt, wie Sie Folgendes tun können:

Die USEAIFUNCTIONS-Berechtigung von der PUBLIC-Rolle widerrufen
Die USE AI FUNCTIONS-Berechtigung bestimmten Rollen gewähren

Wichtig

Sie müssen die ACCOUNTADMIN-Rolle zum Verwalten der USE AI FUNCTIONS-Berechtigung auf Kontoebene verwenden.

Um die USE AI FUNCTIONS-Berechtigung auf Kontoebene aus derPUBLIC-Rolle zu widerrufen, führen Sie den folgenden Befehl aus:

REVOKE USE AI FUNCTIONS ON ACCOUNT
FROM ROLE PUBLIC;

Bemerkung

Wenn Sie die USE AI FUNCTIONS-Berechtigung auf Kontoebene widerrufen, verhindern Sie, dass Ihre Benutzer auf Snowflake Cortex AI-Funktionen zugreifen können. Ihre Benutzende benötigen beides, die USE AI FUNCTIONS-Berechtigung auf Kontoebene und entweder die CORTEX_USER- oder die AI_FUNCTIONS_USER-Datenbankrollen, um Snowflake Cortex AI-Funktionen verwenden zu können.

Nachdem Sie die USE AI FUNCTIONS-Berechtigung von derPUBLIC-Rolle widerrufen haben, können Sie die ACCOUNTADMIN-Rolle verwenden, um sie anderen Rollen in Ihrem Snowflake-Konto zuzuweisen.

Beispiel:

Gewährt dieUSE AI FUNCTIONS-Berechtigung für:code:cortex_user_role.
Gewährt die cortex_user_role für example_user.

USE ROLE ACCOUNTADMIN;

CREATE ROLE cortex_user_role;

GRANT USE AI FUNCTIONS ON ACCOUNT TO ROLE cortex_user_role;

GRANT ROLE cortex_user_role TO USER example_user;

Sie können den Zugriff auf die Snowflake Cortex-AI-Funktionen über Rollen gewähren, die häufig von bestimmten Benutzergruppen verwendet werden. Wenn Sie beispielsweise eine analyst-Rolle erstellt haben, die von Analysten in Ihrer Organisation als Standardrolle verwendet wird, können Sie diesen Benutzenden mit einer einzigen GRANT <Berechtigungen> … TO ROLE-Anweisung Zugriff auf die Snowflake Cortex-AI-Funktionen gewähren. Weitere Informationen über die Erteilung von Berechtigungen für häufig verwendete Rollen finden Sie unter Benutzerrollen.

GRANT USE AI FUNCTIONS ON ACCOUNT TO ROLE analyst;

Wichtig

Derzeit gilt USE AI FUNCTIONS nicht fürAI-Funktionsabfragen, die innerhalb von nativen Snowflake-Anwendungen ausgeführt werden. Eine Abfrage mit AI-Funktionsaufrufen wird erfolgreich ausgeführt, unabhängig davon, ob die Rolle die USE AI FUNCTIONS-Berechtigung hat.

Verwenden von AI-Funktionen mit eingeschränkten Aufruferrechten¶

Um AI-Funktionen mit eingeschränkten Aufruferrechten verwenden, müssen Sie die USE AI FUNCTIONS-Berechtigung sowohl für die Sitzungsrolle als auch für die Rolle des Dienst- oder Anwendungseigentümers gewähren.

So verwenden Sie z. B. AI-Funktionen innerhalb eines Snowflake Park Container Services (SPCS)-Service, der mit eingeschränkten Aufruferrechten ausgeführt wird:

Gewähren Sie die USE AI FUNCTIONS-Berechtigung für die Rolle, die in der SPCS-Sitzung verwendet wird (z. B.``CHATBOT_USER_ROLE``):
```
GRANT USE AI FUNCTIONS ON ACCOUNT TO ROLE CHATBOT_USER_ROLE;
```
Weisen Sie der Rolle des Diensteigentümers die Aufruferversion der Berechtigung zu:
```
GRANT CALLER USE AI FUNCTIONS ON ACCOUNT TO ROLE <service_owner_role>;
```

CORTEX_USER-Datenbankrollen¶

Die Datenbankrolle CORTEX_USER in der SNOWFLAKE-Datenbank beinhaltet die Berechtigungen, die es dem Benutzenden erlauben, Snowflake Cortex-AI-Funktionen aufzurufen. Die Rolle CORTEX_USER ist standardmäßig der Rolle PUBLIC zugewiesen. Die Rolle PUBLIC wird automatisch allen Benutzern und Rollen zugewiesen, sodass allen Benutzern in Ihrem Konto die Nutzung der Snowflake Cortex-Funktionen-AI ermöglicht wird.

Wenn Sie nicht möchten, dass alle Benutzer diese Berechtigung haben, können Sie den Zugriff auf die PUBLIC-Rolle widerrufen und den Zugriff für andere Rollen gewähren. Die Datenbankrolle SNOWFLAKE-CORTEX_USER kann einem Benutzer nicht direkt zugewiesen werden. Weitere Informationen dazu finden Sie unter Verwenden von SNOWFLAKE-Datenbankrollen.

Um der Rolle PUBLIC die Datenbankrolle CORTEX_USER zu entziehen, führen Sie die folgenden Befehle mit der Rolle ACCOUNTADMIN aus:

REVOKE DATABASE ROLE SNOWFLAKE.CORTEX_USER
  FROM ROLE PUBLIC;

REVOKE IMPORTED PRIVILEGES ON DATABASE SNOWFLAKE
  FROM ROLE PUBLIC;

Sie können dann selektiv bestimmten Rollen Zugriff gewähren. Ein Benutzer mit der Rolle ACCOUNTADMIN kann diese Rolle einer kundenspezifischen Rolle zuweisen, um Benutzern den Zugriff auf die Funktionen von Cortex AI zu ermöglichen. Im folgenden Beispiel verwenden Sie die Rolle ACCOUNTADMIN und weisen dem Benutzer some_user die Datenbankrolle CORTEX_USER über die Kontorolle cortex_user_role zu, die Sie zu diesem Zweck erstellen.

USE ROLE ACCOUNTADMIN;

CREATE ROLE cortex_user_role;
GRANT DATABASE ROLE SNOWFLAKE.CORTEX_USER TO ROLE cortex_user_role;

GRANT ROLE cortex_user_role TO USER some_user;

Sie können den Zugriff auf die Snowflake Cortex-AI-Funktionen auch über bestehende Rollen gewähren, die häufig von bestimmten Benutzergruppen verwendet werden. (siehe Benutzerrollen). Wenn Sie beispielsweise eine analyst-Rolle erstellt haben, die von Analysten in Ihrer Organisation als Standardrolle verwendet wird, können Sie diesen Benutzenden mit einer einzigen GRANT-Anweisung schnell Zugriff auf die Snowflake Cortex-AI-Funktionen gewähren.

GRANT DATABASE ROLE SNOWFLAKE.CORTEX_USER TO ROLE analyst;

AI_FUNCTIONS_USER-Datenbankrollen¶

Die AI_FUNCTIONS_USER-Datenbankrolle in der SNOWFLAKE-Datenbank ermöglicht es Benutzenden, skalare AI-Funktionen von Snowflake Cortex (alle Cortex AI -Funktionen mit Ausnahme der Aggregatfunktionen AI_AGG undAI_SUMMARIZE_AGG) aufzurufen, ohne Zugriff auf Cortex Services wie Cortex Agent, Cortex Analyst, Cortex Fine-tuning oder Cortex Search zu gewähren.

Wichtig

Your users need both the USE AI FUNCTIONS account-level privilege plus one of CORTEX_USER and AI_FUNCTIONS_USER database role to call Snowflake Cortex AI functions. Because USE AI FUNCTIONS is granted to the PUBLIC role by default, no additional action is needed for this privilege unless it has been revoked.

Die Rolle AI_FUNCTIONS_USER ist der Rolle PUBLIC standardmäßig nicht zugewiesen. Der Kontoadmin muss diese Rolle explizit Rollen zuweisen, die Zugriff auf AI-Funktionen benötigen. Die Datenbankrolle AI_FUNCTIONS_USER kann Benutzern nicht direkt zugewiesen werden, sondern muss Rollen zugewiesen werden, die Benutzer übernehmen können. Weitere Informationen dazu finden Sie unter Verwenden von SNOWFLAKE-Datenbankrollen.

Im folgenden Beispiel wird eine kundenspezifische Rolle erstellt, der die AI_FUNCTIONS_USER-Datenbankrolle zugewiesen wird, und die Rolle wird dann einem Benutzenden zugewiesen.

USE ROLE ACCOUNTADMIN;

CREATE ROLE analyst_rl;
GRANT DATABASE ROLE SNOWFLAKE.AI_FUNCTIONS_USER TO ROLE analyst_rl;

GRANT ROLE analyst_rl TO USER some_user;

Um allen Benutzenden Zugriff auf die skalaren AI-Funktionen zu geben, können Sie der PUBLIC-Rolle die AI_FUNCTIONS_USER-Rolle zuweisen.

USE ROLE ACCOUNTADMIN;

GRANT DATABASE ROLE SNOWFLAKE.AI_FUNCTIONS_USER TO ROLE PUBLIC;

CORTEX_EMBED_USER-Datenbankrollen¶

Die Datenbankrolle CORTEX_EMBED_USER in der SNOWFLAKE-Datenbank enthält die Berechtigungen, die es Benutzern erlauben, die Funktionen zur Texteinbettung AI_EMBED, EMBED_TEXT_768 und EMBED_TEXT_1024 aufzurufen und Cortex Search Services mit verwalteten Vektoreinbettungen zu erstellen. CORTEX_EMBED_USER ermöglicht es Ihnen, Einbettungsberechtigungen getrennt von anderen Cortex AI-Funktionen zu vergeben.

Bemerkung

Sie können Cortex Search Services mit vom Benutzer bereitgestellten Einbettungen ohne die Rolle CORTEX_EMBED_USER erstellen. In diesem Fall müssen Sie die Einbettungen selbst außerhalb von Snowflake erstellen und in eine Tabelle laden.

Im Gegensatz zur Rolle CORTEX_USER wird die Rolle CORTEX_EMBED_USER standardmäßig nicht der Rolle PUBLIC zugewiesen. Sie müssen diese Rolle ausdrücklich Rollen zuweisen, die Einbettungsmöglichkeiten benötigen, wenn Sie die Rolle CORTEX_USER widerrufen haben. Die Datenbankrolle CORTEX_EMBED_USER kann Benutzern nicht direkt zugewiesen werden, sondern muss Rollen zugewiesen werden, die Benutzer übernehmen können. Das folgende Beispiel veranschaulicht diesen Vorgang.

USE ROLE ACCOUNTADMIN;

CREATE ROLE cortex_embed_user_role;
GRANT DATABASE ROLE SNOWFLAKE.CORTEX_EMBED_USER TO ROLE cortex_embed_user_role;

GRANT ROLE cortex_embed_user_role TO USER some_user;

Um allen Benutzern Zugriff auf die Einbettungsfunktionen zu geben, können Sie alternativ wie folgt die Rolle CORTEX_EMBED_USER für die Rolle PUBLIC zuweisen.

USE ROLE ACCOUNTADMIN;

GRANT DATABASE ROLE SNOWFLAKE.CORTEX_EMBED_USER TO ROLE PUBLIC;

Verwenden von AI-Funktionen in gespeicherten Prozeduren mit EXECUTE AS RESTRICTED CALLER¶

Um AI-Funktionen innerhalb von gespeicherten Prozeduren mit EXECUTE AS RESTRICTED CALLER zu verwenden, erteilen Sie der Rolle, die die gespeicherte Prozedur erstellt hat, die folgenden Berechtigungen:

GRANT INHERITED CALLER USAGE ON ALL SCHEMAS IN DATABASE snowflake TO ROLE <role_that_created_the_stored_procedure>;
GRANT INHERITED CALLER USAGE ON ALL FUNCTIONS IN DATABASE snowflake TO ROLE <role_that_created_the_stored_procedure>;
GRANT CALLER USAGE ON DATABASE snowflake TO ROLE <role_that_created_the_stored_procedure>;

Zugriff auf das Modell kontrollieren¶

Snowflake Cortex bietet zwei unabhängige Mechanismen, um Modellzugriff zu erzwingen:

Parameter für die Zulassungsliste auf Kontoebene (einfache, umfassende Kontrolle)
Rollenbasierte Zugriffssteuerung (RBAC) (fein abgestufte Kontrolle)

Sie können die Zulassungsliste auf Kontoebene verwenden, um den Modellzugriff für Ihr gesamtes Konto zu steuern, oder Sie können RBAC nutzen, um den Modellzugriff pro Rolle zu kontrollieren. Für maximale Flexibilität können Sie auch beide Mechanismen zusammen verwenden, wenn zusätzliche Komplexität bei der Verwaltung für Sie akzeptabel ist.

Parameter für die Zulassungsliste auf Kontoebene¶

Sie können den Modellzugriff für Ihr gesamtes Konto steuern, indem Sie den Parameter CORTEX_MODELS_ALLOWLIST verwenden. Unterstützte Features respektieren den Wert dieses Parameters und verhindern die Verwendung von Modellen, die nicht in der Zulassungsliste enthalten sind.

Der Parameter CORTEX_MODELS_ALLOWLIST kann auf 'All', 'None' oder eine durch Kommas getrennte Liste von Modellnamen festgelegt werden. Dieser Parameter kann nur auf Kontoebene eingestellt werden, nicht auf Benutzer- oder der Sitzungsebene. Nur die Rolle ACCOUNTADMIN kann den Parameter mit dem Befehl ALTER ACCOUNT festlegen.

Beispiele:

So ermöglichen Sie den Zugriff auf alle Modelle:
```
ALTER ACCOUNT SET CORTEX_MODELS_ALLOWLIST = 'All';
```
So ermöglichen Sie den Zugriff auf die Modelle mistral-large2 und llama3.1-70b:
```
ALTER ACCOUNT SET CORTEX_MODELS_ALLOWLIST = 'mistral-large2,llama3.1-70b';
```
So verhindern Sie den Zugriff auf Modelle:
```
ALTER ACCOUNT SET CORTEX_MODELS_ALLOWLIST = 'None';
```

Verwenden Sie RBAC wie im folgenden Abschnitt beschrieben, um bestimmten Rollen Zugriff zu gewähren, der über das hinausgeht, was Sie in der Zulassungsliste angegeben haben.

Rollenbasierte Zugriffssteuerung (RBAC)¶

Obwohl Cortex-Modelle selbst keine Snowflake-Objekte sind, können Sie mit Snowflake Modellobjekte im Schema SNOWFLAKE.MODELS erstellen, das die Cortex-Modelle darstellt. Indem Sie RBAC auf diese Objekte anwenden, können Sie den Modellzugriff auf die gleiche Weise steuern wie bei jedem anderen Snowflake-Objekt. Unterstützte Features akzeptieren die Bezeichner von Objekten in SNOWFLAKE.MODELS überall dort, wo ein Modell angegeben werden kann.

Tipp

Wenn Sie ausschließlich RBAC verwenden möchten, legen Sie CORTEX_MODELS_ALLOWLIST auf 'None' fest.

Modellobjekte und Anwendungsrollen aktualisieren¶

SNOWFLAKE.MODELS wird nicht automatisch mit den Objekten gefüllt, die Cortex-Modelle darstellen. Sie müssen diese Objekte erstellen, wenn Sie RBAC für Modelle zum ersten Mal einrichten, und sie aktualisieren, wenn Sie RBAC auf neue Modelle anwenden möchten.

Führen Sie als ACCOUNTADMIN die gespeicherte Prozedur SNOWFLAKE.MODELS.CORTEX_BASE_MODELS_REFRESH aus, um das Schema SNOWFLAKE.MODELS mit Objekten zu füllen, die die derzeit verfügbaren Cortex-Modelle darstellen, und um Anwendungsrollen zu erstellen, die den Modellen entsprechen. Die Prozedur erstellt auch CORTEX-MODEL-ROLE-ALL – eine Rolle, die alle Modelle abdeckt.

Tipp

Sie können CORTEX_BASE_MODELS_REFRESH jederzeit auf sichere Weise aufrufen; es werden keine doppelten Objekte oder Rollen erstellt.

CALL SNOWFLAKE.MODELS.CORTEX_BASE_MODELS_REFRESH();

Nach Aktualisierung der Modellobjekte können Sie überprüfen, ob die Modelle im Schema SNOWFLAKE.MODELS wie folgt angezeigt werden:

SHOW MODELS IN SNOWFLAKE.MODELS;

Die zurückgegebene Liste der Modelle sieht folgendermaßen aus:


created_on	name	model_type	database_name	schema_name	owner
2025-04-22 09:35:38.558 -0700	CLAUDE-4-5-SONNET	CORTEX_BASE	SNOWFLAKE	MODELS	SNOWFLAKE
2025-04-22 09:36:16.793 -0700	LLAMA3. 1-405B	CORTEX_BASE	SNOWFLAKE	MODELS	SNOWFLAKE
2025-04-22 09:37:18.692 -0700	OPENAI-GPT-5.2	CORTEX_BASE	SNOWFLAKE	MODELS	SNOWFLAKE

Um zu überprüfen, ob Sie die mit diesen Modellen verknüpften Anwendungsrollen anzeigen können, verwenden Sie den Befehl SHOW APPLICATION ROLES wie im folgenden Beispiel:

SHOW APPLICATION ROLES IN APPLICATION SNOWFLAKE;

Die Liste der Anwendungsrollen sieht wie folgt aus:


created_on	name	owner	comment	owner_role_type
2025-04-22 09:35:38.558 -0700	CORTEX-MODEL-ROLE-ALL	SNOWFLAKE	MODELS	APPLICATION
2025-04-22 09:36:16.793 -0700	CORTEX-MODEL-ROLE-LLAMA3. 1-405B	SNOWFLAKE	MODELS	APPLICATION
2025-04-22 09:37:18.692 -0700	CORTEX-MODEL-ROLE-SNOWFLAKE-ARCTIC	SNOWFLAKE	MODELS	APPLICATION

Anwendungsrollen zu Benutzerrollen zuweisen¶

Nachdem Sie die Modellobjekte und Anwendungsrollen erstellt haben, können Sie die Anwendungsrollen bestimmten Benutzerrollen in Ihrem Konto zuweisen.

So gewähren Sie einer Rolle Zugriff auf ein bestimmtes Modell:
```
GRANT APPLICATION ROLE SNOWFLAKE."CORTEX-MODEL-ROLE-LLAMA3.1-70B" TO ROLE MY_ROLE;
```
So gewähren Sie einer Rolle Zugriff auf alle aktuellen und zukünftigen Modelle:
```
GRANT APPLICATION ROLE SNOWFLAKE."CORTEX-MODEL-ROLE-ALL" TO ROLE MY_ROLE;
```

Verwenden Sie Modellobjekte mit unterstützten Features¶

Um Modellobjekte mit unterstützten Cortex-Features zu verwenden, geben Sie den Bezeichner des Modellobjekts in SNOWFLAKE.MODELS als Modellargument an. Sie können einen vollqualifizierten Bezeichner, einen teilweisen Bezeichner oder einen einfachen Modellnamen verwenden, der automatisch in SNOWFLAKE.MODELS aufgelöst wird.

Verwendung eines vollqualifizierten Bezeichners:
```
SELECT AI_COMPLETE('SNOWFLAKE.MODELS."LLAMA3.1-70B"', 'Hello');
```

Verwendung eines teilweisen Bezeichners:

USE DATABASE SNOWFLAKE;
USE SCHEMA MODELS;
SELECT AI_COMPLETE('LLAMA3.1-70B', 'Hello');

Verwenden der automatischen Suche mit einem einfachen Modellnamen:

-- Automatically resolves to SNOWFLAKE.MODELS."LLAMA3.1-70B"
SELECT AI_COMPLETE('llama3.1-70b', 'Hello');

Verwenden von RBAC für die Zulassungsliste des Kontos¶

Eine Reihe von Cortex-Features akzeptieren einen Modellnamen als Zeichenfolgenargument, zum Beispiel AI_COMPLETE('model', 'prompt'). Wenn Sie einen Modellnamen angeben, gilt Folgendes:

Cortex versucht zunächst, ein passendes Modellobjekt in SNOWFLAKE.MODELS zu finden. Wenn Sie einen nicht qualifizierten Namen wie 'x' angeben, sucht das System automatisch nach SNOWFLAKE.MODELS."X".
Wird das Modellobjekt gefunden, wird RBAC angewendet, um zu ermitteln, ob der Benutzer das Modell verwenden kann.
Wird kein Modellobjekt gefunden, wird die angegebene Zeichenfolge mit der Zulassungsliste auf Kontoebene abgeglichen.

Das folgende Beispiel veranschaulicht die kombinierte Verwendung von Zulassungsliste und RBAC. In diesem Beispiel ist die Zulassungsliste so eingestellt, dass das Modell mistral-large2 zugelassen ist, sodass der Benutzer über RBAC Zugriff auf das Modellobjekt LLAMA3.1-70B hat.

-- set up access
USE SECONDARY ROLES NONE;
USE ROLE ACCOUNTADMIN;
ALTER ACCOUNT SET CORTEX_MODELS_ALLOWLIST = 'MISTRAL-LARGE2';
CALL SNOWFLAKE.MODELS.CORTEX_BASE_MODELS_REFRESH();
GRANT APPLICATION ROLE SNOWFLAKE."CORTEX-MODEL-ROLE-LLAMA3.1-70B" TO ROLE PUBLIC;

-- test access
USE ROLE PUBLIC;

-- this succeeds because mistral-large2 is in the allowlist
SELECT AI_COMPLETE('MISTRAL-LARGE2', 'Hello');

-- this succeeds because the role has access to the model object
SELECT AI_COMPLETE('SNOWFLAKE.MODELS."LLAMA3.1-70B"', 'Hello');

-- this fails because the first argument is
-- neither an identifier for an accessible model object
-- nor is it a model name in the allowlist
SELECT AI_COMPLETE('claude-sonnet-4-6', 'Hello');

Häufige Probleme¶

Zugriff auf ein Modell (über Zulassungsliste oder RBAC) bedeutet nicht immer, dass es auch verwendet werden kann. Es kann immer noch regionenübergreifenden, abkündigungsbezogenen oder anderen Verfügbarkeitsbeschränkungen unterliegen. Diese Beschränkungen können zu Fehlermeldungen führen, die ähnlich wie Modellzugriffsfehler aussehen.
Die Modellzugriffssteuerung regelt nur die Verwendung eines Modells und nicht die Nutzung eines Features selbst. Ein Feature kann seine eigene Zugriffssteuerungen haben. So wird der Zugriff auf:code:AI_COMPLETE etwa durch die CORTEX_USER oder die AI_FUNCTIONS_USER-Datenbankrolle und die USE AI FUNCTIONS-Berechtigung auf Kontoebene geregelt. Weitere Informationen dazu finden Sie unter Cortex LLM-Berechtigungen.
Nicht alle Features unterstützen Modellzugriffssteuerungen. Weitere Informationen darüber, was ein Feature unterstützt, finden Sie in der Tabelle :ref:` Unterstützte Features<label-cortex_llm_model_access_supported_features>`.
Sekundärrollen können Berechtigungen verschleiern. Wenn ein Benutzer z. B. ACCOUNTADMIN als Sekundärrolle hat, können alle Modellobjekte zugänglich erscheinen. Deaktivieren Sie Sekundärrollen vorübergehend, wenn Sie Berechtigungen überprüfen.
Qualifizierte Bezeichner für Modellobjekte werden in Anführungszeichen gesetzt, daher muss die Groß-/Kleinschreibung beachtet werden. Weitere Informationen dazu finden Sie unter QUOTED_IDENTIFIERS_IGNORE_CASE.

Unterstützte Features¶

Die Modellzugriffssteuerung wird von folgenden Features unterstützt:


Feature	Zulassungsliste auf Kontoebene	Rollenbasierte Zugriffssteuerung	Anmerkungen
AI_COMPLETE	✔	✔
AI_CLASSIFY	✔	✔	Wenn das Modell, das dieser Funktion zugrunde liegt, nicht zulässig ist, enthält die Fehlermeldung Informationen darüber, wie Sie die Zulassungsliste ändern können.
AI_FILTER	✔	✔	Wenn das Modell, das dieser Funktion zugrunde liegt, nicht zulässig ist, enthält die Fehlermeldung Informationen darüber, wie Sie die Zulassungsliste ändern können.
AI_AGG	✔	✔	Wenn das Modell, das dieser Funktion zugrunde liegt, nicht zulässig ist, enthält die Fehlermeldung Informationen darüber, wie Sie die Zulassungsliste ändern können.
AI_SUMMARIZE_AGG	✔	✔	Wenn das Modell, das dieser Funktion zugrunde liegt, nicht zulässig ist, enthält die Fehlermeldung Informationen darüber, wie Sie die Zulassungsliste ändern können.
COMPLETE (SNOWFLAKE.CORTEX)	✔	✔
TRY_COMPLETE (SNOWFLAKE.CORTEX)	✔	✔
Cortex REST API	✔	✔
Cortex Playground	✔	✔

Regionale Verfügbarkeit¶

Snowflake Cortex-AI-Funktionen sind in den folgenden Regionen verfügbar. Wenn Ihre Region für eine bestimmte Funktion nicht aufgeführt ist, verwenden Sie Regionenübergreifende Inferenz.

Bemerkung

Die Funktion TRY_COMPLETE ist in denselben Regionen verfügbar wie COMPLETE.
Die Funktion AI_COUNT_TOKENS ist in allen Regionen für jedes Modell verfügbar, aber die Modelle selbst sind nur in den in der folgenden Tabellen angegebenen Regionen verfügbar.

Die folgenden Funktionen und Modelle sind in jeder Region über die regionenübergreifende Inferenz verfügbar.


Funktion -Modell	Cloudübergreifend (beliebige Region)	AWS US (Regionsübergreifend)	AWS US Commercial Gov (Regionsübergreifend)	AWS EU (Regionsübergreifend)	AWS-APJ (Regionsübergreifend)	AWS-AU (Regionsübergreifend)	Azure US (Regionsübergreifend)	Azure EU (Regionsübergreifend)
AI_COMPLETE
`claude-opus-4-7`	✔	✔		✔
`claude-sonnet-4-6`	✔	✔		✔	✔
`claude-opus-4-6`	✔	✔		✔		✔
`claude-sonnet-4-5`	✔	✔	✔	✔	✔
`claude-opus-4-5`	✔	✔		✔
`claude-haiku-4-5`	✔	✔	✔	✔	✔
`claude-4-sonnet`	✔	✔	✔	✔	✔
`claude-3-7-sonnet`	✔	✔	✔	✔
`gemini-3.1-pro`	*
`llama4-maverick`	✔	✔
`llama4-scout`	✔	✔
`llama3.1-8b`	✔	✔	✔	✔	✔	✔	✔	✔
`llama3.1-70b`	✔	✔	✔	✔	✔	✔	✔	✔
`llama3.3-70b`	✔	✔
`snowflake-llama-3.3-70b`	✔	✔
`llama3.1-405b`	✔	✔	✔				✔
`openai-gpt-5.2`	✔						✔
`openai-gpt-5.1`	✔						✔	✔
`openai-gpt-5`	*						*	*
`openai-gpt-5-mini`	*						*
`openai-gpt-5-nano`	*						*
`openai-gpt-4.1`	✔						✔
`openai-gpt-oss-120b`	*
`openai-gpt-oss-20b`	*	*
`snowflake-llama-3.1-405b`	✔	✔	✔
`snowflake-arctic`	✔	✔				✔
`deepseek-r1`	✔	✔
`mistral-large2`	✔	✔	✔	✔	✔		✔	✔
`mixtral-8x7b`	✔	✔	✔	✔	✔		✔	✔
`mistral-7b`	✔	✔	✔	✔	✔		✔	✔

EMBED_TEXT_768
`e5-base-v2`	✔	✔	✔	✔	✔		✔	✔
`snowflake-arctic-embed-m`	✔	✔	✔	✔	✔	✔
`snowflake-arctic-embed-m-v1.5`	✔	✔	✔	✔	✔	✔

EMBED_TEXT_1024
`snowflake-arctic-embed-l-v2.0`	✔	✔	✔	✔	✔	✔
`snowflake-arctic-embed-l-v2.0-8k`	✔	✔	✔	✔	✔	✔
`nv-embed-qa-4`	✔	✔
`multilingual-e5-large`	✔	✔	✔	✔	✔	✔
`voyage-multilingual-2`	✔	✔	✔	✔	✔		✔	✔

AI_CLASSIFY TEXT	✔	✔		✔	✔		✔	✔
AI_CLASSIFY IMAGE	✔	✔		✔
AI_EXTRACT	✔	✔		✔	✔	✔	✔
AI_FILTER-TEXT	✔	✔		✔	✔		✔	✔
AI_FILTER-IMAGE	✔	✔		✔
AI_AGG		✔		✔	✔		✔	✔
AI_REDACT	✔	✔	✔	✔	✔		✔	✔
AI_SENTIMENT	✔	✔		✔	✔		✔	✔
AI_SIMILARITY TEXT	✔	✔		✔	✔	✔
AI_SIMILARITY IMAGE	✔	✔		✔				✔
AI_SUMMARIZE_AGG	✔	✔		✔	✔		✔	✔
AI_TRANSCRIBE	✔	✔		✔		✔
SENTIMENT	✔	✔	✔	✔	✔		✔	✔
ENTITY_SENTIMENT	✔	✔	✔	✔	✔		✔	✔
EXTRACT_ANSWER	✔	✔	✔	✔	✔	✔
SUMMARIZE	✔	✔	✔	✔	✔		✔	✔
TRANSLATE	✔	✔	✔	✔	✔		✔	✔
AI_TRANSLATE	✔	✔		✔	✔		✔	✔

Die folgenden Funktionen und Modelle sind nativ in Nordamerika verfügbar.


Funktion -Modell	AWS US West 2 (Oregon)	AWS US East 1 (N. Virginia)	AWS US East (Commercial Gov - N. Virginia)	Azure East US 2 (Virginia)	Azure East US (Virginia)	Azure West US (Washington)	Azure South Central US (Texas)
AI_COMPLETE
`claude-4-sonnet`
`claude-3-7-sonnet`
`llama4-maverick`	✔
`llama4-scout`	✔
`llama3.1-8b`	✔	✔	✔	✔
`llama3.1-70b`	✔	✔	✔	✔
`llama3.3-70b`	✔
`snowflake-llama-3.3-70b`	✔
`llama3.1-405b`	✔	✔	✔	✔
`openai-gpt-4.1`				✔
`openai-gpt-oss-120b`	*
`openai-gpt-oss-20b`	*			*
`snowflake-llama-3.1-405b`	✔
`snowflake-arctic`	✔			✔
`deepseek-r1`	✔
`mistral-large2`	✔	✔	✔	✔
`mixtral-8x7b`	✔	✔	✔	✔
`mistral-7b`	✔	✔	✔	✔

EMBED_TEXT_768
`e5-base-v2`	✔	✔	✔	✔
`snowflake-arctic-embed-m`	✔	✔	✔	✔
`snowflake-arctic-embed-m-v1.5`	✔	✔	✔	✔

EMBED_TEXT_1024
`snowflake-arctic-embed-l-v2.0`	✔	✔	✔	✔
`snowflake-arctic-embed-l-v2.0-8k`	✔	✔	✔	✔
`nv-embed-qa-4`	✔
`multilingual-e5-large`	✔	✔	✔	✔
`voyage-multilingual-2`	✔	✔	✔	✔

AI_CLASSIFY TEXT	✔	✔		✔
AI_CLASSIFY IMAGE	✔	✔
AI_EXTRACT	✔	✔			✔	✔	✔
AI_FILTER-TEXT	✔	✔		✔
AI_FILTER-IMAGE	✔	✔
AI_AGG	✔	✔		✔
AI_REDACT	✔	✔	✔	✔
AI_SIMILARITY TEXT	✔	✔		✔
AI_SIMILARITY IMAGE	✔	✔
AI_SUMMARIZE_AGG	✔	✔		✔
AI_TRANSCRIBE	✔	✔		✔
SENTIMENT	✔	✔	✔	✔
ENTITY_SENTIMENT	✔	✔	✔	✔
EXTRACT_ANSWER	✔	✔	✔	✔
SUMMARIZE	✔	✔	✔	✔
TRANSLATE	✔	✔	✔	✔

Die folgenden Funktionen und Modelle sind nativ in europäischen Regionen verfügbar.


Funktion -Modell	AWS Europe Central 1 (Frankfurt)	AWS Europe West 1 (Ireland)	Azure West Europe (Niederlande)
AI_COMPLETE
`claude-4-sonnet`
`claude-3-7-sonnet`
`llama4-maverick`
`llama4-scout`
`llama3.1-8b`	✔	✔	✔
`llama3.1-70b`	✔	✔	✔
`llama3.3-70b`
`snowflake-llama-3.3-70b`
`llama3.1-405b`
`openai-gpt-4.1`
`openai-gpt-oss-120b`
`openai-gpt-oss-20b`
`snowflake-llama-3.1-405b`
`snowflake-arctic`
`deepseek-r1`
`mistral-large2`	✔	✔	✔
`mixtral-8x7b`	✔	✔	✔
`mistral-7b`	✔	✔	✔

EMBED_TEXT_768
`e5-base-v2`	✔		✔
`snowflake-arctic-embed-m`	✔	✔	✔
`snowflake-arctic-embed-m-v1.5`	✔	✔	✔

EMBED_TEXT_1024
`snowflake-arctic-embed-l-v2.0`	✔	✔	✔
`snowflake-arctic-embed-l-v2.0-8k`	✔	✔	✔
`nv-embed-qa-4`
`multilingual-e5-large`	✔	✔	✔
`voyage-multilingual-2`	✔	✔	✔

AI_CLASSIFY TEXT	✔	✔	✔
AI_CLASSIFY IMAGE	✔
AI_EXTRACT	✔	✔	✔
AI_FILTER-TEXT	✔	✔	✔
AI_FILTER-IMAGE	✔
AI_AGG	✔	✔	✔
AI_REDACT	✔	✔	✔
AI_SIMILARITY TEXT	✔	✔	✔
AI_SIMILARITY IMAGE	✔
AI_SUMMARIZE_AGG	✔	✔	✔
AI_TRANSCRIBE	✔
SENTIMENT	✔	✔	✔
ENTITY_SENTIMENT	✔		✔
EXTRACT_ANSWER	✔	✔	✔
SUMMARIZE	✔	✔	✔
TRANSLATE	✔	✔	✔

Die folgenden Funktionen und Modelle sind nativ in den Regionen des Asien-Pazifik-Raums verfügbar.


Funktion \| Modell	AWS AP Southeast 2 (Sydney)	AWS AP Northeast 1 (Tokio)
AI_COMPLETE
`claude-4-sonnet`
`claude-3-7-sonnet`
`llama4-maverick`
`llama4-scout`
`llama3.1-8b`	✔	✔
`llama3.1-70b`	✔	✔
`llama3.3-70b`
`snowflake-llama-3.3-70b`
`llama3.1-405b`
`openai-gpt-4.1`
`snowflake-llama-3.1-405b`
`snowflake-arctic`
`deepseek-r1`
`mistral-large2`	✔	✔
`mixtral-8x7b`	✔	✔
`mistral-7b`	✔	✔

EMBED_TEXT_768
`e5-base-v2`	✔	✔
`snowflake-arctic-embed-m`	✔	✔
`snowflake-arctic-embed-m-v1.5`	✔	✔

EMBED_TEXT_1024
`snowflake-arctic-embed-l-v2.0`	✔	✔
`snowflake-arctic-embed-l-v2.0-8k`	✔	✔
`nv-embed-qa-4`
`multilingual-e5-large`	✔	✔
`voyage-multilingual-2`	✔	✔

AI_EXTRACT	✔	✔
AI_CLASSIFY TEXT	✔	✔
AI_CLASSIFY IMAGE
AI_FILTER-TEXT	✔	✔
AI_FILTER-IMAGE
AI_AGG	✔	✔
AI_SIMILARITY TEXT	✔	✔
AI_SIMILARITY IMAGE
AI_SUMMARIZE_AGG	✔	✔
AI_TRANSCRIBE
EXTRACT_ANSWER	✔	✔
SENTIMENT	✔	✔
ENTITY_SENTIMENT		✔
SUMMARIZE	✔	✔
TRANSLATE	✔	✔

* Zeigt eine Vorschaufunktion oder ein -modell an. Vorschau-Features sind nicht für Produktions-Workloads geeignet.

Die folgenden Funktionen und Modelle von Snowflake Cortex AI sind derzeit in den folgenden erweiterten Regionen verfügbar.


Funktion -Modell	AWS US East 2 (Ohio)	AWS CA Zentrale 1 (Zentral)	AWS SA East 1 (São Paulo)	AWS Europe West 2 (London)	AWS Europe Central 1 (Frankfurt)	AWS Europe North 1 (Stockholm)	AWS AP Northeast 1 (Tokio)	AWS AP South 1 (Mumbai)	AWS AP Southeast 2 (Sydney)	AWS AP Southeast 3 (Jakarta)	Azure South Central US (Texas)	Azure West US 2 (Washington)	Azure UK South (London)	Azure North Europe (Ireland)	Azure Switzerland North (Zürich)	Azure-Zentrale Indien (Pune)	Azure Japan East (Tokio, Saitama)	Azure Southeast Asia (Singapur)	Azure – Ostaustralien (New South Wales)	Google Cloud Europe West 2 (London)	Google Cloud Europe West 4 (Niederlande)	Google Cloud US Central 1 (Iowa)	Google Cloud US East 4 (N. Virginia)
EMBED_TEXT_768
`snowflake-arctic-embed-m-v1.5`	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
`snowflake-arctic-embed-m`	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
EMBED_TEXT_1024
`multilingual-e5-large`	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
AI_EXTRACT	✔	✔	✔	✔	✔	Nur regionenübergreifend	✔	Nur regionenübergreifend	✔	Nur regionenübergreifend	✔	✔	Nur regionenübergreifend	✔	Nur regionenübergreifend	✔	✔	✔	✔	Nur regionenübergreifend	Nur regionenübergreifend	Nur regionenübergreifend	Nur regionenübergreifend

Die folgende Tabelle listet die Verfügbarkeit von älteren Modellen auf. Diese Modelle sind nicht veraltet und können weiterhin verwendet werden. Snowflake empfiehlt jedoch neuere Modelle für neue Entwicklungen.

Legacy¶
Funktion (Modell)	AWS US West 2 (Oregon)	AWS US East 1 (N. Virginia)	AWS Europe Central 1 (Frankfurt)	AWS AP Southeast 2 (Sydney)	AWS AP Northeast 1 (Tokio)	Azure East US 2 (Virginia)	Azure West Europe (Niederlande)
AI_COMPLETE
`llama3-8b`	✔	✔	✔	✔	✔	✔
`llama3-70b`	✔	✔	✔		✔	✔
`mistral-large`	✔	✔	✔			✔	✔
`openai-o4-mini`						✔

Stagingbereich für Mediendateien erstellen¶

Cortex AI-Funktionen, die Mediendateien (Dokumente, Bilder, Audio- oder Videodateien) verarbeiten, erfordern, dass die Dateien in einem internen oder externen Stagingbereich gespeichert werden. Der Stagingbereich muss eine serverseitige Verschlüsselung verwenden. Wenn Sie den Stagingbereich abfragen oder alle dort gespeicherten Dateien programmgesteuert verarbeiten möchten, muss der Stagingbereich über eine Verzeichnistabelle verfügen.

Durch das SQL unten wird ein geeigneter interner Stagingbereich erstellt:

CREATE OR REPLACE STAGE input_stage
  DIRECTORY = ( ENABLE = true )
  ENCRYPTION = ( TYPE = 'SNOWFLAKE_SSE' );

Um Dateien aus einem externen Objektspeicher (z. B. Amazon S3) zu verarbeiten, erstellen Sie eine Speicherintegration, und erstellen dann einen externen Stagingbereich, der die Speicherintegration verwendet. Wie Sie eine Snowflake-Speicherintegration konfigurieren, erfahren Sie in unseren ausführlichen Anleitungen:

Erstellen Sie einen externen Stagingbereich, der auf die Integration verweist und auf Ihren Cloudspeichercontainer zeigt. Dieses Beispiel zeigt auf einen Amazon S3-Bucket:

CREATE OR REPLACE STAGE my_aisql_media_files
  STORAGE_INTEGRATION = my_s3_integration
  URL = 's3://my_bucket/prefix/'
  DIRECTORY = ( ENABLE = TRUE )
  ENCRYPTION = ( TYPE = 'AWS_SSE_S3' );

Mit einem erstellten internen oder externen Stagingbereich und den dort gespeicherten Dateien können Sie Cortex AI-Funktionen zur Verarbeitung von im Stagingbereich gespeicherten Mediendateien verwenden. Weitere Informationen dazu finden Sie unter:

Bemerkung

AI-Funktionen sind derzeit nicht mit kundenspezifischen Netzwerkrichtlinien kompatibel.

Best Practices zum Speichern von Cortex AI-Funktionen¶

Möglicherweise sind die folgenden Best Practices hilfreich, wenn Sie mit Mediendateien in Stagingbereichen mit Cortex AI-Funktionen arbeiten:

Erstellen Sie ein Schema für die Organisation der Mediendateien in Stagingbereichen. Erstellen Sie z. B. für jedes Team oder Projekt einen separaten Stagingbereich, und speichern Sie die verschiedenen Arten von Mediendateien in Unterverzeichnissen.
Aktivieren Sie Verzeichnislisten für Stagingbereiche, um Abfragen und programmgesteuerten Zugriff auf deren Dateien zu ermöglichen.

Tipp

Um die Verzeichnistabelle für den externen Stagingbereich automatisch zu aktualisieren, wenn neue oder aktualisierte Dateien verfügbar sind, Legen Sie AUTO_REFRESH beim Erstellen des Stagingbereichs auf TRUE fest.
Verwenden Sie für externe Stagingbereiche fein abgestufte Richtlinien auf Cloudanbieterseite (z. B. AWS IAM-Richtlinien), um den Zugriff der Speicherintegration auf das Nötigste zu beschränken.
Verwenden Sie stets Verschlüsselung, wie z. B. AWS_SSE oder SNOWFLAKE_SSE, um Ihre Daten im Ruhezustand zu schützen.

Hinweise zu Kosten¶

Snowflake Cortex-AI-Funktionen verursachen Computekosten, die sich nach der Anzahl der verarbeiteten Token richten. Die Kosten für jede Funktion in Credits pro Million Token finden Sie in der Snowflake Service Consumption Table.

Ein Token ist die kleinste Texteinheit, die von den Snowflake Cortex-AI-Funktionen verarbeitet wird. Eine Branchenkonvention für Text ist, dass ein Token ungefähr vier Zeichen entspricht, obwohl dies je nach Modell variieren kann, ebenso wie die Token-Äquivalenz bei Mediendateien.

Bei Funktionen, die neuen Text anhand von bereitgestelltem Text generieren (AI_COMPLETE, AI_CLASSIFY, AI_FILTER, AI_AGG, AI_SUMMARIZE und AI_TRANSLATE und ihren Vorgängerversionen im SNOWFLAKE.CORTEX-Schema), sind sowohl Eingabe- als auch Ausgabe-Token abrechenbar.
Bei Cortex Guard werden nur Eingabe-Token gezählt. Die Anzahl der Eingabe-Token basiert auf der Anzahl der Token, die von AI_COMPLETE oder COMPLETE ausgegeben werden. Die Nutzung von Cortex Guard wird zusätzlich zu den Kosten der FunktionAI_COMPLETE (oder COMPLETE) in Rechnung gestellt.
Bei AI_SIMILARITY, AI_EMBED und den Funktionen SNOWFLAKE.CORTEX.EMBED_* werden nur die Eingabe-Token gezählt.
Bei EXTRACT_ANSWER ergibt sich die Anzahl der abrechenbaren Token aus der Summe der Anzahl der Token in den Feldern from_text und question.
AI_CLASSIFY, AI_FILTER, AI_AGG, AI_SENTIMENT, AI_SUMMARIZE_AGG, SUMMARIZE, TRANSLATE, AI_TRANSLATE, EXTRACT_ANSWER, ENTITY_SENTIMENT und SENTIMENT fügen dem Eingabetext einen Prompt hinzu, um die Antwort zu generieren. Daher ist die Anzahl der abgerechneten Token höher als die Anzahl der Token in dem von Ihnen bereitgestellten Text.
AI_CLASSIFY-Beschriftungen, Beschreibungen und Beispiele werden als Eingabe-Token für jeden verarbeiteten Datensatz gezählt, nicht nur einmal für jeden Aufruf von AI_CLASSIFY.
Bei AI_PARSE_DOCUMENT (oder SNOWFLAKE.CORTEX.PARSE_DOCUMENT) erfolgt die Abrechnung auf der Grundlage der Anzahl der verarbeiteten Dokumentseiten.
TRY_COMPLETE (SNOWFLAKE.CORTEX) verursacht keine Kosten für die Fehlerbehandlung. Wenn die Funktion TRY_COMPLETE (SNOWFLAKE.CORTEX NULL zurückgibt, fallen keine Kosten an.
Bei AI_EXTRACT werden sowohl Eingabe- als auch Ausgabe-Token gezählt. Das Argument responseFormat wird als Eingabe-Token gezählt. Bei Dokumentformaten, die aus Seiten bestehen, wird die Anzahl der verarbeiteten Seiten als Eingabe-Token gezählt. Jede Seite in einem Dokument wird als 970 Token gezählt.
AI_COUNT_TOKENS verursacht nur Kosten für die Ausführung der Funktion. Es fallen keine zusätzlichen Kosten für Token an.

Für Modelle, die Mediendateien wie Bilder oder Audio unterstützen, gilt Folgendes:

Autodateien werden mit 50 Token pro Sekunde Audiodaten abgerechnet.
Die Token-Äquivalenz von Bildern richtet sich nach dem verwendeten Modell. Weitere Informationen dazu finden Sie unter Überlegungen zu den AI-Bildkosten.

Snowflake empfiehlt die Ausführung von Abfragen, die die Snowflake Cortex AI-Funktion aufrufen, mit einem kleineren Warehouse (nicht größer als MEDIUM). Größere Warehouses erhöhen die Leistung nicht. Die Kosten, die mit dem kontinuierlichen Ausführen eines Warehouses verbunden sind, fallen auch dann an, wenn eine Abfrage ausgeführt wird, die eine Snowflake Cortex-LLM-Funktion aufruft. Allgemeine Informationen zu Computekosten finden Sie unter Erläuterungen zu Computekosten.

Warehouse-Dimensionierung¶

Snowflake empfiehlt, eine Warehouse-Größe von maximal MEDIUM beim Aufrufen von Snowflake Cortex AI-Funktionen zu verwenden. Die Verwendung eines größeren Warehouse als nötig erhöht nicht die Leistung, sondern kann zu unnötigen Kosten führen. Diese Empfehlung kann sich in Zukunft ändern, da wir die Cortex AI-Funktionen stetig weiterentwickeln.

Kosten für KI-Dienste verfolgen¶

Um die Credits zu verfolgen, die Sie für die KI-Dienste einschließlich LLM-Funktionen in Ihrem Konto verwendet haben, verwenden Sie die Ansicht METERING_HISTORY:

SELECT *
  FROM SNOWFLAKE.ACCOUNT_USAGE.METERING_DAILY_HISTORY
  WHERE SERVICE_TYPE='AI_SERVICES';

Verfolgen des Credit-Verbrauchs für Cortex AI-Funktionen¶

Um den Credit- und Token-Verbrauch für jeden AI-Funktionsaufruf zu sehen, verwenden Sie den Ansicht CORTEX_FUNCTIONS_USAGE_HISTORY:

SELECT *
  FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_USAGE_HISTORY;

Sie können auch den Credit- und Token-Verbrauch für jede Abfrage in Ihrem Snowflake Konto einsehen. Die Anzeige des Credit- und Token-Verbrauchs für jede Abfrage hilft Ihnen, die Abfragen zu identifizieren, die die meisten Credits und Token verbrauchen.

Die folgende Beispielabfrage verwendet Ansicht CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY, um den Credit- und Token-Verbrauch für alle Ihre Abfragen innerhalb Ihres Kontos anzuzeigen.

SELECT * FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY;

Sie können die gleiche Ansicht auch verwenden, um den Credit- und Token-Verbrauch für eine bestimmte Abfrage anzuzeigen.

SELECT * FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY
WHERE query_id='<query-id>';

Bemerkung

Sie können keine detaillierten Informationen über die Nutzung von Anfragen erhalten, die mit der REST API gemacht wurden.

Der Verlauf der Abfrage wird nach den in der Abfrage verwendeten Modellen gruppiert. Wenn Sie zum Beispiel Folgendes ausgeführt haben:

SELECT AI_COMPLETE('mistral-7b', 'Is a hot dog a sandwich'), AI_COMPLETE('mistral-large', 'Is a hot dog a sandwich');

Der Abfrage-Nutzungsverlauf würde zwei Zeilen anzeigen, eine für mistral-7b und eine für mistral-large.

Modelleinschränkungen¶

Für die von Snowflake Cortex verwendeten Modelle gelten die in der nachstehenden Tabelle beschriebenen Größenbeschränkungen. Die Größen sind in Anzahl von Token angegeben. Branchenüblichen Schätzungen zufolge steht ein Token in der Regel für etwa vier Zeichen Text, sodass die Anzahl der Wörter, die einer Tokenbeschränkung entsprechen, geringer ist als die Anzahl der Token. Eingaben, die die Beschränkung des Kontextfensters überschreiten, führen zu einem Fehler. Eine Ausgabe, die die Kontextfensterbeschränkung überschreitet, wird abgeschnitten.

Die maximale Größe der Ausgabe, die ein Modell erzeugen kann, ist durch Folgendes begrenzt:

Das Limit für das Ausgabe-Token des Modells.
Der im Kontextfenster verfügbare Platz, nachdem das Modell die Eingabe-Token verbraucht hat.

Beispielsweise hat claude-3-7-sonnet ein Kontextfenster von 200.000 Token. Wenn 100.000 Token für die Eingabe verwendet werden, kann das Modell bis zu 8.192 Token generieren. Wenn jedoch 195.000 Token als Eingabe verwendet werden, kann das Modell nur bis zu 5.000 Token für insgesamt 200.000 Token generieren.

Wichtig

In der Region AWS AP Southeast 2 (Sydney):

das Kontextfenster für llama3-8b und mistral-7b beträgt 4.096 Token.
das Kontextfenster für llama3.1-8b beträgt 16.384 Token.
das Kontextfenster für das von Snowflake verwaltete Modell aus der Funktion SUMMARIZE beträgt 4.096 Token.

In der Region AWS Europa West 1 (Irland):

das Kontextfenster für llama3.1-8b beträgt 16.384 Token.
das Kontextfenster für mistral-7b beträgt 4.096 Token.


Funktion	Modell	Kontextfenster (Token)	Maximale Ausgabe (Token)
AI_COMPLETE	`llama4-maverick`	128,000	8,192
	`llama4-scout`	128,000	8,192
	`snowflake-arctic`	4,096	8,192
	`deepseek-r1`	32,768	8,192
	`claude-sonnet-4-6`	1.000.000	128,000
	`claude-opus-4-7`	1.000.000	128,000
	`claude-opus-4-6`	1.000.000	128,000
	`claude-sonnet-4-5`	200,000	64,000
	`claude-haiku-4-5`	200,000	64,000
	`claude-opus-4-5`	200,000	64,000
	`claude-4-sonnet`	200,000	32,000
	`claude-3-7-sonnet`	200,000	32,000
	`gemini-3.1-pro`	1.000.000	64,000
	`mistral-large`	32,000	8,192
	`mistral-large2`	128,000	8,192
	`openai-o4-mini`	200,000	32,000
	`openai-gpt-5.1`	272.000	8,192
	`openai-gpt-5`	272.000	8,192
	`openai-gpt-5-mini`	272.000	8,192
	`openai-gpt-5-nano`	272.000	8,192
	`openai-gpt-5-chat`	128,000	8,192
	`openai-gpt-4.1`	128,000	32,000
	`openai-gpt-oss-120b`	128,000	8,192
	`openai-gpt-oss-20b`	128,000	8,192
	`mixtral-8x7b`	32,000	8,192
	`llama3-8b`	8,000	8,192
	`llama3-70b`	8,000	8,192
	`llama3.1-8b`	128,000	8,192
	`llama3.1-70b`	128,000	8,192
	`llama3.3-70b`	128,000	8,192
	`snowflake-llama-3.3-70b`	128,000	8,192
	`llama3.1-405b`	128,000	8,192
	`snowflake-llama-3.1-405b`	8,000	8,192
	`mistral-7b`	32,000	8,192
EMBED_TEXT_768	`e5-base-v2`	512	k.A.
	`snowflake-arctic-embed-m`	512	k.A.
EMBED_TEXT_1024	`nv-embed-qa-4`	512	k.A.
	`multilingual-e5-large`	512	k.A.
	`voyage-multilingual-2`	32,000	k.A.
AI_EXTRACT	`arctic-extract`	128,000	51.200
AI_FILTER	Snowflake-verwaltetes Modell	128,000	k.A.
AI_CLASSIFY	Snowflake-verwaltetes Modell	128,000	k.A.
AI_AGG	Snowflake-verwaltetes Modell	128.000 pro Zeile kann über mehrere Zeilen verwendet werden	8,192
AI_SENTIMENT	Snowflake-verwaltetes Modell	2,048	k.A.
AI_SUMMARIZE_AGG	Snowflake-verwaltetes Modell	128.000 pro Zeile kann über mehrere Zeilen verwendet werden	8,192
ENTITY_SENTIMENT	Snowflake-verwaltetes Modell	2,048	k.A.
EXTRACT_ANSWER	Snowflake-verwaltetes Modell	2.048 für Text 64 für Frage	k.A.
SENTIMENT	Snowflake-verwaltetes Modell	512	k.A.
SUMMARIZE	Snowflake-verwaltetes Modell	32,000	4,096
TRANSLATE	Snowflake-verwaltetes Modell	4,096	k.A.

Auswählen eines Modells¶

Die Snowflake Cortex-Funktion AI_COMPLETE unterstützt mehrere Modelle mit unterschiedlichen Fähigkeiten, Latenzen und Kosten. Diese Modelle wurden sorgfältig ausgewählt, um den gängigen Anwendungsfällen der Kunden gerecht zu werden. Um die beste Leistung pro Credit zu erzielen, wählen Sie ein Modell, das gut zu Umfang und Komplexität des Inhalts Ihrer Aufgabe passt. Im Folgenden finden Sie einen kurzen Überblick über die verfügbaren Modelle.

Große Modelle¶

Wenn Sie nicht sicher sind, wo Sie anfangen sollen, probieren Sie zunächst die leistungsfähigsten Modelle aus, um eine Grundlage für die Bewertung anderer Modelle zu schaffen. claude-3-7-sonnet, und mistral-large2 sind die leistungsfähigsten Modelle, die Snowflake Cortex anbietet, und die Ihnen einen guten Eindruck davon vermitteln, was ein modernes Modell leisten kann.

Claude 4-6 Sonnet ist ein führendes Modell im Bereich des logischen Denkens und der multimodalen Fähigkeiten. Es übertrifft seine Vorgänger bei Aufgaben, die Argumentation über verschiedene Bereiche und Modalitäten hinweg erfordern. Sie können seine große Ausgabekapazität nutzen, um mehr Informationen entweder aus strukturierten oder unstrukturierten Abfragen zu erhalten. Dank seiner Argumentationsfähigkeiten und des großen Kontextfenster eignet es sich gut für Agent-Workflows.
deepseek-r1 ist ein Basismodell, das mit Large-Scale Reinforcement-Learning (RL) ohne überwachte Feinabstimmung (SFT) trainiert wurde. Es kann hohe Leistungen bei Mathematik-, Code- und Denkaufgaben erbringen. Um auf das Modell zuzugreifen, setzen Sie den regionsübergreifenden Inferenzparameter auf AWS_US.
mistral-large2 ist das fortschrittlichste große Sprachmodell von Mistral AImit erstklassigen Argumentationsfähigkeiten. Im Vergleich zu mistral-large ist es wesentlich leistungsfähiger in den Bereichen Codegenerierung, Mathematik und Argumentation und bietet eine viel stärkere Unterstützung für mehrere Sprachen.. Es eignet sich ideal für komplexe Aufgaben, die umfangreiche Argumentationsfähigkeiten erfordern oder hochspezialisiert sind, wie z. B. die Generierung synthetischer Texte, Codegenerierung und mehrsprachige Textanalyse.
snowflake-llama3.1-405b ist ein Modell, das vom Open-Source-Modell lama3.1 abgeleitet ist. Es verwendet die SwiftKV-Optimierungen, die vom Snowflake-AI-Forschungsteam entwickelt wurden, um die Inferenzkosten um bis zu 75 % zu senken. SwiftKV erreicht einen höheren Durchsatz bei minimalem Genauigkeitsverlust.

Mittlere Modelle¶

llama3.1-70b ist ein Open-Source-Modell, das modernste Leistung bietet und ideal für Chat-Anwendungen, Content-Erstellung und Unternehmensanwendungen ist. Es ist ein hochleistungsfähiges, kosteneffizientes Modell, das mit einem Kontextfenster von 128 K verschiedene Anwendungsfälle ermöglicht. llama3-70b wird weiterhin unterstützt und hat ein Kontextfenster von 8 K.
snowflake-llama3.3-70b ist ein Modell, das vom Open-Source-Modell lama3.3 abgeleitet ist. Es verwendet die SwiftKV-Optimierungen, die vom Snowflake-AI-Forschungsteam entwickelt wurden, um die Inferenzkosten um bis zu 75 % zu senken. SwiftKV erreicht einen höheren Durchsatz bei minimalem Genauigkeitsverlust.
mixtral-8x7b ist ideal für Textgenerierung, Klassifizierung und die Beantwortung von Fragen. Die Mistral-Modelle sind für niedrige Latenzen und geringen Arbeitsspeicherbedarf optimiert, was sich in einem höheren Durchsatz für Anwendungsfälle in großen Unternehmen niederschlägt.

Kleine Modelle¶

llama3.1-8b ist ideal für Aufgaben, die geringes bis mittleres logisches Denken erfordern. Es ist ein leichtes, ultraschnelles Modell mit einem Kontextfenster von 128K. llama3-8b bietet ein kleineres Kontextfenster und eine relativ geringere Präzision.
mistral-7b ist ideal für Ihre einfachsten Zusammenfassungs-, Strukturierungs- und Fragebeantwortungsaufgaben geeignet, die schnell erledigt werden müssen. Mit seinem 32K-Kontextfenster bietet es niedrige Latenzen und einen hohen Durchsatz bei der Verarbeitung mehrerer Textseiten.

Die folgende Tabelle bietet Informationen dazu, wie gängige Modelle bei verschiedenen Benchmarks abschneiden, einschließlich die von Snowflake Cortex-AI_COMPLETE angebotenen Modelle sowie einige andere beliebte Modelle.


Modell	Kontextfenster (Token)	MMLU (Begründungen)	HumanEval (Codierung)	GSM8K (Arithmetisches Rechnen)	Spider 1.0 (SQL)
GPT 4.o	128,000	88,7	90,2	96,4	-
Claude 3.5 Sonett	200,000	88,3	92,0	96,4	-
llama3.1-405b	128,000	88,6	89	96,8	-
llama3.1-70b	128,000	86	80,5	95,1	-
mistral-large2	128,000	84	92	93	-
llama3.1-8b	128,000	73	72,6	84,9	-
mixtral-8x7b	32,000	70,6	40,2	60,4	-
Snowflake Arctic	4,096	67,3	64,3	69,7	79
mistral-7b	32,000	62,5	26,2	52,1	-
GPT 3.5 Turbo^*	4,097	70	48,1	57,1	-

Frühere Modellversionen¶

Die Snowflake Cortex-Funktionen AI_COMPLETE und COMPLETE unterstützen auch die folgenden älteren Modellversionen. Wir empfehlen, die neuesten Modellversionen anstelle der in dieser Tabelle aufgeführten Versionen zu verwenden.


Modell	Kontextfenster (Token)	MMLU (Begründungen)	HumanEval (Codierung)	GSM8K (Arithmetisches Rechnen)	Spider 1.0 (SQL)
mistral-large	32,000	81,2	45,1	81	81
llama-2-70b-chat	4,096	68,9	30,5	57,5	-

Verwenden von Snowflake Cortex-AI-Funktionen mit Python¶

Cortex AI-Funktionen in Snowpark Python aufrufen¶

Sie können die Snowflake Cortex AI-Funktionen in der Snowpark Python-API verwenden. Zu diesen Funktionen gehören die folgenden. Beachten Sie, dass die Funktionen in Snowpark Python Namen im Python-Format „snake_case“ aufweisen, das heißt, Wörter sind durch Unterstriche getrennt und alle Buchstaben werden in Kleinbuchstaben geschrieben.

`ai_agg`-Beispiel¶

Die Funktion ai_agg aggregiert eine Textspalte unter Verwendung von Anweisungen in natürlicher Sprache – ähnlich wie Sie einen Analysten bitten würden, Ergebnisse aus gruppierten oder nicht gruppierten Daten zusammenzufassen oder zu extrahieren.

Im folgenden Beispiel werden Kundenbewertungen für jedes Produkt unter Verwendung der Funktion ai_agg zusammengefasst. Die Funktion benötigt eine Textspalte und eine Anweisung in natürlicher Sprache, um die Bewertungen zusammenzufassen.

from snowflake.snowpark.functions import ai_agg, col

df = session.create_dataframe([
    [1, "Excellent product!"],
    [1, "Great battery life."],
    [1, "A bit expensive but worth it."],
    [2, "Terrible customer service."],
    [2, "Won’t buy again."],
], schema=["product_id", "review"])

# Summarize reviews per product
summary_df = df.group_by("product_id").agg(
    ai_agg(col("review"), "Summarize the customer reviews in one sentence.")
)
summary_df.show()

Bemerkung

Verwenden Sie Aufgabenbeschreibungen, die detailliert und auf den Anwendungsfall ausgerichtet sind. Beispiel: „Zusammenfassen des Kundenfeedbacks für einen Eigentümerbericht“.

Text mit `ai_classify` klassifizieren¶

Die Funktion ai_classify klassifiziert eine Zeichenfolge oder ein Bild in die von Ihnen definierten Kategorien.

Das folgende Beispiel klassifiziert Reiseberichte in Kategorien wie „Reisen“ und „Kochen“. Die Funktion nimmt eine Textspalte und eine Liste von Kategorien an, in die der Text klassifiziert werden soll.

from snowflake.snowpark.functions import ai_classify, col

df = session.create_dataframe([
    ["I dream of backpacking across South America."],
    ["I made the best pasta yesterday."],
], schema=["sentence"])

df = df.select(
    "sentence",
    ai_classify(col("sentence"), ["travel", "cooking"]).alias("classification")
)
df.show()

Bemerkung

Sie können bis zu 500 Kategorien angeben. Sie können sowohl Text als auch Bilder klassifizieren.

Zeilen mit `ai_filter` filtern¶

Die Funktion ai_filter wertet eine Bedingung in natürlicher Sprache aus und gibt True oder False zurück. Sie können damit Zeilen filtern oder taggen.

from snowflake.snowpark.functions import ai_filter, prompt, col

df = session.create_dataframe(["Canada", "Germany", "Japan"], schema=["country"])

filtered_df = df.select(
    "country",
    ai_filter(prompt("Is {0} in Asia?", col("country"))).alias("is_in_asia")
)
filtered_df.show()

Bemerkung

Sie können sowohl nach Zeichenfolgen als auch nach Dateien filtern. Für dynamische Eingabeaufforderungen verwenden Sie die Funktion prompt. Weitere Informationen dazu finden Sie unter Referenz zu Snowpark Python.

Cortex AI-Funktionen in Snowflake ML aufrufen¶

Snowflake ML enthält die älteren AI-Funktionen, deren Namen nicht mit „AI“ beginnen. Diese Funktionen werden ab Version 1.1.2 von Snowflake ML unterstützt. Die Namen werden im Python-Format „snake_case“ gerendert, das heißt, Wörter sind durch Unterstriche getrennt und alle Buchstaben werden in Kleinbuchstaben geschrieben.

Wenn Sie Ihr Python-Skript außerhalb von Snowflake ausführen, müssen Sie eine Snowpark-Sitzung erstellen, um diese Funktionen nutzen zu können. Eine Anleitung dazu finden Sie unter Verbinden mit Snowflake.

Einzelne Werte verarbeiten¶

Das folgende Python-Beispiel zeigt den Aufruf von Snowflake Cortex-AI-Funktionen für einzelne Werte:

from snowflake.cortex import complete, extract_answer, sentiment, summarize, translate

text = """
    The Snowflake company was co-founded by Thierry Cruanes, Marcin Zukowski,
    and Benoit Dageville in 2012 and is headquartered in Bozeman, Montana.
"""

print(complete("llama3.1-8b", "how do snowflakes get their unique patterns?"))
print(extract_answer(text, "When was snowflake founded?"))
print(sentiment("I really enjoyed this restaurant. Fantastic service!"))
print(summarize(text))
print(translate(text, "en", "fr"))

Hyperparameter-Optionen übergeben¶

Sie können Optionen übergeben, die sich auf die Hyperparameter des Modells auswirken, wenn Sie die Funktion complete verwenden. Das folgende Python-Beispiel veranschaulicht die Änderung der maximalen Anzahl von Ausgabe-Token, die das Modell generieren kann:

from snowflake.cortex import complete, CompleteOptions

model_options1 = CompleteOptions(
    {'max_tokens':30}
)

print(complete("llama3.1-8b", "how do snowflakes get their unique patterns?", options=model_options1))

Funktionen für Tabellenspalten aufrufen¶

Sie können eine AI-Funktion für eine Tabellenspalte aufrufen, wie unten gezeigt. Dieses Beispiel erfordert ein Sitzungsobjekt (gespeichert in session) und eine Tabelle articles mit einer Textspalte abstract_text. Das Beispiel erstellt eine neue Spalte abstract_summary mit einer Zusammenfassung des Abstracts.

from snowflake.cortex import summarize
from snowflake.snowpark.functions import col

article_df = session.table("articles")
article_df = article_df.withColumn(
    "abstract_summary",
    summarize(col("abstract_text"))
)
article_df.collect()

Bemerkung

Die erweiterte Form von COMPLETE im Chat-Stil (mehrere Meldungen) wird derzeit in Python von Snowflake ML nicht unterstützt.

Verwendung der Snowflake Cortex-AI-Funktionen mit Snowflake CLI¶

Die Snowflake Cortex AI-Funktionen sind in der Snowflake CLI Version 2.4.0 und höher verfügbar. Unter Einführung in Snowflake CLI finden Sie weitere Informationen zur Verwendung von Snowflake CLI. Die Funktionen sind die alten Funktionen, mit Namen, die nicht mit „AI“ beginnen.

Die folgenden Beispiele veranschaulichen die Verwendung der Befehle snow cortex für einzelne Werte. Der Parameter -c gibt an, welche Verbindung zu verwenden ist.

Bemerkung

Die erweiterte Form von COMPLETE im Chat-Stil (mehrere Meldungen) wird derzeit in Snowflake CLI nicht unterstützt.

snow cortex complete "Is 5 more than 4? Please answer using one word without a period." -c "snowhouse"

snow cortex extract-answer "what is snowflake?" "snowflake is a company" -c "snowhouse"

snow cortex sentiment "Mary had a little Lamb" -c "snowhouse"

snow cortex summarize "John has a car. John's car is blue. John's car is old and John is thinking about buying a new car. There are a lot of cars to choose from and John cannot sleep because it's an important decision for John."

snow cortex translate herb --to pl

Sie können auch Dateien verwenden, die den Text enthalten, den Sie für die Befehle verwenden möchten. Für dieses Beispiel nehmen wir an, dass die Datei about_cortex.txt den folgenden Inhalt hat:

Snowflake Cortex gives you instant access to industry-leading large language models (LLMs) trained by researchers at companies like Anthropic, Mistral, Reka, Meta, and Google, including Snowflake Arctic, an open enterprise-grade model developed by Snowflake.

Since these LLMs are fully hosted and managed by Snowflake, using them requires no setup. Your data stays within Snowflake, giving you the performance, scalability, and governance you expect.

Snowflake Cortex features are provided as SQL functions and are also available in Python. The available functions are summarized below.

COMPLETE: Given a prompt, returns a response that completes the prompt. This function accepts either a single prompt or a conversation with multiple prompts and responses.
EMBED_TEXT_768: Given a piece of text, returns a vector embedding that represents that text.
EXTRACT_ANSWER: Given a question and unstructured data, returns the answer to the question if it can be found in the data.
SENTIMENT: Returns a sentiment score, from -1 to 1, representing the detected positive or negative sentiment of the given text.
SUMMARIZE: Returns a summary of the given text.
TRANSLATE: Translates given text from any supported language to any other.

Sie können dann den Befehl snow cortex summarize ausführen, indem Sie den Dateinamen über den Parameter --file übergeben, wie gezeigt:

snow cortex summarize --file about_cortex.txt

Snowflake Cortex offers instant access to industry-leading language models, including Snowflake Arctic, with SQL functions for completing prompts (COMPLETE), text embedding (EMBED\_TEXT\_768), extracting answers (EXTRACT\_ANSWER), sentiment analysis (SENTIMENT), summarizing text (SUMMARIZE), and translating text (TRANSLATE).

Weitere Informationen zu diesen Befehlen finden Sie unter snow cortex-Befehle.

Rechtliche Hinweise¶

Die Datenklassifizierung der Eingaben und Ausgaben ist in der folgenden Tabelle aufgeführt.


Klassifizierung von Eingabedaten	Klassifizierung von Ausgabedaten	Benennung
Usage Data	Customer Data	Die allgemein verfügbaren Funktionen sind abgedeckte AI-Features. Die Vorschaufunktionen sind Vorschau-AI-Features. [1]

Weitere Informationen dazu finden Sie unter KI und ML in Snowflake.

Snowflake Cortex AI-Funktionen (einschließlich LLM-Funktionen)¶

Verfügbare Funktionen¶

Cortex AI-Funktionen¶

Hilfreiche Funktionen¶

Cortex Guard¶

Hinweise zur Performance¶

Cortex LLM-Berechtigungen¶

USE AI FUNCTIONS für die Kontoberechtigung¶

Verwenden von AI-Funktionen mit eingeschränkten Aufruferrechten¶

CORTEX_USER-Datenbankrollen¶

AI_FUNCTIONS_USER-Datenbankrollen¶

CORTEX_EMBED_USER-Datenbankrollen¶

Verwenden von AI-Funktionen in gespeicherten Prozeduren mit EXECUTE AS RESTRICTED CALLER¶

Zugriff auf das Modell kontrollieren¶

Parameter für die Zulassungsliste auf Kontoebene¶

Rollenbasierte Zugriffssteuerung (RBAC)¶

Modellobjekte und Anwendungsrollen aktualisieren¶

Anwendungsrollen zu Benutzerrollen zuweisen¶

Verwenden Sie Modellobjekte mit unterstützten Features¶

Verwenden von RBAC für die Zulassungsliste des Kontos¶

Häufige Probleme¶

Unterstützte Features¶

Regionale Verfügbarkeit¶

Stagingbereich für Mediendateien erstellen¶

Best Practices zum Speichern von Cortex AI-Funktionen¶

Hinweise zu Kosten¶

Warehouse-Dimensionierung¶

Kosten für KI-Dienste verfolgen¶

Verfolgen des Credit-Verbrauchs für Cortex AI-Funktionen¶

Modelleinschränkungen¶

Auswählen eines Modells¶

Große Modelle¶

Mittlere Modelle¶

Kleine Modelle¶

Frühere Modellversionen¶

Verwenden von Snowflake Cortex-AI-Funktionen mit Python¶

Cortex AI-Funktionen in Snowpark Python aufrufen¶

ai_agg-Beispiel¶

Text mit ai_classify klassifizieren¶

Zeilen mit ai_filter filtern¶

Cortex AI-Funktionen in Snowflake ML aufrufen¶

Einzelne Werte verarbeiten¶

Hyperparameter-Optionen übergeben¶

Funktionen für Tabellenspalten aufrufen¶

Verwendung der Snowflake Cortex-AI-Funktionen mit Snowflake CLI¶

Rechtliche Hinweise¶

`ai_agg`-Beispiel¶

Text mit `ai_classify` klassifizieren¶

Zeilen mit `ai_filter` filtern¶