- Kategorien:
Zeichenfolgen- und Binärfunktionen (AI-Funktionen)
AI_EMBED¶
Bemerkung
AI_EMBED ist die aktualisierte Version von EMBED_TEXT_1024 (SNOWFLAKE.CORTEX) and EMBED_TEXT_768 (SNOWFLAKE.CORTEX). Die neueste Funktionalität finden Sie unter AI_EMBED.
Erstellt einen Einbettungsvektor aus Text oder einem Bild. Einbettungen sind abstrakte numerische Darstellungen der Merkmale eines Textteils oder eines Bildes, die verwendet werden können, um den Grad der Ähnlichkeit zwischen Text- oder Bildteilen zu bestimmen. Die Einbettungen können dann für semantische Suchen, Clustering, die Klassifizierung und andere Aufgaben verwendet werden.
Regionsverfügbarkeit¶
Die folgende Tabelle zeigt die Regionen, in denen Sie die verwenden können AI_EMBED-Funktion für Text und Bilder verwenden können:
Datentyp
|
AWS US West 2
(Oregon)
|
AWS US East 1
(N. Virginia)
|
AWS Europe Central 1
(Frankfurt)
|
AWS Europe West 1
(Ireland)
|
AWS AP Southeast 2
(Sydney)
|
AWS AP Northeast 1
(Tokio)
|
Azure East US 2
(Virginia)
|
Azure West Europe
(Niederlande)
|
AWS
(Regionsübergreifend)
|
---|---|---|---|---|---|---|---|---|---|
Text
|
✔ |
✔ |
✔ |
✔ |
✔ |
✔ |
✔ |
✔ |
✔ |
Bild
|
✔ |
✔ |
✔ |
✔ |
Syntax¶
AI_EMBED( <model> , <input> )
Argumente¶
Benötigt:
model
Eine Zeichenfolge, die das Modell der Vektoreinbettung angibt, das zum Generieren einer Einbettung verwendet werden soll.
Für Text können Sie die folgenden Werte angeben:
snowflake-arctic-embed-l-v2.0
snowflake-arctic-embed-l-v2.0-8k
nv-embed-qa-4
multilingual-e5-large
voyage-multilingual-2
snowflake-arctic-embed-m-v1.5
snowflake-arctic-embed-m
e5-base-v2
Für Images können Sie nur den folgenden Wert angeben:
voyage-multimodal-3
Unterstützte Modelle können unterschiedliche Kosten haben.
input
Die Zeichenfolge oder das Image (als FILE-Objekt), aus dem/der eine Einbettung generiert wird. Images müssen folgende Anforderungen erfüllen:
Müssen im JPEG-, WEBP-, PNG- oder BMP-Format vorliegen
Dürfen höchstens 10 MB groß sein
Dürfen höchstens 8.000 × 8.000 Pixel haben
Rückgabewerte¶
Ein Einbettungsvektor vom Typ VECTOR, der aus dem Eingabetext oder -bild abgeleitet wird.
Anforderungen an die Zugriffssteuerung¶
Benutzer müssen eine Rolle verwenden, die die Datenbankrolle SNOWFLAKE.CORTEX_USER besitzt. Weitere Informationen zu dieser Berechtigung finden Sie unter Erforderliche Berechtigungen.
Beispiele¶
Textbeispiel¶
In diesem Beispiel wird eine Vektoreinbettung für die Phrase hello world
unter Verwendung des snowflake-arctic-embed-l-v2.0
-Modells erstellt:
SELECT AI_EMBED('snowflake-arctic-embed-l-v2.0', 'hello world');
Bildbeispiel¶
In diesem Beispiel wird eine Vektoreinbettung für eine Stagingdatei mithilfe des voyage-multimodal-3
-Modells generiert:
SELECT AI_EMBED('voyage-multimodal-3',
TO_FILE ('@my_images', 'CITY_WALKING1.PNG'));
Einschränkungen¶
Die Funktionen von Snowflake AI unterstützen keine inkrementelle Aktualisierung von dynamischen Tabellen.
Die Funktionen von Snowflake AI funktionieren nicht bei FILE-Objekten, die aus Dateien in den folgenden Stagingbereichen erstellt wurden:
Interne Stagingbereiche mit Verschlüsselungsmodus
TYPE = 'SNOWFLAKE_FULL'
Externe Stagingbereiche mit einem beliebigen Verschlüsselungsmodus auf Kundenseite, z. B.
AWS_CSE
oderAZURE_CSE
.Benutzer-Stagingbereich
Tabellen-Stagingbereich
Stagingbereich mit Namen in doppelten Anführungszeichen
Rechtliche Hinweise¶
Weitere Informationen dazu finden Sie unter KI und ML in Snowflake.