Kategorien:

Zeichenfolgen- und Binärfunktionen (AI-Funktionen)

AI_EMBED

Bemerkung

AI_EMBED ist die aktualisierte Version von EMBED_TEXT_1024 (SNOWFLAKE.CORTEX) and EMBED_TEXT_768 (SNOWFLAKE.CORTEX). Die neueste Funktionalität finden Sie unter AI_EMBED.

Erstellt einen Einbettungsvektor aus Text oder einem Bild. Einbettungen sind abstrakte numerische Darstellungen der Merkmale eines Textteils oder eines Bildes, die verwendet werden können, um den Grad der Ähnlichkeit zwischen Text- oder Bildteilen zu bestimmen. Die Einbettungen können dann für semantische Suchen, Clustering, die Klassifizierung und andere Aufgaben verwendet werden.

Regionsverfügbarkeit

Die folgende Tabelle zeigt die Regionen, in denen Sie die verwenden können AI_EMBED-Funktion für Text und Bilder verwenden können:

Datentyp
AWS US West 2
(Oregon)
AWS US East 1
(N. Virginia)
AWS Europe Central 1
(Frankfurt)
AWS Europe West 1
(Ireland)
AWS AP Southeast 2
(Sydney)
AWS AP Northeast 1
(Tokio)
Azure East US 2
(Virginia)
Azure West Europe
(Niederlande)
AWS
(Regionsübergreifend)
Text

Bild

Syntax

AI_EMBED( <model> , <input> )
Copy

Argumente

Benötigt:

model

Eine Zeichenfolge, die das Modell der Vektoreinbettung angibt, das zum Generieren einer Einbettung verwendet werden soll.

Für Text können Sie die folgenden Werte angeben:

  • snowflake-arctic-embed-l-v2.0

  • snowflake-arctic-embed-l-v2.0-8k

  • nv-embed-qa-4

  • multilingual-e5-large

  • voyage-multilingual-2

  • snowflake-arctic-embed-m-v1.5

  • snowflake-arctic-embed-m

  • e5-base-v2

Für Images können Sie nur den folgenden Wert angeben:

  • voyage-multimodal-3

Unterstützte Modelle können unterschiedliche Kosten haben.

input

Die Zeichenfolge oder das Image (als FILE-Objekt), aus dem/der eine Einbettung generiert wird. Images müssen folgende Anforderungen erfüllen:

  • Müssen im JPEG-, WEBP-, PNG- oder BMP-Format vorliegen

  • Dürfen höchstens 10 MB groß sein

  • Dürfen höchstens 8.000 × 8.000 Pixel haben

Rückgabewerte

Ein Einbettungsvektor vom Typ VECTOR, der aus dem Eingabetext oder -bild abgeleitet wird.

Anforderungen an die Zugriffssteuerung

Benutzer müssen eine Rolle verwenden, die die Datenbankrolle SNOWFLAKE.CORTEX_USER besitzt. Weitere Informationen zu dieser Berechtigung finden Sie unter Erforderliche Berechtigungen.

Beispiele

Textbeispiel

In diesem Beispiel wird eine Vektoreinbettung für die Phrase hello world unter Verwendung des snowflake-arctic-embed-l-v2.0-Modells erstellt:

SELECT AI_EMBED('snowflake-arctic-embed-l-v2.0', 'hello world');
Copy

Bildbeispiel

In diesem Beispiel wird eine Vektoreinbettung für eine Stagingdatei mithilfe des voyage-multimodal-3-Modells generiert:

SELECT AI_EMBED('voyage-multimodal-3',
        TO_FILE ('@my_images', 'CITY_WALKING1.PNG'));
Copy

Einschränkungen

  • Die Funktionen von Snowflake AI unterstützen keine inkrementelle Aktualisierung von dynamischen Tabellen.

  • Die Funktionen von Snowflake AI funktionieren nicht bei FILE-Objekten, die aus Dateien in den folgenden Stagingbereichen erstellt wurden:

    • Interne Stagingbereiche mit Verschlüsselungsmodus TYPE = 'SNOWFLAKE_FULL'

    • Externe Stagingbereiche mit einem beliebigen Verschlüsselungsmodus auf Kundenseite, z. B. AWS_CSE oder AZURE_CSE.

    • Benutzer-Stagingbereich

    • Tabellen-Stagingbereich

    • Stagingbereich mit Namen in doppelten Anführungszeichen