Kategorien:

Zeichenfolgen- und Binärfunktionen (Large Language Model)

AI_COMPLETE (Einzelnes Bild)

Bemerkung

AI_COMPLETE ist die aktualisierte Version von COMPLETE (SNOWFLAKE.CORTEX). Die neueste Funktionalität finden Sie unter AI_COMPLETE.

Erzeugt eine Antwort (Vervollständigung) auf einen Text-Prompt unter Verwendung eines unterstützten Sprachmodells.

Syntax

Die Funktion enthält zwei erforderliche Argumente und vier optionale Argumente. Die Funktion kann entweder mit der Syntax für positionale oder benannte Argumente verwendet werden.

Verwendung von AI_COMPLETE mit einer einzigen Bildeingabe

AI_COMPLETE(
    <model>, <predicate>, <file> [, <model_parameters> ] )
Copy

Argumente

model

Zeichenfolge, die das zu verwendende Modell angibt. Geben Sie eines der folgenden Modelle an:

  • claude-4-opus

  • claude-4-sonnet

  • claude-3-7-sonnet

  • claude-3-5-sonnet

  • llama-4-maverick

  • llama-4-scout

  • pixtral-large

Unterstützte Modelle können unterschiedliche Kosten haben.

predicate

Ein Zeichenfolgen-Prompt

file

Ein Objekt vom Typ FILE, das ein Bild darstellt

model_parameters Ein Objekt, das null oder mehr der folgenden Optionen enthält, die die Hyperparameter des Modells beeinflussen. Siehe LLM-Einstellungen.

  • temperature: Ein Wert von 0 bis 1 (einschließlich), der die Zufälligkeit der Ausgabe des Sprachmodells steuert. Eine höhere Modelltemperatur (z. B. 0,7) führt zu einer vielfältigeren und zufälligeren Ausgabe, während eine niedrigere Modelltemperatur (z. B. 0,2) die Ausgabe deterministischer und konzentrierter macht.

    Standardeinstellung: 0

  • top_p: Ein Wert von 0 bis 1 (einschließlich), der die Zufälligkeit und Diversität des Sprachmodells steuert und im Allgemeinen als Alternative zu temperature verwendet wird. Der Unterschied besteht darin, dass top_p die Menge der möglichen Token, die das Modell ausgibt, einschränkt, während temperature beeinflusst, welche Token bei jedem Schritt ausgewählt werden.

    Standardeinstellung: 0

  • max_tokens: Legt die maximale Anzahl der Ausgabe-Token in der Antwort fest. Kleine Werte können zu abgeschnittenen Antworten führen.

    Standardwert: 4.096 Maximal zulässiger Wert: 8.192

  • guardrails: Filtert potenziell unsichere und schädliche Antworten aus einem Sprachmodell unter Verwendung von Cortex Guard. Entweder TRUE oder FALSE. Der Standardwert ist FALSE.

Rückgabewerte

Gibt die Zeichenfolgenantwort des Sprachmodells zurück.

Beispiele

Die folgenden Beispiele demonstrieren die grundlegenden Möglichkeiten der Funktion COMPLETE mit Bildern.

Visuelle Beantwortung von Fragen

Ein Diagramm der Inflationsraten wird verwendet, um eine Frage zu den Daten zu beantworten.

Diagramm der Inflationsraten im Jahr 2023 mit Schätzungen für 2024

Vergleich zwischen den Inflationsraten im Jahr 2023 und 2024 (Statista))

SELECT AI_COMPLETE('claude-3-5-sonnet',
    'Which country will observe the largest inflation change in 2024 compared to 2023?',
    TO_FILE('@myimages', 'highest-inflation.png'));
Copy

Antwort:

Looking at the data, Venezuela will experience the largest change in inflation rates between 2023 and 2024.
The inflation rate in Venezuela is projected to decrease significantly from 337.46% in 2023 to 99.98% in 2024,
representing a reduction of approximately 237.48 percentage points. This is the most dramatic change among
all countries shown in the chart, even though Zimbabwe has higher absolute inflation rates.

Extraktion von Entitäten aus einem Bild

Dieses Beispiel extrahiert die Entitäten (Objekte) aus einem Bild und gibt die Ergebnisse im JSON-Format zurück.

Foto einer Küche nach der Umgestaltung
SELECT AI_COMPLETE('claude-3-5-sonnet',
    'Extract the kitchen appliances identified in this image. Respond in JSON only with the identified appliances.',
    TO_FILE('@myimages', 'kitchen.png'));
Copy

Antwort:

{
    "appliances": [ "microwave","electric stove","oven","refrigerator" ]
}

Nutzungshinweise für die Bildverarbeitung

  • Es werden nur Text und Bilder unterstützt. Video- und Audiodateien werden nicht unterstützt.

  • Unterstützte Bildformate:

    • .jpg

    • .jpeg

    • .png

    • .gif

    • .webp

    • pixtral- und llama4-Modelle unterstützen auch .bmp.

  • Die maximale Bildgröße beträgt 10 MB für die meisten Modelle und 3,75 MB für claude-Modelle. claude-Modelle unterstützen keine Bilder mit Auflösungen über 8000 x 8000.

  • Für den Stagingbereich, der die Bilder enthält, muss die serverseitige Verschlüsselung aktiviert sein. Clientseitig verschlüsselte Stagingbereiche werden nicht unterstützt.

  • Die Funktion unterstützt keine benutzerdefinierten Netzwerkrichtlinien.

  • Bei Stagingbereichen wird die Groß-/Kleinschreibung nicht beachtet, bei Pfaden die Groß-/Kleinschreibung.