- Kategorien:
Zeichenfolgen- und Binärfunktionen (Large Language Model)
CLASSIFY_TEXT (SNOWFLAKE.CORTEX)¶
Klassifiziert Freiform-Textdaten in die von Ihnen angegebenen Kategorien.
Syntax¶
SNOWFLAKE.CORTEX.CLASSIFY_TEXT( <input> , <list_of_categories> )
Argumente¶
Benötigt:
input
Zeichenfolge zum Klassifizieren Bei der Eingabezeichenfolge wird zwischen Groß- und Kleinschreibung unterschieden. Sie können unterschiedliche Ergebnisse für dieselbe Zeichenfolge mit unterschiedlicher Großschreibung erhalten.
list_of_categories
Array von Zeichenfolgen, die die Kategorien darstellen Muss mindestens zwei und darf höchstens 100 eindeutige Kategorien enthalten. Bei Kategorien wird zwischen Groß- und Kleinschreibung unterschieden. Wenn diese Anforderungen nicht erfüllt sind, gibt die Funktion eine Fehlermeldung zurück. Eine vollständige Auflistung der Fehler finden Sie unter Fehlerbedingungen.
Rückgabewerte¶
Gibt eine Zeichenfolge zurück, die ein JSON-Objekt enthält. Das JSON-Objekt enthält die Kategorie, als die die Eingabeaufforderung eingestuft wurde. Wenn ungültige Argumente angegeben werden, wird ein Fehler zurückgegeben. Weitere Informationen zu den Fehlern finden Sie unter Fehlerbedingungen.
Anforderungen an die Zugriffssteuerung¶
Benutzer müssen eine Rolle verwenden, der die Datenbankrolle SNOWFLAKE.CORTEX_USER zugewiesen wurde: Weitere Informationen zu dieser Berechtigung finden Sie unter Erforderliche Berechtigungen.
Nutzungshinweise¶
Um eine optimale Leistung zu erzielen, befolgen Sie diese Richtlinien:
Verwenden Sie einfachen englischen Text für Eingaben und Kategorien.
Beschränken Sie die Menge an Text im Eingabetext, der nicht in einfachem Englisch verfasst ist. Versuchen Sie zum Beispiel, Inhalte wie Codeschnipsel oder Protokolle in der Texteingabe zu beschränken.
Der Text sollte keinen Code oder Formate enthalten, die nicht quelloffen sind (firmenspezifische Sprachen, proprietäre Formate usw.). Die Funktion gibt zwar keinen Fehler zurück, aber die Ergebnisse entsprechen möglicherweise nicht Ihren Erwartungen.
Verwenden Sie keine Abkürzungen, Sonderzeichen oder Fachausdrücke in den Kategoriebezeichnungen.
Kategorien sollten beschreibend sein. Wenn Sie zum Beispiel eine Kategorie wie
Xa4s3
odercategory 1
verwenden, werden Sie keine guten Ergebnisse erzielen.Die Kategorien sollten sich gegenseitig ausschließen.
Beispiele¶
Das folgende Beispiel ordnet die Eingabeaufforderung einer von zwei Kategorien zu, travel
oder cooking
:
SELECT SNOWFLAKE.CORTEX.CLASSIFY_TEXT('One day I will see the world', ['travel', 'cooking']);
{
"label": "travel"
}
Das folgende Beispiel erstellt eine Tabelle, text_classification_table
, die eine Spalte für Text und eine Spalte für mögliche Kategorien für diesen Text enthält. Dann wird die Funktion CLASSIFY_TEXT in jeder Zeile der Tabelle aufgerufen, um die Zeichenfolge in der Textspalte zu klassifizieren.
CREATE OR REPLACE TEMPORARY TABLE text_classification_table AS
SELECT 'France' AS input, ['North America', 'Europe', 'Asia'] AS classes
UNION ALL
SELECT 'Singapore', ['North America', 'Europe', 'Asia']
UNION ALL
SELECT 'one day I will see the world', ['travel', 'cooking', 'dancing']
UNION ALL
SELECT 'my lobster bisque is second to none', ['travel', 'cooking', 'dancing'];
SELECT input,
classes,
SNOWFLAKE.CORTEX.CLASSIFY_TEXT(input, classes)['label'] as classification
FROM text_classification_table;