CREATE SNOWFLAKE.ML.CLASSIFICATION

Erstellt ein neues Klassifizierungsmodell oder ersetzt ein bestehendes Modell im aktuellen oder angegebenen Schema.

Siehe auch:

DROP SNOWFLAKE.ML.CLASSIFICATION

Syntax

CREATE [ OR REPLACE ] SNOWFLAKE.ML.CLASSIFICATION [ IF NOT EXISTS ] <model_name> (
    INPUT_DATA => <input_data>,
    TARGET_COLNAME => '<target_colname>',
    [CONFIG_OBJECT => <config_object>],
)
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
[ COMMENT = '<string_literal>' ]
Copy

Parameter

Erforderlich

input_data

Eine Referenz auf die Trainingsdaten. Die Verwendung einer Referenz ermöglicht bei einem Trainingsprozess, der mit eingeschränkten Berechtigungen ausgeführt wird, die Berechtigungen Ihrer aktiven Rolle für den Zugriff auf die Daten zu nutzen. Sie können eine Referenz auf eine Tabelle oder eine Ansicht verwenden, wenn Ihre Daten bereits in dieser Form vorliegen, oder Sie können eine Abfragereferenz verwenden, um die Abfrage bereitzustellen, die zum Abrufen der Daten ausgeführt werden soll.

INPUT_DATA muss die gesamten Trainingsdaten enthalten, die vom Klassifizierungsmodell verwendet werden sollen. Alle Spalten, die nicht in den TARGET_COLNAME-Argumenten genannt werden, gelten als Trainingsvariablen (Merkmale oder Features). Die Reihenfolge der Spalten in den Eingabedaten ist unbedeutend.

Feature-Spalten müssen vom Typ STRING, NUMERIC oder BOOLEAN sein. STRING- und BOOLEAN-Spalten werden als kategoriale Features behandelt, während NUMERIC-Spalten als kontinuierliche Features betrachtet werden. Um eine numerische Spalte als kategorisch zu behandeln, wandeln Sie diese in STRING um.

target_colname

Name der Spalte, die die Bezeichnung (Zielwert) für jede Zeile in den Trainingsdaten enthält. Die Zielspalte kann vom Typ BOOLEAN, NUMERIC oder STRING sein.

Optional

config_object

Ein OBJECT, dessen Schlüssel-Wert-Paare zusätzliche Trainingsoptionen angeben.

Schlüssel

Typ

Standard

Beschreibung

evaluate

BOOLEAN

TRUE

Gibt an, ob Bewertungskennzahlen erstellt werden sollen. Wenn TRUE, dann wird ein zusätzliches Modell für die Auswertung unter Verwendung der Parameter in evaluation_config trainiert.

on_error

STRING

‚ABORT‘

Zeichenfolgenkonstante, die die Fehlerbehandlungsmethode für die Modelltrainingaufgabe angibt. Folgende Werte werden unterstützt:

  • 'ABORT': Wenn eines Zeile zu einem Fehler führt, wird die gesamte Trainingsoperation abgebrochen.

  • 'SKIP': Zeilen, die zu einem Fehler führen, werde übersprungen. Anstelle der Ergebnisse wird der Fehler angezeigt.

evaluation_config

OBJECT

NULL

Ein optionales Konfigurationsobjekt, das angibt, wie Bewertungskennzahlen für Daten generiert werden sollen, die außerhalb der Stichprobe liegen (out-of-sample). Derzeit gibt es nur eine solche Option.

  • test_fraction (FLOAT): Der Anteil des Datensets, der als Testdaten (Evaluation) verwendet werden soll.

Wenn die Evaluationskonfiguration nicht angegeben wird, wird standardmäßig versucht, mindestens 500 Instanzen der Minderheitenklasse in das Evaluationsdatenset aufzunehmen und den Gesamttestanteil auf 20 % des Datensets zu begrenzen. Dieser Ansatz sorgt für Ausgewogenheit bei der Modellbewertung und beim Modelltraining, insbesondere für Minderheitsklassen.

Anforderungen an die Zugriffssteuerung

Eine Rolle, die zur Ausführung dieses SQL-Befehls verwendet wird, muss mindestens die folgenden Berechtigungen haben:

Berechtigung / Rolle

Objekt

Anmerkungen

CREATE SNOWFLAKE.ML.CLASSIFICATION

Schema

Die Rolle, mit der ein Budget erstellt wird, muss diese Berechtigung für das Schema haben, in dem das Budget erstellt wird.

OWNERSHIP

Schema

Um ein temporäres Objekt zu erstellen, das denselben Namen hat wie das bereits im Schema vorhandene Objekt, muss der verwendeten Rolle die Berechtigung OWNERSHIP für das Objekt erteilt worden sein oder die Rolle muss diese Berechtigung geerbt haben.

model_name !mladmin

SNOWFLAKE.ML.CLASSIFICATION-Instanz

Diese Rolle, die auf das Modell selbst beschränkt ist, wird zunächst dem Eigentümer zugewiesen, der sie an andere Personen weitergeben kann, um ihnen den Aufruf aller Methoden des Modells zu ermöglichen. Siehe Modellrollen und Nutzungsberechtigungen.

model_name !mlconsumer

SNOWFLAKE.ML.CLASSIFICATION-Instanz

Diese Rolle, die auf das Modell selbst beschränkt ist, wird zunächst dem Eigentümer zugewiesen, der sie an andere Personen weitergeben kann, damit diese die Vorhersagemethoden des Modells (wie PREDICT) aufrufen können. Siehe Modellrollen und Nutzungsberechtigungen.

Beachten Sie, dass für die Bearbeitung eines Objekts in einem Schema auch die Berechtigung USAGE für die übergeordnete Datenbank und das Schema erforderlich ist.

Eine Anleitung zum Erstellen einer kundenspezifischen Rolle mit einer bestimmten Gruppe von Berechtigungen finden Sie unter Erstellen von kundenspezifischen Rollen.

Allgemeine Informationen zu Rollen und Berechtigungen zur Durchführung von SQL-Aktionen auf sicherungsfähigen Objekten finden Sie unter Übersicht zur Zugriffssteuerung.

Beispiel

Siehe Beispiele.