CREATE SNOWFLAKE.ML.CLASSIFICATION¶
Erstellt ein neues Klassifizierungsmodell oder ersetzt ein bestehendes Modell im aktuellen oder angegebenen Schema.
- Siehe auch:
Syntax¶
CREATE [ OR REPLACE ] SNOWFLAKE.ML.CLASSIFICATION [ IF NOT EXISTS ] <model_name> (
INPUT_DATA => <input_data>,
TARGET_COLNAME => '<target_colname>',
[CONFIG_OBJECT => <config_object>],
)
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
[ COMMENT = '<string_literal>' ]
Parameter¶
Erforderlich
input_data
Eine Referenz auf die Trainingsdaten. Die Verwendung einer Referenz ermöglicht bei einem Trainingsprozess, der mit eingeschränkten Berechtigungen ausgeführt wird, die Berechtigungen Ihrer aktiven Rolle für den Zugriff auf die Daten zu nutzen. Sie können eine Referenz auf eine Tabelle oder eine Ansicht verwenden, wenn Ihre Daten bereits in dieser Form vorliegen, oder Sie können eine Abfragereferenz verwenden, um die Abfrage bereitzustellen, die zum Abrufen der Daten ausgeführt werden soll.
INPUT_DATA muss die gesamten Trainingsdaten enthalten, die vom Klassifizierungsmodell verwendet werden sollen. Alle Spalten, die nicht in den TARGET_COLNAME-Argumenten genannt werden, gelten als Trainingsvariablen (Merkmale oder Features). Die Reihenfolge der Spalten in den Eingabedaten ist unbedeutend.
Feature-Spalten müssen vom Typ STRING, NUMERIC oder BOOLEAN sein. STRING- und BOOLEAN-Spalten werden als kategoriale Features behandelt, während NUMERIC-Spalten als kontinuierliche Features betrachtet werden. Um eine numerische Spalte als kategorisch zu behandeln, wandeln Sie diese in STRING um.
target_colname
Name der Spalte, die die Bezeichnung (Zielwert) für jede Zeile in den Trainingsdaten enthält. Die Zielspalte kann vom Typ BOOLEAN, NUMERIC oder STRING sein.
Optional
config_object
Ein OBJECT, dessen Schlüssel-Wert-Paare zusätzliche Trainingsoptionen angeben.
Schlüssel
Typ
Standard
Beschreibung
evaluate
TRUE
Gibt an, ob Bewertungskennzahlen erstellt werden sollen. Wenn TRUE, dann wird ein zusätzliches Modell für die Auswertung unter Verwendung der Parameter in
evaluation_config
trainiert.on_error
STRING
‚ABORT‘
Zeichenfolgenkonstante, die die Fehlerbehandlungsmethode für die Modelltrainingaufgabe angibt. Folgende Werte werden unterstützt:
'ABORT'
: Wenn eines Zeile zu einem Fehler führt, wird die gesamte Trainingsoperation abgebrochen.'SKIP'
: Zeilen, die zu einem Fehler führen, werde übersprungen. Anstelle der Ergebnisse wird der Fehler angezeigt.
evaluation_config
NULL
Ein optionales Konfigurationsobjekt, das angibt, wie Bewertungskennzahlen für Daten generiert werden sollen, die außerhalb der Stichprobe liegen (out-of-sample). Derzeit gibt es nur eine solche Option.
test_fraction
(FLOAT): Der Anteil des Datensets, der als Testdaten (Evaluation) verwendet werden soll.
Wenn die Evaluationskonfiguration nicht angegeben wird, wird standardmäßig versucht, mindestens 500 Instanzen der Minderheitenklasse in das Evaluationsdatenset aufzunehmen und den Gesamttestanteil auf 20 % des Datensets zu begrenzen. Dieser Ansatz sorgt für Ausgewogenheit bei der Modellbewertung und beim Modelltraining, insbesondere für Minderheitsklassen.
Anforderungen an die Zugriffssteuerung¶
Eine Rolle, die zur Ausführung dieses SQL-Befehls verwendet wird, muss mindestens die folgenden Berechtigungen haben:
Berechtigung / Rolle |
Objekt |
Anmerkungen |
---|---|---|
CREATE SNOWFLAKE.ML.CLASSIFICATION |
Schema |
Die Rolle, mit der ein Budget erstellt wird, muss diese Berechtigung für das Schema haben, in dem das Budget erstellt wird. |
OWNERSHIP |
Schema |
Um ein temporäres Objekt zu erstellen, das denselben Namen hat wie das bereits im Schema vorhandene Objekt, muss der verwendeten Rolle die Berechtigung OWNERSHIP für das Objekt erteilt worden sein oder die Rolle muss diese Berechtigung geerbt haben. |
|
SNOWFLAKE.ML.CLASSIFICATION-Instanz |
Diese Rolle, die auf das Modell selbst beschränkt ist, wird zunächst dem Eigentümer zugewiesen, der sie an andere Personen weitergeben kann, um ihnen den Aufruf aller Methoden des Modells zu ermöglichen. Siehe Modellrollen und Nutzungsberechtigungen. |
|
SNOWFLAKE.ML.CLASSIFICATION-Instanz |
Diese Rolle, die auf das Modell selbst beschränkt ist, wird zunächst dem Eigentümer zugewiesen, der sie an andere Personen weitergeben kann, damit diese die Vorhersagemethoden des Modells (wie |
Beachten Sie, dass für die Bearbeitung eines Objekts in einem Schema auch die Berechtigung USAGE für die übergeordnete Datenbank und das Schema erforderlich ist.
Eine Anleitung zum Erstellen einer kundenspezifischen Rolle mit einer bestimmten Gruppe von Berechtigungen finden Sie unter Erstellen von kundenspezifischen Rollen.
Allgemeine Informationen zu Rollen und Berechtigungen zur Durchführung von SQL-Aktionen auf sicherungsfähigen Objekten finden Sie unter Übersicht zur Zugriffssteuerung.
Beispiel¶
Siehe Beispiele.