Notebooks auf Container Runtime für ML¶

Überblick¶

Sie können Snowflake Notebooks auf Container Runtime für ML ausführen. Container Runtime für ML basiert auf Snowpark Container Services und bietet Ihnen eine flexible Container-Infrastruktur, mit der Sie eine Vielzahl von Workflows vollständig innerhalb von Snowflake erstellen und operationalisieren können. Container Runtime für ML bietet Software- und Hardware-Optionen zur Unterstützung fortgeschrittener Data Science- und Machine Learning-Workloads. Im Vergleich zu virtuellen Warehouses bietet Container Runtime für ML eine flexiblere Umgebung, in der Sie Pakete aus verschiedenen Quellen installieren und Computeressourcen, einschließlich GPU-Maschinentypen, auswählen können, während Sie gleichzeitig SQL-Abfragen auf Warehouses für eine optimale Performance durchführen.

Dieses Dokument beschreibt einige Überlegungen zur Verwendung von Notebooks auf Container Runtime für ML. Sie können auch den Schnellstart Erste Schritte mit Snowflake Notebook Container Runtime ausprobieren, um mehr über die Verwendung von Container Runtime für ML in Ihrer Entwicklung zu erfahren.

Voraussetzungen¶

Bevor Sie Snowflake Notebooks für Container Runtime für ML verwenden können, muss die Rolle ACCOUNTADMIN die Schritte zur Einrichtung des Notebooks abschließen, um die erforderlichen Ressourcen zu erstellen und Berechtigungen für diese Ressourcen zu erteilen. Detaillierte Schritte finden Sie unter Administrator-Einrichtung.

Notebook auf Container Runtime für ML erstellen¶

Wenn Sie ein Notebook auf Container Runtime für ML erstellen, wählen Sie ein Warehouse, eine Laufzeit und einen Computepool, um die Ressourcen für die Ausführung Ihres Notebooks bereitzustellen. Die von Ihnen gewählte Laufzeit ermöglicht Ihnen den Zugriff auf verschiedene Python-Pakete, je nach Ihrem Anwendungsfall. Unterschiedliche Warehouse-Größen oder Computepools haben unterschiedliche Auswirkungen auf Kosten und Leistung. Alle diese Einstellungen können bei Bedarf später geändert werden.

Bemerkung

Ein Benutzer mit den Rollen ACCOUNTADMIN, ORGADMIN oder SECURITYADMIN kann nicht direkt ein Notebook auf Container Runtime für ML erstellen oder besitzen. Notebooks, die von diesen Rollen erstellt wurden oder ihnen direkt gehören, können nicht ausgeführt werden. Wenn ein Notebook jedoch im Besitz einer Rolle ist, von der die Rollen ACCOUNTADMIN, ORGADMIN oder SECURITYADMIN Berechtigungen erben, wie z. B. die Rolle PUBLIC, dann können Sie diese Rollen verwenden, um das Notebook auszuführen.

Gehen Sie folgendermaßen vor, um ein Snowflake-Notebook zu erstellen, das auf Container Runtime für ML läuft:

Melden Sie sich bei Snowsight an.
Wählen Sie Notebooks aus.
Wählen Sie + Notebook aus.
Geben Sie einen Namen für Ihr Notebook ein.
Wählen Sie eine Datenbank und ein Schema aus, in dem Sie Ihr Notebook speichern möchten. Dieser Parameter kann nach dem Erstellen des Notebooks nicht mehr geändert werden.

Bemerkung

Die Datenbank und das Schema werden nur für die Speicherung Ihrer Notebooks benötigt. Sie können jede Datenbank und jedes Schema, auf das Ihre Rolle Zugriff hat, von Ihrem Notebook aus abfragen.
Wählen Sie die Run on container als Ihre Python-Umgebung aus.
Wählen Sie den Runtime-Typ aus: CPU oder GPU.
Wählen Sie Compute pool aus.
Ändern Sie das ausgewählte Warehouse, das Sie für die Ausführung von SQL- und Snowpark-Abfragen verwenden möchten.
Um Ihr Notizbuch zu erstellen und zu öffnen, wählen Sie Create aus.

Runtime:

Diese Vorschau bietet zwei Arten von Laufzeiten: CPU und GPU. Jedes Laufzeit-Image enthält einen Basissatz von Python-Paketen und Versionen, die von Snowflake überprüft und integriert wurden. Alle Laufzeit-Images unterstützen Datenanalyse, Modellierung und Training mit Snowpark Python, Snowflake ML, und Streamlit.

Um zusätzliche Pakete aus einem öffentlichen Repository zu installieren, können Sie pip verwenden. Für Snowflake-Notebooks ist eine Integration des externen Zugriffs (EAI) erforderlich, um Pakete von externen Endpunkten zu installieren. Um EAIs zu konfigurieren, lesen Sie Einrichten des externen Zugriffs für Snowflake Notebooks. Wenn ein Paket jedoch bereits Teil des Basisbilds ist, können Sie die Version des Pakets nicht ändern, indem Sie eine andere Version mit pip install installieren. Eine Liste der vorinstallierten Pakete finden Sie unter Container Runtime für ML.

Compute pool:

Ein Computepool stellt die Computeressourcen für Ihren Notebook-Kernel und Python-Code bereit. Verwenden Sie für den Anfang kleinere, CPU-basierte Computepools und wählen Sie für die Optimierung auf GPU basierende Computepools mit höherem Speicher für intensive GPU-Nutzungsszenarios wie Computer Vision oder LLMs/VLMs.

Beachten Sie, dass auf jedem Serverknoten jeweils nur ein Notebook pro Benutzer ausgeführt werden kann. Sie sollten den Parameter MAX_NODES auf einen Wert größer als eins einstellen, wenn Sie Computepools für Notebooks erstellen. Ein Beispiel dazu finden Sie unter Computeressourcen. Weitere Informationen zu Snowpark Container Services Computpools finden Sie unter Snowpark Container Services: Verwenden von Computepools.

Wenn ein Notebook nicht benutzt wird, sollten Sie es herunterfahren, um Ressourcen im Knoten freizugeben. Sie können ein Notebook herunterfahren, indem Sie in der Dropdown-Schaltfläche „Verbindung“ die Option End session auswählen.

Notebook auf Container Runtime für ML ausführen¶

Nachdem Sie Ihr Notebook erstellt haben, können Sie sofort mit der Ausführung von Code beginnen, indem Sie Zellen hinzufügen und ausführen. Informationen zum Hinzufügen von Zellen finden Sie unter Code in Snowflake Notebooks entwickeln und ausführen.

Weitere Pakete importieren¶

Zusätzlich zu den vorinstallierten Paketen, mit denen Sie Ihr Notebook in Betrieb nehmen können, können Sie auch Pakete aus öffentlichen Quellen installieren, für die Sie einen externen Zugang eingerichtet haben. Sie können auch Pakete verwenden, die in einem Stagingbereich oder in einem privaten Repository gespeichert sind. Sie benötigen die Rolle ACCOUNTADMIN oder eine Rolle, die Integrationen für den externen Zugriff erstellen kann (EAIs), um den Zugriff für den Besuch bestimmter externer Endpunkte einzurichten und zu erteilen. Verwenden Sie den Befehl ALTER NOTEBOOK, um den externen Zugriff auf Ihrem Notebook zu aktivieren. Sobald sie zugewiesen wurden, sehen Sie die EAIs in Notebook settings. Schalten Sie die EAIs um, bevor Sie die Installation von externen Kanälen starten. Eine Anleitung dazu finden Sie unter Erstellen Sie Integrationen für den externen Zugriff (EAI).

Das folgende Beispiel installiert ein externes Paket mit pip install in einer Codezelle:

!pip install transformers scipy ftfy accelerate

Copy

Aktualisieren der Notebook-Einstellungen¶

Sie können die Einstellungen, wie z. B. die zu verwendenden Computepools oder das Warehouse, jederzeit unter Notebook settings aktualisieren, auf das Sie über das Menü Notebook-Aktionen oben rechts zugreifen können.

Eine der Einstellungen, die Sie unter Notebook settings aktualisieren können, ist die Einstellung für den Timeout nach Leerlauf. Die Standardeinstellung für den Timeout im Leerlauf ist 1 Stunde. Sie können ihn auf bis zu 72 Stunden einstellen. Um dies in SQL festzulegen, verwenden Sie den Befehl CREATE NOTEBOOK oder ALTER NOTEBOOK, um die Eigenschaft IDLE_AUTO_SHUTDOWN_TIME_SECONDS des Notebooks einzustellen.

Installieren privater Pakete¶

Pip unterstützt die Installation von Paketen aus privaten Quellen mit Basisaauthentifizierung, wie JFrog Artifactory. Konfigurieren Sie das Notebook für die Integration des externen Zugriffs (EAI), damit es auf das Repository zugreifen kann.

Erstellen Sie eine Netzwerkregel, um das Repository anzugeben, auf das Sie zugreifen möchten. Diese Netzwerkregel gibt zum Beispiel ein JFrog Repository an:
```
CREATE OR REPLACE NETWORK RULE jfrog_network_rule
  MODE = EGRESS
  TYPE = HOST_PORT
  VALUE_LIST = ('<your-repo>.jfrog.io');
```
Copy

Erstellen Sie eine Integration des externen Zugriffs, die den Zugriff auf das Repository ermöglicht:

CREATE OR REPLACE EXTERNAL ACCESS INTEGRATION jfrog_integration
  ALLOWED_NETWORK_RULES = (jfrog_network_rule)
  ENABLED = TRUE;

GRANT USAGE ON INTEGRATION jfrog_integration TO ROLE data_scientist;

Copy

Um auf die Konfiguration des externen Zugriffs zuzugreifen, wählen Sie das Menü (Notebook actions) oben rechts auf Ihrem Notebook.
Wählen Sie Notebook settings aus, und wählen Sie dann die Registerkarte External access aus.
Wählen Sie die EAI, um eine Verbindung zum Repository herzustellen.

Das Notebook startet neu.

Sobald das Notebook neu gestartet ist, können Sie aus dem Repository installieren:

!pip install hello-jfrog --index-url https://<user>:<token>@<your-repo>.jfrog.io/artifactory/api/pypi/test-pypi/simple

Copy

Installation von privaten Paketen mit privater Konnektivität¶

Wenn Ihr privates Paketarchiv eine private Konnektivität erfordert, folgen Sie diesen Schritten, um Ihr Konto zu konfigurieren. Wenn Sie Hilfe benötigen, können Sie sich mit Ihrem Kontoadministrator abstimmen, um die Netzwerkregel einzurichten.

Folgen Sie den Schritten unter Netzwerkausgang über private Konnektivität, um den Netzwerkausgang über private Konnektivität einzurichten.

Erstellen Sie eine EAI mit der Netzwerkregel aus Schritt 1. Beispiel:

CREATE OR REPLACE EXTERNAL ACCESS INTEGRATION private_repo_integration
  ALLOWED_NETWORK_RULES = (PRIVATE_LINK_NETWORK_RULE)
  ENABLED = TRUE;

GRANT USAGE ON INTEGRATION private_repo_integration TO ROLE data_scientist;

Copy

Um auf die Konfiguration des externen Zugriffs zuzugreifen, wählen Sie das Menü (Notebook actions) oben rechts auf Ihrem Notebook.
Wählen Sie Notebook settings aus, und wählen Sie dann die Registerkarte External access aus.
Wählen Sie die EAI, um eine Verbindung zu Ihrem privaten Repository herzustellen.

Das Notebook startet neu.
Nachdem das Notebook neu gestartet wurde, können Sie die --index-url Ihres Repositorys angeben:
```
!pip install my_package --index-url https://my-private-repo-url.com/simple
```
Copy

Ausführen von ML-Workloads¶

Notebooks auf Container Runtime für ML eignen sich gut für die Ausführung von ML-Workloads wie z. B. Modelltraining und Parameter-Tuning. Die Laufzeiten sind mit den gängigen ML-Paketen vorinstalliert. Wenn der Zugriff auf die externe Integration eingerichtet ist, können Sie alle anderen Pakete, die Sie benötigen, über !pip install installieren.

Bemerkung

Der Python-Prozess speichert geladene Module im Cache. Ändern Sie die Versionen der installierten Pakete, bevor Sie die Pakete in den Code importieren. Andernfalls müssen Sie möglicherweise die Verbindung zur Notebook-Sitzung unterbrechen und erneut herstellen, um die neuen Versionen zu laden.

Die folgenden Beispiele zeigen, wie Sie einige der verfügbaren Bibliotheken für Ihren ML-Workload verwenden können.

Neue Container-optimierte Bibliotheken verwenden¶

Container Runtime für ML enthält neue APIs, die speziell auf die Entwicklung von ML in der Containerumgebung zugeschnitten sind. Durch die Verteilung der Verarbeitung auf mehrere Kerne bieten diese APIs optimiertes Ladens von Daten, Modelltraining und die Optimierung der Hyperparameter. Weitere Informationen über diese APIs finden Sie im Abschnitt Container Runtime des Snowflake ML-Entwicklerhandbuchs.

OSS ML-Bibliotheken¶

Das folgende Beispiel verwendet eine OSS ML-Bibliothek, xgboost, mit einer aktiven Snowpark-Sitzung, um Daten für das Training direkt in den Speicher zu holen:

from snowflake.snowpark.context import get_active_session
import pandas as pd
import xgboost as xgb
from sklearn.model_selection import train_test_split

session = get_active_session()
df = session.table("my_dataset")
# Pull data into local memory
df_pd = df.to_pandas()
X = df_pd[['feature1', 'feature2']]
y = df_pd['label']
# Split data into test and train in memory
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.15, random_state=34)
# Train in memory
model = xgb.XGBClassifier()
model.fit(X_train, y_train)
# Predict
y_pred = model.predict(X_test)

Copy

Snowflake ML Modeling-APIs verwenden¶

Wenn die Snowflake ML Modelling-APIs in Container Runtime für ML verwendet werden, erfolgt die gesamte Ausführung (einschließlich Training und Vorhersage) direkt in Container Runtime und nicht im Abfrage-Warehouse. Snowflake ML auf Container Runtime kann Daten schneller abrufen und wird für groß angelegtes Training empfohlen. Mit der GPU-Laufzeit verwendet Snowflake ML standardmäßig alle GPUs, um das Training zu beschleunigen.

Das folgende Codeblock-Beispiel verwendet XGBoost für die Modellierung:

from snowflake.snowpark.context import get_active_session
from snowflake.ml.modeling.xgboost import XGBClassifier
from snowflake.ml.modeling.metrics import accuracy_score

session = get_active_session()
df = session.table("my_dataset")
feature_cols=['FEATURE1', 'FEATURE2']
label_col = 'LABEL'
predicted_col = [PREDICTED_LABEL]
df = df[features_cols + [label_col]]
# Split is pushed down to associated warehouse
train_df, test_df = df.random_split(weights=[0.85, 0.15], seed=34)

model = XGBClassifier(
    input_cols=feature_cols,
    label_cols=label_col,
    output_cols=predicted_col,
    # This will enable leveraging all GPUs on the node
    tree_method="gpu_hist",
)
# Train
model.fit(train_df)
# Predict
result = model.predict(test_df)

accuracy = accuracy_score(
df=result,
y_true_col_names=label_cols,
y_pred_col_names=predicted_col)

Copy

Im Folgenden sehen Sie ein Beispiel für die Verwendung der Light Gradient Boosting Machine (LightGBM):

from snowflake.snowpark.context import get_active_session
from snowflake.ml.modeling.lightgbm import LGBMClassifier
from snowflake.ml.modeling.metrics import accuracy_score

session = get_active_session()
df = session.table("my_dataset")
feature_cols=['FEATURE1', 'FEATURE2']
label_col = 'LABEL'
predicted_col = [PREDICTED_LABEL]

df = df[features_cols + [label_col]]
# Split is pushed down to associated warehouse
train_df, test_df = df.random_split(weights=[0.85, 0.15], seed=34)

model = LGBMClassifier(
    input_cols=feature_cols,
    label_cols=label_col,
    ouput_cols=predicted_col,
    # This will enable leveraging all GPUs on the node
    device_type="gpu",
)

# Train
model.fit(train_df)
# Predict
result = model.predict(test_df)

accuracy = accuracy_score(
df=result,
y_true_col_names=label_cols,
y_pred_col_names=predicted_col)

Copy

Neue Container-optimierte Bibliotheken verwenden¶

Container Runtime für ML installiert die neue APIs vor, die speziell für ML Schulungen in der Container-Umgebung zugeschnitten ist.

Datenkonnektor-APIs¶

Datenkonnektor-APIs bieten eine einzige Weboberfläche für die Verbindung von Snowflake-Datenquellen (einschließlich Tabellen, DataFrames und Datensets) mit gängigen ML-Frameworks (wie PyTorch und TensorFlow). Diese APIs finden Sie im Namespace snowflake.ml.data.

snowflake.ml.data.data_connector.DataConnector

Verbindet Snowpark DataFrames oder Snowflake ML-Datensetz mit TensorFlow oder PyTorch DataSets oder Pandas DataFrames. Klasse Instanziieren Sie einen Konnektor mit einer der folgenden Methoden der Klasse:

DataConnector.from_dataframe: Akzeptiert einen Snowpark-DataFrame.
DataConnector.from_dataset: Akzeptiert ein Snowflake-ML-Datenset, das durch Name und Version spezifiziert ist.
DataConnector.from_sources: Akzeptiert eine Liste von Quellen, von denen jede eine DataFrame oder ein Datenset sein kann.

Sobald Sie den Konnektor instanziiert haben (indem Sie die Instanz, zum Beispiel data_connector aufrufen), rufen Sie die folgenden Methoden auf, um die gewünschte Art von Ausgabe zu erzeugen.

data_connector.to_tf_dataset: Liefert ein TensorFlow-Datenset, das für die Verwendung mit TensorFlow geeignet ist.
data_connector.to_torch_dataset: Liefert ein PyTorch-Datenset, das für die Verwendung mit PyTorch geeignet ist.

Weitere Informationen zu diesen APIs finden Sie in der Snowflake ML API-Referenz.

Verteilte Modellierung APIs¶

Die verteilte Modellierung-APIs bietet parallele Versionen von LightGBM, PyTorch und XGBoost, die die verfügbaren Ressourcen in der Container Umgebung voll ausnutzen. Diese finden Sie im Namespace snowflake.ml.modeling.distributors. Die APIs der verteilten Klassen sind ähnlich wie die der Standard Versionen.

Weitere Informationen zu diesen APIs finden Sie in der API-Referenz.

XGBoost

Die primäre Klasse XGBoost ist snowflake.ml.modeling.distributors.xgboost.XGBEstimator. Verwandte Klassen sind:

snowflake.ml.modeling.distributors.xgboost.XGBScalingConfig

Ein Beispiel für die Arbeit mit diesem API finden Sie im XGBoost auf GPU Beispiel-Notebook im Snowflake Container Runtime für ML GitHub-Repository.

LightGBM

Die primäre Klasse LightGBM ist snowflake.ml.modeling.distributors.lightgbm.LightGBMEstimator. Verwandte Klassen sind:

snowflake.ml.modeling.distributors.lightgbm.LightGBMScalingConfig

Ein Beispiel für die Arbeit mit diesem API finden Sie im LightGBM auf GPU Beispiel-Notebook im Snowflake Container Runtime für ML GitHub-Repository.

PyTorch

Die primäre PyTorch-Klasse ist snowflake.ml.modeling.distributors.pytorch.PyTorchDistributor. Verwandte Klassen sind:

snowflake.ml.modeling.distributors.pytorch.WorkerResourceConfig
snowflake.ml.modeling.distributors.pytorch.PyTorchScalingConfig
snowflake.ml.modeling.distributors.pytorch.Context
snowflake.ml.modeling.distributors.pytorch.get_context

Ein Beispiel für die Arbeit mit diesem API finden Sie im PyTorch auf GPU Beispiel-Notebook im Snowflake Container Runtime für ML GitHub-Repository.

Einschränkungen¶

Die Snowflake ML Modeling-API unterstützt nur predict, predict_proba, predict_log_proba Inferenzmethoden auf Container Runtime für ML. Andere Methoden werden im Abfrage-Warehouse ausgeführt.
Die Snowflake ML Modeling-API unterstützt nur sklearn-kompatible Pipelines in Container Runtime.
Die Snowflake ML Modeling-API unterstützt keine preprocessing- oder metrics-Klassen auf Container Runtime für ML. Diese werden im Abfrage-Warehouse ausgeführt.
Die Methoden fit, predict und score werden auf Container Runtime für ML ausgeführt. Andere Snowflake-ML-Methoden werden im Abfrage-Warehouse ausgeführt.
sample_weight_cols wird für die XGBoost- oder LightGBM- nicht unterstützt.

Hinweise zu Kosten/Abrechnung¶

Wenn Sie Notebooks auf Container Runtime für ML ausführen, können Ihnen sowohl Warehouse-Computekosten als auch SPCS-Computekosten entstehen.

Snowflake Notebooks erfordern ein virtuelles Warehouse, um SQL- und Snowpark-Abfragen zur Optimierung der Leistung auszuführen. Daher können auch bei der Verwendung von SQL in SQL-Zellen und Snowpark-Pushdown-Abfragen, die in Python-Zellen ausgeführt werden, Computekosten im virtuellen Warehouse anfallen. Das folgende Diagramm zeigt, wo die Berechnungen für jede Art von Zelle stattfinden.

Das Diagramm zeigt die Verteilung der Rechenleistung von Notebook-Zellen.

Das folgende Python-Beispiel verwendet zum Beispiel die xgboost-Bibliothek. Die Daten werden in den Container gezogen und die Berechnung erfolgt auf Snowpark Container Services:

from snowflake.snowpark.context import get_active_session
import pandas as pd
import xgboost as xgb
from sklearn.model_selection import train_test_split

session = get_active_session()
df = session.table("my_dataset")
# Pull data into local memory
df_pd = df.to_pandas()
X = df_pd[['feature1', 'feature2']]
y = df_pd['label']
# Split data into test and train in memory
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.15, random_state=34)

Copy

Mehr über Warehouse-Kosten erfahren Sie unter Übersicht zu Warehouses.