Snowflake ML Jobs¶

Verwenden Sie Snowflake ML Jobs, um Workflows des maschinellen Lernens (ML) innerhalb von Snowflake ML Container-Laufzeiten auszuführen. Sie können sie von jeder Entwicklungsumgebung aus ausführen. Sie müssen den Code nicht in einem Snowflake-Arbeitsblatt oder -Notizbuch ausführen. Verwenden Sie Jobs, um die Infrastruktur von Snowflake für ressourcenintensive Aufgaben innerhalb Ihres Entwicklungsworkflows zu nutzen. Informationen zur lokalen Einrichtung von Snowflake ML finden Sie unter Lokale Verwendung von Snowflake ML.

Wichtig

Snowflake ML Jobs sind als öffentliche Vorschau im Snowpark ML Python-Paket (snowflake-ml-python) ab Version 1.8.2 verfügbar.

Mit Snowflake ML Jobs können Sie Folgendes tun:

Führen Sie ML-Workloads auf Snowflake Computepools aus, einschließlich GPU- und CPU-Instanzen mit hohem Speicherbedarf.
Verwenden Sie Ihre bevorzugte Entwicklungsumgebung wie VS Code oder Jupyter Notebooks.
Installieren und verwenden Sie benutzerdefinierte Python-Pakete in Ihrer Laufzeitumgebung.
Nutzen Sie Snowflakes verteilte APIs, um das Laden von Daten, das Training und die Abstimmung der Hyperparameter zu optimieren.
Integrieren Sie mit Orchestrierungstools wie Apache Airflow.
Überwachen und verwalten Sie Aufträge mit Hilfeder Snowflake-APIs.

Mit diesen Funktionen können Sie Folgendes tun:

Führen Sie ressourcenintensives Training auf großen Datensätzen durch, die GPU-Beschleunigung oder erhebliche Rechenressourcen erfordern.
Bringen Sie ML-Workflows in Produktion, indem Sie ML-Code von der Entwicklung zur Produktion mit programmatischer Ausführung durch Pipelines verschieben.
Behalten Sie Ihre bestehende Entwicklungsumgebung bei und nutzen Sie gleichzeitig die Rechenressourcen von Snowflake.
Heben und verschieben Sie OSS ML-Workflows mit minimalen Codeänderungen.
Arbeiten Sie direkt mit großen Snowflake-Datensätzen, um Datenbewegungen zu reduzieren und teure Datenübertragungen zu vermeiden.

Voraussetzungen¶

Wichtig

Snowflake ML Jobs unterstützt derzeit nur Python 3.10 Clients. Bitte kontaktieren Sie Ihr Snowflake-Kundenteam, wenn Sie Unterstützung für andere Python-Versionen benötigen.

Installieren Sie das Snowflake ML Python-Paket in Ihrer Python 3.10 Umgebung.
```
pip install snowflake-ml-python>=1.8.2
```
Copy
Die Standardgröße des Computepools verwendet die Instanzfamilie CPU_X64_S. Die minimale Anzahl von Knoten ist 1 und die maximale ist 25. Sie können den folgenden SQL-Befehl verwenden, um einen benutzerdefinierten Computepool zu erstellen:
```
CREATE COMPUTE POOL IF NOT EXISTS MY_COMPUTE_POOL
  MIN_NODES = <MIN_NODES>
  MAX_NODES = <MAX_NODES>
  INSTANCE_FAMILY = <INSTANCE_FAMILY>;
```
Copy

Snowflake ML Jobs erfordern eine Snowpark-Sitzung. Verwenden Sie den folgenden Code, um sie zu erstellen:

from snowflake.snowpark import Session
from snowflake.ml.jobs import list_jobs

ls = list_jobs() # This will fail! You must create a session first.

# Requires valid ~/.snowflake/config.toml file
session = Session.builder.getOrCreate()

ls = list_jobs(session=session)
ls = list_jobs() # Infers created session from context

Copy

Informationen zum Erstellen einer Sitzung finden Sie unter Erstellen einer Sitzung.

Führen Sie einen Snowflake ML Job aus¶

Sie können einen Snowflake ML Job auf eine der folgenden Arten ausführen:

Verwendung eines Remote Decorator in Ihrem Code.
Übermittlung ganzer Dateien oder Verzeichnisse mit Python-API.

Eine Python-Funktion als Snowflake ML Job ausführen¶

Verwenden Sie Function Dispatch, um einzelne Python-Funktionen mit dem Decorator @remote auf den Rechenressourcen von Snowflake auszuführen.

Mit dem Decorator @remote können Sie Folgendes tun:

Serialisieren Sie die Funktion und ihre Abhängigkeiten.
Laden Sie sie in einen bestimmten Snowflake Stagingbereich hoch.
Führen Sie es innerhalb der Container Runtime für ML aus.

Der folgende Python-Beispielcode verwendet den Decorator @remote, um einen Snowflake ML Job zu übermitteln. Beachten Sie, dass eine Snowpark Session erforderlich ist, siehe Voraussetzungen.

from snowflake.ml.jobs import remote

@remote("MY_COMPUTE_POOL", stage_name="payload_stage", session=session)
def train_model(data_table: str):
  # Provide your ML code here, including imports and function calls
  ...

job = train_model("my_training_data")

Copy

Der Aufruf einer dekorierten @remote-Funktion gibt ein Snowflake MLJob-Objekt zurück, das zur Verwaltung und Überwachung der Jobausführung verwendet werden kann. Weitere Informationen dazu finden Sie unter Verwalten von Snowflake ML Jobs.

Eine Python-Datei als Snowflake ML Job ausführen¶

Führen Sie Python-Dateien oder Projektverzeichnisse auf Snowflake-Rechenressourcen aus. Dies ist nützlich, wenn:

Sie komplexe ML-Projekte mit mehreren Modulen und Abhängigkeiten haben.
Sie die Trennung zwischen lokaler Entwicklung und Produktionscode aufrechterhalten wollen.
Sie Skripte ausführen müssen, die Befehlszeilenargumente verwenden.
Sie mit bestehenden ML-Projekten arbeiten, die nicht speziell für die Ausführung auf Snowflake Compute entwickelt wurden.

Die Snowflake Job-API bietet zwei Hauptmethoden:

submit_file(): Zum Ausführen einzelner Python-Dateien
submit_directory(): Zum Ausführen ganzer Projektverzeichnisse mit mehreren Dateien und Ressourcen

Beide Methoden unterstützen Folgendes:

Übergabe von Argumenten in der Befehlszeile
Konfiguration der Umgebungsvariablen
Benutzerdefinierte Abhängigkeitsangaben
Verwaltung der Projektressourcen über die Snowflake-Stagingbereiche

File Dispatch ist besonders nützlich, um bestehende ML-Workflows zu produzieren und eine klare Trennung zwischen Entwicklungs- und Ausführungsumgebung aufrechtzuerhalten.

Der folgende Python-Code übergibt eine Datei an einen Snowflake ML Job:

from snowflake.ml.jobs import submit_file

# Run a single file
job1 = submit_file(
  "train.py",
  "MY_COMPUTE_POOL",
  stage_name="payload_stage",
  args=["--data-table", "my_training_data"],
  session=session,
)

Copy

Der folgende Python-Code übergibt ein Verzeichnis an einen Snowflake ML Job:

from snowflake.ml.jobs import submit_directory

# Run from a directory
job2 = submit_directory(
  "./ml_project/",
  "MY_COMPUTE_POOL",
  entrypoint="train.py",
  stage_name="payload_stage",
  session=session,
)

Copy

Die Übermittlung einer Datei oder eines Verzeichnisses gibt ein Snowflake MLJob-Objekt zurück, das zur Verwaltung und Überwachung der Jobausführung verwendet werden kann. Weitere Informationen dazu finden Sie unter Verwalten von Snowflake ML Jobs.

Verwalten von Snowflake ML Jobs¶

Wenn Sie einen Snowflake ML Job übermitteln, erstellt die API ein MLJob-Objekt. Sie können damit Folgendes tun:

Verfolgen des Job-Fortschritts durch Statusaktualisierungen
Probleme anhand detaillierter Ausführungsprotokolle beheben
Abrufen des Ausführungsergebnisses (falls vorhanden)

Sie können die get_job() API verwenden, um ein MLJob -Objekt über dessen ID abzurufen. Der folgende Python-Code zeigt, wie Sie ein MLJob-Objekt abrufen können:

from snowflake.ml.jobs import MLJob, get_job, list_jobs

# List all jobs
jobs = list_jobs()

# Retrieve an existing job based on ID
job = get_job("<job_id>")  # job is an MLJob instance

# Retrieve status and logs for the retrieved job
print(job.status)  # PENDING, RUNNING, FAILED, DONE
print(job.get_logs())

Copy

Rufen Sie die result-Methode des Jobs auf, um auf den Abschluss der Ausführung zu warten und das Ergebnis der Ausführung abzurufen. Wenn die Ausführung fehlschlägt, löst result eine Ausnahme aus.

result = job.result()

Copy

Abhängigkeiten verwalten¶

Die Snowflake ML Job-API führt Nutzlasten innerhalb der Umgebung Container Runtime für ML aus. Die Umgebung enthält die am häufigsten verwendeten Python-Pakete für maschinelles Lernen und Data Science. Die meisten Anwendungsfälle sollten im Ist-Zustand ohne zusätzliche Konfiguration funktionieren. Wenn Sie benutzerdefinierte Abhängigkeiten benötigen, können Sie pip_requirements verwenden, um sie zu installieren.

Um benutzerdefinierte Abhängigkeiten zu installieren, müssen Sie den externen Netzwerkzugriff mithilfe einer externen Zugriffsintegration aktivieren. Sie können den folgenden SQL-Beispielbefehl verwenden, um den Zugriff zu ermöglichen:

CREATE OR REPLACE EXTERNAL ACCESS INTEGRATION PYPI_EAI
  ALLOWED_NETWORK_RULES = (snowflake.external_access.pypi_rule)
  ENABLED = true;

Copy

Weitere Informationen zu Integrationen für den externen Zugriff finden Sie unter Erstellen und Verwenden einer Integration für den externen Zugriff.

Nachdem Sie den externen Netzwerkzugang bereitgestellt haben, können Sie die Parameter pip_requirements und external_access_integrations verwenden, um benutzerdefinierte Abhängigkeiten zu konfigurieren. Sie können Pakete verwenden, die in der Container Runtime-Umgebung nicht verfügbar sind oder wenn Sie bestimmte Versionen der Pakete verwenden.

Der folgende Python-Code zeigt, wie Sie benutzerdefinierte Abhängigkeiten für den remote-Decorator angeben können:

@remote(
  "MY_COMPUTE_POOL",
  stage_name="payload_stage",
  pip_requirements=["custom-package"],
  external_access_integrations=["PYPI_EAI"],
  session=session,
)
def my_function():
  # Your code here

Copy

Der folgende Python-Code zeigt, wie Sie benutzerdefinierte Abhängigkeiten für die Methode submit_file() angeben können:

from snowflake.ml.jobs import submit_file

# Can include version specifier to specify version(s)
job = submit_file(
  "/path/to/repo/my_script.py",
  compute_pool,
  stage_name="payload_stage",
  pip_requirements=["custom-package==1.0.*"],
  external_access_integrations=["pypi_eai"],
  session=session,
)

Copy

Private Paketzuführungen¶

Snowflake ML Jobs unterstützt auch das Laden von Paketen aus privaten Feeds wie JFrog Artifactory und Sonatype Nexus Repository. Diese Feeds werden häufig verwendet, um interne und proprietäre Pakete zu verteilen, die Kontrolle über die Versionen von Abhängigkeiten zu behalten und Sicherheit und Compliance zu gewährleisten.

Um Pakete aus einem privaten Feed zu installieren, müssen Sie Folgendes tun:

Erstellen Sie eine Netzwerkregel, um den Zugriff auf die URL des privaten Feeds zu erlauben.
1. Für Quellen, die eine einfache Authentifizierung verwenden, können Sie einfach eine Netzwerkregel erstellen.
  CREATE OR REPLACE NETWORK RULE private_feed_nr MODE = EGRESS TYPE = HOST_PORT VALUE_LIST = ('<your-repo>.jfrog.io');
  Copy
2. Um den Zugriff auf eine Quelle über private Konnektivität (d. h. Private Link) zu konfigurieren, folgen Sie den Schritten unter Netzwerkausgang über private Konnektivität.

Erstellen Sie eine externe Zugriffsintegration mit der Netzwerkregel. Erteilen Sie der Rolle, die Aufträge einreichen wird, die Erlaubnis zur Verwendung von EAI.

CREATE OR REPLACE EXTERNAL ACCESS INTEGRATION private_feed_eai
ALLOWED_NETWORK_RULES = (PRIVATE_FEED_NR)
ENABLED = true;

GRANT USAGE ON INTEGRATION private_feed_eai TO ROLE <role_name>;

Copy

Geben Sie die URL des privaten Feeds, die externe Zugriffsintegration und das/die Paket(e) an, wenn Sie den Job übermitteln.

# Option 1: Specify private feed URL in pip_requirements
job = submit_file(
  "/path/to/script.py",
  compute_pool="MY_COMPUTE_POOL",
  stage_name="payload_stage",
  pip_requirements=[
    "--index-url=https://your.private.feed.url",
    "internal-package==1.2.3"
  ],
  external_access_integrations=["PRIVATE_FEED_EAI"]
)

Copy

# Option 2: Specify private feed URL by environment variable
job = submit_directory(
  "/path/to/code/",
  compute_pool="MY_COMPUTE_POOL",
  entrypoint="script.py",
  stage_name="payload_stage",
  pip_requirements=["internal-package==1.2.3"],
  external_access_integrations=["PRIVATE_FEED_EAI"],
  env_vars={'PIP_INDEX_URL': 'https://your.private.feed.url'},
)

Copy

Wenn die URL Ihres privaten Feeds sensible Informationen wie Authentifikatoren enthält, verwalten Sie die URL, indem Sie ein Snowflake-Geheimnis erstellen. Verwenden Sie die CREATE SECRET, um ein Geheimnis zu erstellen. Konfigurieren Sie Geheimnisse während der Auftragsübermittlung mit dem Argument spec_overrides.

# Create secret for private feed URL with embedded auth token
feed_url = "<your-repo>.jfrog.io/artifactory/api/pypi/test-pypi/simple"
user = "<auth_user>"
token = "<auth_token>"
session.sql(f"""
CREATE SECRET IF NOT EXISTS PRIVATE_FEED_URL_SECRET
 TYPE = GENERIC_STRING
 SECRET_STRING = 'https://{auth_user}:{auth_token}@{feed_url}'
""").collect()

# Prepare service spec override for mounting secret into job execution
spec_overrides = {
 "spec": {
  "containers": [
    {
     "name": "main",  # Primary container name is always "main"
     "secrets": [
      {
        "snowflakeSecret": "PRIVATE_FEED_URL_SECRET",
        "envVarName": "PIP_INDEX_URL",
        "secretKeyRef": "secret_string"
      },
     ],
    }
  ]
 }
}

# Load private feed URL from secret (e.g. if URL includes auth token)
job = submit_file(
  "/path/to/script.py",
  compute_pool="MY_COMPUTE_POOL",
  stage_name="payload_stage",
  pip_requirements=[
    "internal-package==1.2.3"
  ],
  external_access_integrations=["PRIVATE_FEED_EAI"],
  spec_overrides=spec_overrides,
)

Copy

Weitere Informationen über container.secrets finden Sie unter Feld containers.secrets.

Hinweise zu Kosten¶

Snowflake ML Jobs laufen auf Snowpark Container Services und werden nach Verbrauch abgerechnet. Informationen zu den Rechenkosten finden Sie unter Kosten von Snowpark Container Services.

Die Nutzdaten des Jobs werden in den Stagingbereich hochgeladen, der mit dem Argument stage_name angegeben wurde. Um zusätzliche Kosten zu vermeiden, müssen Sie diese bereinigen. Weitere Informationen finden Sie unter Erläuterungen zu den Speicherkosten und Untersuchen der Speicherkosten, um mehr über die mit dem Stagingbereich verbundenen Kosten zu erfahren.