24. April 2025 — Container Runtime für ML auf Multi-Knoten-Clustern — Vorschau¶
Snowflake kündigt die Vorschau der Container Runtime für ML auf Multi-Knoten-Clustern an, eine neue Funktion, mit der Sie Ihre ML-Workloads über mehrere Serverknoten in Snowflake-Notebooks skalieren können.
Container Runtime für ML auf Multi-Knoten-Clustern ermöglicht Ihnen Folgendes:
Skalieren von ML-Workloads: Passen Sie die Anzahl der Knoten in Ihrem Computepool dynamisch an den Ressourcenbedarf Ihrer ML-Aufgaben an.
Durchführen von verteiltem Training: Trainieren Sie ML-Modelle auf größeren Datensätzen mit verteilten Frameworks wie PyTorch, LightGBM und XGBoost.
Verwalten von Clustering-Ressourcen: Skalieren Sie bei ressourcenintensiven Aufgaben einfach nach oben und verkleinern Sie sie, wenn weniger Ressourcen benötigt werden.
Steuerung von Skalierungsoperationen: Konfigurieren Sie die asynchrone Skalierung, die Timeout-Schwellenwerte und die Mindestanforderungen an die Knoten, um die Anforderungen Ihres Workflows zu erfüllen.
Zu den wichtigsten Vorteilen von Container Runtime für ML auf Multi-Knoten-Clustern gehören:
Verbesserte Leistung: Verarbeiten Sie größere Datensätze und beschleunigen Sie das Training von komplexen Modellen durch Parallelisierung.
Ressourceneffizienz: Skalieren Sie Ressourcen je nach Workload-Anforderungen nach oben oder unten, ohne neue Computepools bereitstellen zu müssen.
Flexibilität: Unterstützung für synchrone oder asynchrone Skalierungsoperationen zur Anpassung an Ihren Entwicklungsworkflow.
Einfachheit: Unkomplizierte APIs für die Skalierung von Clustern und die Überwachung aktiver Knoten mit minimaler Konfiguration.
Informationen zu den ersten Schritten mit Container Runtime für ML auf Multi-Knoten-Clustern finden Sie unter Container Runtime für ML auf Mehrknoten-Clustern.