2025년 4월 24일 — 멀티 노드 클러스터에서 ML 용 Container Runtime — 미리 보기¶
Snowflake는 멀티 노드 클러스터에서 ML 워크로드를 Snowflake Notebooks의 여러 컴퓨팅 노드에 걸쳐 확장할 수 있는 새로운 기능인 ML 용 Container Runtime의 미리 보기를 발표합니다.
멀티 노드 클러스터에서 ML 용 Container Runtime을 사용하면 다음이 가능합니다.
ML 워크로드 스케일: 작업의 리소스 요구에 맞게 컴퓨팅 풀의 노드 수를 동적으로 조정할 수 있습니다.
분산 훈련 실행: PyTorch, LightGBM, XGBoost 같은 분산 프레임워크를 사용하여 대규모 데이터 세트에서 ML 모델을 학습합니다.
클러스터 리소스 관리: 리소스 집약적인 작업을 위해 쉽게 확장하고 리소스가 적게 필요할 때는 축소할 수 있습니다.
크기 조정 작업 제어: 워크플로 요구 사항에 맞게 비동기 확장, 시간 제한 임계값, 최소 노드 요구 사항을 구성할 수 있습니다.
멀티 노드 클러스터에서 ML 용 Container Runtime의 주요 이점은 다음과 같습니다.
성능 향상: 병렬화를 통해 대규모 데이터 세트를 처리하고 복잡한 모델의 학습을 가속화합니다.
리소스 효율성: 새로운 컴퓨팅 풀을 프로비저닝하지 않고도 워크로드 요구 사항에 따라 리소스를 확장 또는 축소할 수 있습니다.
유연성: 개발 워크플로에 맞게 동기식 또는 비동기식 확장 작업을 지원할 수 있습니다.
단순성: 최소한의 구성으로 클러스터 크기 조정 및 활성 노드 모니터링을 위한 직관적인 APIs 입니다.
멀티 노드 클러스터에서 ML 용 Container Runtime을 시작하려면 멀티 노드 클러스터의 Container Runtime for ML 섹션을 참조하십시오.