2025년 5월 19일 — Snowflake ML Data Connector 릴리스 노트

Snowflake ML Data Connector for Container Runtime — 일반 공급

이제 노트북 세션 및 ML 작업과 같은 컨테이너 런타임 인스턴스에서 Snowflake ML Data Connector를 일반적으로 사용할 수 있습니다. 이 커넥터를 사용하면 Snowflake 데이터 소스에서 컨테이너화된 Python 환경으로 데이터를 효율적으로 수집할 수 있습니다. 분산 처리를 활용하여 데이터 로딩을 가속화합니다.

주요 기능은 다음과 같습니다.

  • 오픈 소스 ML 워크플로에서 사용하기 위해 모든 Snowflake 데이터 소스(테이블 또는 스테이지)에서 pandas 데이터 프레임으로 직접 데이터 로딩.

  • 널리 사용되는 ML 프레임워크와 원활하게 통합할 수 있도록 Snowflake 데이터에서 PyTorch 및 TensorFlow 데이터 세트를 생성할 수 있습니다.

  • Snowflake의 컨테이너 런타임 내부와 외부에서 동일한 코드를 사용할 수 있습니다.

  • Snowpark DataFrames (개발용으로 이상적)과 Snowflake 데이터 세트(프로덕션용 버전, 스키마 수준 오브젝트)를 모두 지원합니다.

  • Snowflake의 분산형 APIs 와 통합하여 대규모 모델 훈련 및 미세 조정.