2025년 8월 20일: Snowflake ML의 분산 처리: 다중 모델 학습 및 분산 파티션 함수¶
Snowflake ML은 이제 여러 모델을 학습시키고 파티션 전반의 데이터를 처리하기 위한 분산 처리 기능을 지원합니다.
다중 모델 학습(MMT)을 사용하여 데이터 파티션 전반에서 여러 머신 러닝 모델을 효율적으로 학습시킬 수 있습니다. MMT는 지정한 열을 기준으로 Snowpark DataFrame을 분할하고 각 파티션에서 별도의 모델을 동시에 학습시킵니다.
분산 파티션 함수(DPF)를 사용하여 컴퓨팅 풀에 있는 하나 이상의 노드에서 데이터를 병렬로 처리할 수 있습니다. DPF는 지정한 열을 기준으로 Snowpark DataFrame을 분할하고 각 파티션에서 Python 함수를 병렬로 실행합니다.
두 기능 모두 인프라 복잡성을 관리하고 자동으로 확장하는 데 도움이 됩니다.
자세한 내용은 데이터 파티션 전체에서 모델 학습시키기 및 파티션 전체에서 사용자 지정 논리로 데이터 처리하기 섹션을 참조하십시오.