2025年8月20日:Snowflake ML での分散処理:多数のモデルトレーニングと分散パーティション機能¶
Snowflake ML は複数のモデルをトレーニングし、パーティションをまたいでデータを処理する分散処理機能をサポートするようになりました。
多数のモデルトレーニング(MMT)により、データパーティション全体で複数の機械学習モデルを効率的にトレーニングします。 MMT は指定した列ごとにSnowpark DataFrame をパーティション化し、各パーティションで個別のモデルを並列にトレーニングします。
分散パーティション機能(DPF)を使用して、コンピューティングプール内の1つ以上のノードで並行してデータを処理します。 DPF は指定した列でSnowpark DataFrame をパーティション化し、各パーティションでPython関数を並列に実行します。
どちらの機能も、インフラストラクチャの複雑さの自動処理とスケーリングの自動化に役立ちます。
詳細については、 データパーティション全体でモデルをトレーニングする および パーティション全体でカスタムロジックによるデータの処理 をご参照ください。