20 août 2025 : traitement distribué dans Snowflake ML - Many Model Training et Distributed Partition Function

Snowflake ML prend désormais en charge des capacités de traitement distribué pour l’entraînement de plusieurs modèles et le traitement de données à travers différentes partitions.

Vous pouvez utiliser Many Model Training (MMT) pour entraîner efficacement plusieurs modèles de machine learning à travers différentes partitions de données. MMT divise votre Snowpark DataFrame en une colonne que vous spécifiez et entraîne des modèles distincts en parallèle sur chaque partition.

Vous pouvez utiliser Distributed Partition Function (DPF) pour traiter des données en parallèle sur un ou plusieurs nœuds d’un pool de calcul. DPF divise votre Snowpark DataFrame en une colonne que vous spécifiez et exécute votre fonction Python en parallèle sur chaque partition.

Ces deux fonctionnalités vous aident à gérer la complexité de l’infrastructure et la mise à l’échelle automatique.

Pour plus d’informations, voir Entraînez des modèles sur toutes les partitions de données et Traitement des données avec une logique personnalisée sur toutes les partitions.