20 de agosto de 2025: Processamento distribuído no Snowflake ML: Treinamento de vários modelos e função de partição distribuída¶
O Snowflake ML agora oferece suporte a recursos de processamento distribuído para treinar vários modelos e processar dados entre partições.
Você pode usar o treinamento de vários modelos (MMT) para treinar vários modelos de aprendizado de máquina de forma eficiente em partições de dados. O MMT particiona seu Snowpark DataFrame por uma coluna que você especifica e treina modelos separados em cada partição em paralelo.
Você pode usar a função de partição distribuída (DPF) para processar dados em paralelo em um ou mais nós em um pool de computação. A DPF particiona seu Snowpark DataFrame por uma coluna que você especifica e executa sua função Python em cada partição em paralelo.
Ambos os recursos ajudam você a lidar com a complexidade da infraestrutura e a dimensionar automaticamente.
Para obter mais informações, consulte Treinamento de modelos em partições de dados e Processamento de dados com lógica personalizada em partições.