Notas de lançamento de Snowpark ML

Este artigo contém as notas de versão do Snowpark ML, incluindo o seguinte, quando aplicável:

  • Mudanças de comportamento

  • Novos recursos

  • Correções de bugs voltados para o cliente

Nota

Estas notas não incluem mudanças em recursos que não foram divulgados publicamente.

Versão 1.1.2 (18/12/2023)

Novos recursos e atualizações

Atualizações de desenvolvimento de modelo:

  • Métrica precision_score implementada em SQL.

Correções de bugs

  • Corrigido um problema em que o rastreamento de pilha era ocultado por telemetria.

Correções de desenvolvimento de modelo:

  • A inferência de assinaturas de modelo não materializa mais o dataframe completo na memória.

Versão 1.1.1 (6/12/2023)

Novos recursos e atualizações

  • Snowpark ML Modeling API designado como geralmente disponível.

  • O novo parâmetro passthrough_col na API de modelagem permite excluir colunas específicas, como colunas de índice, durante o treinamento ou inferência quando não especifica explicitamente input_cols.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • confusion_matrix forneceu resultados incorretos quando o número da linha não pôde ser dividido pelo tamanho do lote.

Versão 1.1.0 (01/12/2023)

Novos recursos e atualizações

  • A execução GridSearchCV e RandomizedSearchCV agora é distribuída em warehouses de vários nós.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • As colunas estavam sendo excluídas se seus nomes normalizados não correspondessem aos nomes especificados em output_columns em OrdinalEncoder e LabelEncoder. As colunas de saída não precisam mais ser identificadores válidos do Snowflake.

Versão 1.0.12 (15/11/2023)

Novos recursos e atualizações

  • Nenhum

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • Aumentou a capacidade da coluna de OrdinalEncoder.

Versão 1.0.11 (28/10/2023)

Novos recursos e atualizações

  • Adicione suporte para kneighbors.

  • Suporte a DecimalType como um tipo de dados.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • Correção do suporte para modelos XGBoost e LightGBM usando os seletores de modelo SKLearn Grid Search e Randomized Search.

    • Corrigida a compatibilidade das métricas com o Snowpark DataFrames que usa identificadores Snowflake

Versão 1.0.10 (15/10/2023)

Novos recursos e atualizações

  • Os cálculos de métrica precision_score, recall_score, f1_score, fbeta_score, precision_recall_fscore_support, mean_absolute_error, mean_squared_error e mean_absolute_percentage_error agora são distribuídos.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • Corrigidos os erros de decodificação UTF-8 ao usar módulos de modelagem no Windows.

    • Corrigidas as definições de alias que causam SnowparkSQLUnexpectedAliasException na inferência.

Versão 1.0.9 (28/09/2023)

Novos recursos e atualizações

  • O cálculo da métrica log_loss agora está distribuído.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • A construção de imagens não falha mais com algumas configurações do Docker.

    • A incorporação da biblioteca ML local não falha mais quando a biblioteca é importada por zipimport.

    • Atualize a documentação incorreta sobre o argumento da plataforma na função deploy.

Versão 1.0.8 (15/09/2023)

Novos recursos e atualizações

  • Nenhum

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • O codificador ordinal pode ser usado com tipos de coluna de entrada mistos.

    • Corrigido um problema quando o valor padrão do sklearn é np.nan.

Versão 1.0.7 (05/09/2023)

Novos recursos e atualizações

  • Permitir desabilitar a telemetria.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • Corrigido um erro relacionado a pandas.io.json.json_normalizer.

Versão 1.0.6 (01/09/2023)

Novos recursos e atualizações

  • Desenvolvimento de modelo: o tamanho do resultado da métrica pode exceder o limite anterior de 8MB.

Correções de bugs

  • Correções de desenvolvimento de modelo:

    • Corrigido um bug ao usar o imputer simples com NumPy >= 1.25.

    • Corrigido um bug ao inferir o tipo de colunas de rótulos.

Versão 1.0.5 (17/08/2023)

Esta versão contém apenas alterações internas.

Versão 1.0.4 (28/07/2023)

Novos recursos e atualizações

  • Desenvolvimento de modelo: os dataframes de entrada agora podem ser unidos aos dados carregados de arquivos preparados.

  • Desenvolvimento de modelo: adicionado suporte para idiomas diferentes do inglês.

Correções de bugs

  • Nenhum

Versão 1.0.3 (14/07/2023)

Esta versão contém apenas alterações internas.

Versão 1.0.2 (22/06/2023)

Novos recursos e atualizações

  • Desenvolvimento de modelo: métricas adicionadas:

    • d2_absolute_error_score

    • d2_pinball_score

    • explained_variance_score

    • mean_absolute_error

    • mean_absolute_percentage_error

    • mean_squared_error

Correções de bugs

Desenvolvimento de modelo: accuracy_score agora funciona quando são fornecidos nomes de colunas de rótulos que são listas de valores únicos.

Versão 1.0.1 (16/06/2023)

Mudanças de comportamento

  • Desenvolvimento de modelo: APIs de métricas alteradas para seguir os módulos de métricas do scikit-learn:

    • accuracy_score, confusion_matrix, precision_recall_fscore_support e precision_score são movidos para metrics.classification.

Novos recursos e atualizações

  • Desenvolvimento de modelo: métricas adicionadas:

    • f1_score

    • fbeta_score

    • recall_score

    • roc_auc_score

    • roc_curve

    • log_loss

    • precision_recall_curve

Versão 1.0.0 (09/06/2023)

Lançamento inicial de visualização pública.