Notas de lançamento de Snowpark ML¶
Este artigo contém as notas de versão do Snowpark ML, incluindo o seguinte, quando aplicável:
Mudanças de comportamento
Novos recursos
Correções de bugs voltados para o cliente
Nota
Estas notas não incluem mudanças em recursos que não foram divulgados publicamente.
Versão 1.1.2 (18/12/2023)¶
Novos recursos e atualizações¶
Atualizações de desenvolvimento de modelo:
Métrica
precision_score
implementada em SQL.
Correções de bugs¶
Corrigido um problema em que o rastreamento de pilha era ocultado por telemetria.
Correções de desenvolvimento de modelo:
A inferência de assinaturas de modelo não materializa mais o dataframe completo na memória.
Versão 1.1.1 (6/12/2023)¶
Novos recursos e atualizações¶
Snowpark ML Modeling API designado como geralmente disponível.
O novo parâmetro
passthrough_col
na API de modelagem permite excluir colunas específicas, como colunas de índice, durante o treinamento ou inferência quando não especifica explicitamenteinput_cols
.
Correções de bugs¶
Correções de desenvolvimento de modelo:
confusion_matrix
forneceu resultados incorretos quando o número da linha não pôde ser dividido pelo tamanho do lote.
Versão 1.1.0 (01/12/2023)¶
Novos recursos e atualizações¶
A execução
GridSearchCV
eRandomizedSearchCV
agora é distribuída em warehouses de vários nós.
Correções de bugs¶
Correções de desenvolvimento de modelo:
As colunas estavam sendo excluídas se seus nomes normalizados não correspondessem aos nomes especificados em
output_columns
emOrdinalEncoder
eLabelEncoder
. As colunas de saída não precisam mais ser identificadores válidos do Snowflake.
Versão 1.0.12 (15/11/2023)¶
Novos recursos e atualizações¶
Nenhum
Correções de bugs¶
Correções de desenvolvimento de modelo:
Aumentou a capacidade da coluna de
OrdinalEncoder
.
Versão 1.0.11 (28/10/2023)¶
Novos recursos e atualizações¶
Adicione suporte para
kneighbors
.Suporte a
DecimalType
como um tipo de dados.
Correções de bugs¶
Correções de desenvolvimento de modelo:
Correção do suporte para modelos XGBoost e LightGBM usando os seletores de modelo SKLearn Grid Search e Randomized Search.
Corrigida a compatibilidade das métricas com o Snowpark DataFrames que usa identificadores Snowflake
Versão 1.0.10 (15/10/2023)¶
Novos recursos e atualizações¶
Os cálculos de métrica
precision_score
,recall_score
,f1_score
,fbeta_score
,precision_recall_fscore_support
,mean_absolute_error
,mean_squared_error
emean_absolute_percentage_error
agora são distribuídos.
Correções de bugs¶
Correções de desenvolvimento de modelo:
Corrigidos os erros de decodificação UTF-8 ao usar módulos de modelagem no Windows.
Corrigidas as definições de alias que causam
SnowparkSQLUnexpectedAliasException
na inferência.
Versão 1.0.9 (28/09/2023)¶
Novos recursos e atualizações¶
O cálculo da métrica
log_loss
agora está distribuído.
Correções de bugs¶
Correções de desenvolvimento de modelo:
A construção de imagens não falha mais com algumas configurações do Docker.
A incorporação da biblioteca ML local não falha mais quando a biblioteca é importada por zipimport.
Atualize a documentação incorreta sobre o argumento da plataforma na função
deploy
.
Versão 1.0.8 (15/09/2023)¶
Novos recursos e atualizações¶
Nenhum
Correções de bugs¶
Correções de desenvolvimento de modelo:
O codificador ordinal pode ser usado com tipos de coluna de entrada mistos.
Corrigido um problema quando o valor padrão do sklearn é
np.nan
.
Versão 1.0.7 (05/09/2023)¶
Novos recursos e atualizações¶
Permitir desabilitar a telemetria.
Correções de bugs¶
Correções de desenvolvimento de modelo:
Corrigido um erro relacionado a
pandas.io.json.json_normalizer
.
Versão 1.0.6 (01/09/2023)¶
Novos recursos e atualizações¶
Desenvolvimento de modelo: o tamanho do resultado da métrica pode exceder o limite anterior de 8MB.
Correções de bugs¶
Correções de desenvolvimento de modelo:
Corrigido um bug ao usar o imputer simples com NumPy >= 1.25.
Corrigido um bug ao inferir o tipo de colunas de rótulos.
Versão 1.0.5 (17/08/2023)¶
Esta versão contém apenas alterações internas.
Versão 1.0.4 (28/07/2023)¶
Novos recursos e atualizações¶
Desenvolvimento de modelo: os dataframes de entrada agora podem ser unidos aos dados carregados de arquivos preparados.
Desenvolvimento de modelo: adicionado suporte para idiomas diferentes do inglês.
Correções de bugs¶
Nenhum
Versão 1.0.3 (14/07/2023)¶
Esta versão contém apenas alterações internas.
Versão 1.0.2 (22/06/2023)¶
Novos recursos e atualizações¶
Desenvolvimento de modelo: métricas adicionadas:
d2_absolute_error_score
d2_pinball_score
explained_variance_score
mean_absolute_error
mean_absolute_percentage_error
mean_squared_error
Correções de bugs¶
Desenvolvimento de modelo: accuracy_score
agora funciona quando são fornecidos nomes de colunas de rótulos que são listas de valores únicos.
Versão 1.0.1 (16/06/2023)¶
Mudanças de comportamento¶
Desenvolvimento de modelo: APIs de métricas alteradas para seguir os módulos de métricas do scikit-learn:
accuracy_score
,confusion_matrix
,precision_recall_fscore_support
eprecision_score
são movidos parametrics.classification
.
Novos recursos e atualizações¶
Desenvolvimento de modelo: métricas adicionadas:
f1_score
fbeta_score
recall_score
roc_auc_score
roc_curve
log_loss
precision_recall_curve
Versão 1.0.0 (09/06/2023)¶
Lançamento inicial de visualização pública.