Notes de version de Snowpark ML

Cet article contient les notes de version Snowpark ML, y compris les éléments suivants, le cas échéant :

  • Changements de comportement

  • Nouvelles fonctionnalités

  • Corrections de bogues pour les clients

Note

Ces notes n’incluent pas les modifications des fonctions qui n’ont pas fait l’objet d’une version publique.

Version 1.1.2 (2023-12-18)

Nouvelles fonctions et mises à jour

Mises à jour pour le développement de modèles :

  • Mise en œuvre de la métrique precision_score dans SQL.

Corrections de bogues

  • Correction d’un problème où la trace de pile était cachée par la télémétrie.

Correctifs pour le développement de modèles :

  • L’inférence des signatures de modèles ne matérialise plus le cadre de données complet en mémoire.

Version 1.1.1 (2023-12-6)

Nouvelles fonctions et mises à jour

  • L’API Snowpark ML Modeling désignée comme généralement disponible.

  • Le nouveau paramètre passthrough_col de l’API Modeling permet d’exclure des colonnes spécifiques, comme les colonnes d’index, lors de la formation ou de l’inférence, lorsque l’on ne spécifie pas explicitement des input_cols.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • confusion_matrix fournissait des résultats incorrects lorsque le nombre de lignes ne pouvait pas être divisé par la taille de lot.

Version 1.1.0 (2023-12-1)

Nouvelles fonctions et mises à jour

  • L’exécution de GridSearchCV et de RandomizedSearchCV est désormais distribuée sur des entrepôts à plusieurs nœuds.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Les colonnes étaient exclues si leurs noms normalisés ne correspondaient pas aux noms spécifiés dans output_columns dans OrdinalEncoder et dans LabelEncoder. Les colonnes de sortie n’ont plus besoin d’être des identificateurs Snowflake valides.

Version 1.0.12 (15-11-2023)

Nouvelles fonctions et mises à jour

  • Aucun

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Augmentation de la capacité de la colonne de OrdinalEncoder.

Version 1.0.11 (28-10-2023)

Nouvelles fonctions et mises à jour

  • Ajout de la prise en charge pour kneighbors.

  • Prise en charge de DecimalType en tant que type de données.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Correction de la prise en charge des modèles XGBoost et LightGBM à l’aide des sélecteurs de modèles SKLearn Grid Search et Randomized Search.

    • Corrige la compatibilité des métriques avec les DataFrames Snowpark qui utilisent les identificateurs Snowflake

Version 1.0.10 (15-10-2023)

Nouvelles fonctions et mises à jour

  • precision_score, recall_score, f1_score, fbeta_score, precision_recall_fscore_support, mean_absolute_error, mean_squared_error, et les calculs métriques mean_absolute_percentage_error sont maintenant distribués.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Correction d’erreurs de décodage UTF-8 lors de l’utilisation de modules de modélisation sous Windows.

    • Correction des définitions d’alias causant SnowparkSQLUnexpectedAliasException dans l’inférence.

Version 1.0.9 (28-09-2023)

Nouvelles fonctions et mises à jour

  • Le calcul de la métrique log_loss est maintenant distribué.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • La construction d’images n’échoue plus avec certaines configurations Docker.

    • L’intégration de la bibliothèque locale ML n’échoue plus lorsque la bibliothèque est importée par zipimport.

    • Mise à jour de la documentation incorrecte concernant l’argument de la plateforme dans la fonction deploy.

Version 1.0.8 (15-09-2023)

Nouvelles fonctions et mises à jour

  • Aucun

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Le codeur ordinal peut être utilisé avec des types de colonnes à entrée mixtes.

    • Correction d’un problème lorsque la valeur par défaut de sklearn est np.nan.

Version 1.0.7 (05-09-2023)

Nouvelles fonctions et mises à jour

  • Permet de désactiver la télémétrie.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Correction d’une erreur liée à pandas.io.json.json_normalizer.

Version 1.0.6 (2023-09-01)

Nouvelles fonctions et mises à jour

  • Développement de modèles : la taille du résultat des métriques peut dépasser la limite précédente qui est de 8MB.

Corrections de bogues

  • Correctifs pour le développement de modèles :

    • Correction d’un bogue lors de l’utilisation de l’impacteur simple avec NumPy >= 1,25.

    • Correction d’un bogue lors de l’inférence du type de colonnes de balises.

Version 1.0.5 (2023-08-17)

Cette version ne contient que des modifications internes.

Version 1.0.4 (2023-07-28)

Nouvelles fonctions et mises à jour

  • Développement de modèles : les dataframes d’entrée peuvent désormais être associés à des données chargées à partir de fichiers en zone de préparation.

  • Développement de modèles : ajout de la prise en charge des langues autres que l’anglais.

Corrections de bogues

  • Aucun

Version 1.0.3 (2023-07-14)

Cette version ne contient que des modifications internes.

Version 1.0.2 (2023-06-22)

Nouvelles fonctions et mises à jour

  • Développement de modèles : ajout de métriques :

    • d2_absolute_error_score

    • d2_pinball_score

    • explained_variance_score

    • mean_absolute_error

    • mean_absolute_percentage_error

    • mean_squared_error

Corrections de bogues

Développement de modèles : accuracy_score fonctionne désormais lorsque les noms des colonnes de balises donnés sont des listes de valeurs uniques.

Version 1.0.1 (2023-06-16)

Changements de comportement

  • Développement de modèles : modification des APIs de métriques pour suivre les modules de métriques scikit-learn :

    • Les méthodes accuracy_score, confusion_matrix, precision_recall_fscore_support, et precision_score sont déplacées vers metrics.classification.

Nouvelles fonctions et mises à jour

  • Développement de modèles : ajout de métriques :

    • f1_score

    • fbeta_score

    • recall_score

    • roc_auc_score

    • roc_curve

    • log_loss

    • precision_recall_curve

Version 1.0.0 (2023-06-09)

Première version de l’avant-première publique.