Snowpark ML-Versionshinweise

Dieser Artikel enthält die Versionshinweise für Snowpark ML, einschließlich der folgenden, sofern zutreffend:

  • Verhaltensänderungen

  • Neue Features

  • Fehlerkorrekturen für Kunden

Bemerkung

Diese Hinweise enthalten keine Änderungen an Features, die noch nicht veröffentlicht wurden.

Version 1.1.2 (2023-12-18)

Neue Features und Aktualisierungen

Aktualisierungen bei Modellentwicklung:

  • Implementierte precision_score-Kennzahl in SQL.

Fehlerkorrekturen

  • Problem behoben, bei dem der Stacktrace von der Telemetrie ausgeblendet wird.

Probleme bei Modellentwicklung behoben:

  • Beim Ableiten von Modellsignaturen wird nicht mehr der gesamte Datenframe im Arbeitsspeicher materialisiert.

Version 1.1.1 (2023-12-6)

Neue Features und Aktualisierungen

  • Snowpark ML Modeling-API als „Allgemein verfügbar“ ausgewiesen.

  • Der neue Parameter passthrough_col der Modellierungs-API ermöglicht das Ausschließen bestimmter Spalten, wie z. B. Indexspalten, während Training oder Inferenz, wenn nicht ausdrücklich input_cols angegeben wird.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • confusion_matrix lieferte fehlerhafte Ergebnisse, wenn die Zeilenzahl nicht durch die Batchgröße geteilt werden konnte.

Version 1.1.0 (2023-12-1)

Neue Features und Aktualisierungen

  • Ausführung von GridSearchCV und RandomizedSearchCV ist nun auf Warehouses mit mehreren Knoten verteilt.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Spalten wurden ausgeschlossen, wenn deren normalisierte Namen nicht mit den Namen übereinstimmten, die in output_columns von OrdinalEncoder und LabelEncoder angegeben waren. Die Ausgabespalten müssen keine gültigen Snowflake-Bezeichner mehr sein.

Version 1.0.12 (2023-11-15)

Neue Features und Aktualisierungen

  • Keine

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Spaltenkapazität von OrdinalEncoder erhöht.

Version 1.0.11 (2023-10-28)

Neue Features und Aktualisierungen

  • Unterstützung von kneighbors hinzugefügt.

  • Unterstützung von DecimalType als Datentyp.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Problem bei Unterstützung von XGBoost- und LightGBM-Modellen mit SKLearn Grid Search- und Randomized Search-Modellselektoren behoben.

    • Problem bei Kompatibilität von Metriken mit Snowpark-DataFrames behoben, die Snowflake-Bezeichner verwenden

Version 1.0.10 (2023-10-15)

Neue Features und Aktualisierungen

  • Metrische Berechnungen mit precision_score, recall_score, f1_score, fbeta_score, precision_recall_fscore_support, mean_absolute_error, mean_squared_error und mean_absolute_percentage_error sind jetzt verteilt.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Probleme mit UTF-8 Dekodierungsfehlern bei der Verwendung von Modellierungsmodulen unter Windows behoben.

    • Problem mit Alias-Definitionen behoben, die SnowparkSQLUnexpectedAliasException bei Inferenz verursachen.

Version 1.0.9 (2023-09-28)

Neue Features und Aktualisierungen

  • Berechnung der log_loss-Metrik ist nun verteilt.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Problem mit Fehlschlagen einiger Docker-Konfigurationen beim Erstellen von Images behoben.

    • Problem mit Einbetten der lokalen ML-Bibliothek beim Import der Bibliothek durch zipimport behoben.

    • Fehlerhafte Dokumentation zu Plattform-Argument in der Funktion deploy korrigiert.

Version 1.0.8 (2023-09-15)

Neue Features und Aktualisierungen

  • Keine

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Ordinal-Encoder kann mit gemischten Eingangsspaltentypen verwendet werden.

    • Problem mit sklearn-Standardwert np.nan behoben.

Version 1.0.7 (2023-09-05)

Neue Features und Aktualisierungen

  • Deaktivieren der Telemetrie ist nun zulässig.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Problem im Zusammenhang mit pandas.io.json.json_normalizer behoben.

Version 1.0.6 (2023-09-01)

Neue Features und Aktualisierungen

  • Modellentwicklung: Ergebnisgröße der Kennzahlen kann die bisherige Grenze von 8 MB überschreiten.

Fehlerkorrekturen

  • Probleme bei Modellentwicklung behoben:

    • Fehler bei der Verwendung einfacher Imputer mit NumPy >= 1,25 behoben.

    • Fehler bei der Ableitung des Typs von Beschriftungsspalten behoben.

Version 1.0.5 (2023-08-17)

Diese Version enthält nur interne Änderungen.

Version 1.0.4 (2023-07-28)

Neue Features und Aktualisierungen

  • Modellentwicklung: Eingabe-Datenframes können jetzt mit Daten verknüpft werden, die aus Stagingdateien geladen wurden.

  • Modellentwicklung: Unterstützung von Sprachen hinzugefügt, die nicht Englisch sind.

Fehlerkorrekturen

  • Keine

Version 1.0.3 (2023-07-14)

Diese Version enthält nur interne Änderungen.

Version 1.0.2 (2023-06-22)

Neue Features und Aktualisierungen

  • Modellentwicklung: Kennzahlen hinzugefügt:

    • d2_absolute_error_score

    • d2_pinball_score

    • explained_variance_score

    • mean_absolute_error

    • mean_absolute_percentage_error

    • mean_squared_error

Fehlerkorrekturen

Modellentwicklung: accuracy_score funktioniert jetzt auch bei Label-Spaltennamen, die Listen von Einzelwerten sind.

Version 1.0.1 (2023-06-16)

Verhaltensänderungen

  • Modellentwicklung: Kennzahlen-APIs wurde geändert, um den Scikit-Learn-Metrikmodulen zu folgen:

    • Methoden accuracy_score, confusion_matrix, precision_recall_fscore_support und precision_score werden zu metrics.classification verschoben.

Neue Features und Aktualisierungen

  • Modellentwicklung: Kennzahlen hinzugefügt:

    • f1_score

    • fbeta_score

    • recall_score

    • roc_auc_score

    • roc_curve

    • log_loss

    • precision_recall_curve

Version 1.0.0 (2023-06-09)

Erstes öffentliches Vorschau-Release.