Snowpark ML-Versionshinweise¶
Dieser Artikel enthält die Versionshinweise für Snowpark ML, einschließlich der folgenden, sofern zutreffend:
Verhaltensänderungen
Neue Features
Fehlerkorrekturen für Kunden
Bemerkung
Diese Hinweise enthalten keine Änderungen an Features, die noch nicht veröffentlicht wurden.
Version 1.1.2 (2023-12-18)¶
Neue Features und Aktualisierungen¶
Aktualisierungen bei Modellentwicklung:
Implementierte
precision_score
-Kennzahl in SQL.
Fehlerkorrekturen¶
Problem behoben, bei dem der Stacktrace von der Telemetrie ausgeblendet wird.
Probleme bei Modellentwicklung behoben:
Beim Ableiten von Modellsignaturen wird nicht mehr der gesamte Datenframe im Arbeitsspeicher materialisiert.
Version 1.1.1 (2023-12-6)¶
Neue Features und Aktualisierungen¶
Snowpark ML Modeling-API als „Allgemein verfügbar“ ausgewiesen.
Der neue Parameter
passthrough_col
der Modellierungs-API ermöglicht das Ausschließen bestimmter Spalten, wie z. B. Indexspalten, während Training oder Inferenz, wenn nicht ausdrücklichinput_cols
angegeben wird.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
confusion_matrix
lieferte fehlerhafte Ergebnisse, wenn die Zeilenzahl nicht durch die Batchgröße geteilt werden konnte.
Version 1.1.0 (2023-12-1)¶
Neue Features und Aktualisierungen¶
Ausführung von
GridSearchCV
undRandomizedSearchCV
ist nun auf Warehouses mit mehreren Knoten verteilt.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Spalten wurden ausgeschlossen, wenn deren normalisierte Namen nicht mit den Namen übereinstimmten, die in
output_columns
vonOrdinalEncoder
undLabelEncoder
angegeben waren. Die Ausgabespalten müssen keine gültigen Snowflake-Bezeichner mehr sein.
Version 1.0.12 (2023-11-15)¶
Neue Features und Aktualisierungen¶
Keine
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Spaltenkapazität von
OrdinalEncoder
erhöht.
Version 1.0.11 (2023-10-28)¶
Neue Features und Aktualisierungen¶
Unterstützung von
kneighbors
hinzugefügt.Unterstützung von
DecimalType
als Datentyp.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Problem bei Unterstützung von XGBoost- und LightGBM-Modellen mit SKLearn Grid Search- und Randomized Search-Modellselektoren behoben.
Problem bei Kompatibilität von Metriken mit Snowpark-DataFrames behoben, die Snowflake-Bezeichner verwenden
Version 1.0.10 (2023-10-15)¶
Neue Features und Aktualisierungen¶
Metrische Berechnungen mit
precision_score
,recall_score
,f1_score
,fbeta_score
,precision_recall_fscore_support
,mean_absolute_error
,mean_squared_error
undmean_absolute_percentage_error
sind jetzt verteilt.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Probleme mit UTF-8 Dekodierungsfehlern bei der Verwendung von Modellierungsmodulen unter Windows behoben.
Problem mit Alias-Definitionen behoben, die
SnowparkSQLUnexpectedAliasException
bei Inferenz verursachen.
Version 1.0.9 (2023-09-28)¶
Neue Features und Aktualisierungen¶
Berechnung der
log_loss
-Metrik ist nun verteilt.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Problem mit Fehlschlagen einiger Docker-Konfigurationen beim Erstellen von Images behoben.
Problem mit Einbetten der lokalen ML-Bibliothek beim Import der Bibliothek durch zipimport behoben.
Fehlerhafte Dokumentation zu Plattform-Argument in der Funktion
deploy
korrigiert.
Version 1.0.8 (2023-09-15)¶
Neue Features und Aktualisierungen¶
Keine
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Ordinal-Encoder kann mit gemischten Eingangsspaltentypen verwendet werden.
Problem mit sklearn-Standardwert
np.nan
behoben.
Version 1.0.7 (2023-09-05)¶
Neue Features und Aktualisierungen¶
Deaktivieren der Telemetrie ist nun zulässig.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Problem im Zusammenhang mit
pandas.io.json.json_normalizer
behoben.
Version 1.0.6 (2023-09-01)¶
Neue Features und Aktualisierungen¶
Modellentwicklung: Ergebnisgröße der Kennzahlen kann die bisherige Grenze von 8 MB überschreiten.
Fehlerkorrekturen¶
Probleme bei Modellentwicklung behoben:
Fehler bei der Verwendung einfacher Imputer mit NumPy >= 1,25 behoben.
Fehler bei der Ableitung des Typs von Beschriftungsspalten behoben.
Version 1.0.5 (2023-08-17)¶
Diese Version enthält nur interne Änderungen.
Version 1.0.4 (2023-07-28)¶
Neue Features und Aktualisierungen¶
Modellentwicklung: Eingabe-Datenframes können jetzt mit Daten verknüpft werden, die aus Stagingdateien geladen wurden.
Modellentwicklung: Unterstützung von Sprachen hinzugefügt, die nicht Englisch sind.
Fehlerkorrekturen¶
Keine
Version 1.0.3 (2023-07-14)¶
Diese Version enthält nur interne Änderungen.
Version 1.0.2 (2023-06-22)¶
Neue Features und Aktualisierungen¶
Modellentwicklung: Kennzahlen hinzugefügt:
d2_absolute_error_score
d2_pinball_score
explained_variance_score
mean_absolute_error
mean_absolute_percentage_error
mean_squared_error
Fehlerkorrekturen¶
Modellentwicklung: accuracy_score
funktioniert jetzt auch bei Label-Spaltennamen, die Listen von Einzelwerten sind.
Version 1.0.1 (2023-06-16)¶
Verhaltensänderungen¶
Modellentwicklung: Kennzahlen-APIs wurde geändert, um den Scikit-Learn-Metrikmodulen zu folgen:
Methoden
accuracy_score
,confusion_matrix
,precision_recall_fscore_support
undprecision_score
werden zumetrics.classification
verschoben.
Neue Features und Aktualisierungen¶
Modellentwicklung: Kennzahlen hinzugefügt:
f1_score
fbeta_score
recall_score
roc_auc_score
roc_curve
log_loss
precision_recall_curve
Version 1.0.0 (2023-06-09)¶
Erstes öffentliches Vorschau-Release.