Versionshinweise zur Snowpark-Bibliothek für Python 2025

Dieser Artikel enthält die Versionshinweise für Snowpark Library for Python, einschließlich der folgenden, sofern zutreffend:

  • Verhaltensänderungen

  • Neue Features

  • Fehlerkorrekturen für Kunden

Snowflake verwendet semantische Versionierung für Snowpark Library for Python-Aktualisierungen.

Siehe Snowpark-Entwicklerhandbuch für Python für die Dokumentation.

Warnung

Da Python 3.8 sein End of Life erreicht hat, werden bei der Verwendung von snowpark-python mit Python 3.8 Verfallswarnungen ausgelöst. Weitere Details dazu finden Sie unter Unterstützung der Snowflake-Python-Laufzeitumgebung. Snowpark Python 1.24.0 wird die letzte Client- und Serverversion sein, die Python 3.8 unterstützt, in Übereinstimmung mit der Richtlinie von Anaconda. Aktualisieren Sie Ihre vorhandenen Python 3.8-Objekte auf Python 3.9 oder höher.

Version 1.32.0 (2025-05-15)

Verbesserungen

  • Der Aufruf von Snowflake-Systemprozeduren führt nicht zu einem zusätzlichen Aufruf von describe procedure, um den Rückgabetyp der Prozedur zu überprüfen.

  • Unterstützung für Session.create_dataframe() mit deder Stage-URL und dem Datentyp FILE wurde hinzugefügt.

  • Unterstützung für verschiedene Modi zum Umgang mit beschädigten XML-Datensätzen beim Lesen einer XML Datei mit session.read.option('mode', <mode>), option('rowTag', <tag_name>).xml(<stage_file_path>). Derzeit wird PERMISSIVE, DROPMALFORMED und FAILFAST unterstützt.

  • Die Fehlermeldung des XML-Readers wurde verbessert, wenn die angegebene ROWTAG nicht in der Datei gefunden wird.

  • Die Erstellung von Abfragen für Dataframe.drop wurde verbessert, um SELECT * EXCLUDE () zu verwenden, um die ausgelassenen Spalten auszuschließen. Um dieses Feature zu aktivieren, stellen Sie session.conf.set("use_simplified_query_generation", True) ein.

  • Unterstützung für VariantType wurde zu StructType.from_json hinzugefügt.

Fehlerkorrekturen

  • Es wurde ein Fehler in DataFrameWriter.dbapi (Private Vorschau) behoben, bei dem Spaltennamen in Unicode- oder doppelten Anführungszeichen in externen Datenbanken zu Fehlern führten, weil sie nicht korrekt in Anführungszeichen gesetzt wurden.

  • Es wurde ein Fehler behoben, bei dem benannte Felder in verschachtelten OBJECT-Daten Fehler verursachen konnten, wenn sie Leerzeichen enthielten.

Lokale Snowpark-Testaktualisierungen

Fehlerkorrekturen

  • Ein Fehler in snowflake.snowpark.functions.rank wurde behoben, bei dem die Sortierrichtung nicht beachtet wurde.

  • Es wurde ein Fehler in snowflake.snowpark.functions.to_timestamp_* behoben, der bei gefilterten Daten zu falschen Ergebnissen führte.

Snowpark Pandas API-Aktualisierungen

Neue Features

  • Unterstützung für dict-Werte in Series.str.get, Series.str.slice und Series.str.__getitem__ hinzugefügt (Series.str[...]).

  • Unterstützung von DataFrame.to_html hinzugefügt.

  • Unterstützung für DataFrame.to_string und Series.to_string hinzugefügt.

  • Unterstützung für das Lesen von Dateien aus S3-Buckets mit pd.read_csv wurde hinzugefügt.

Verbesserungen

  • Machen Sie iceberg_config zu einem erforderlichen Parameter für DataFrame.to_iceberg und Series.to_iceberg.

Version 1.31.0 (2025-04-24)

Neue Features

  • Unterstützung für die Erlaubnis restricted caller des Arguments execute_as in StoredProcedure.register():code: hinzugefügt.

  • Unterstützung für Nicht-Select-Anweisungen in DataFrame.to_pandas() wurde hinzugefügt.

  • Unterstützung für den Parameter artifact_repository wurde zu Session.add_packages, Session.add_requirements, Session.get_packages, Session.remove_package und Session.clear_packages hinzugefügt.

  • Unterstützung für das Lesen einer XML-Datei unter Verwendung eines Zeilen-Tags durch session.read.option('rowTag', <tag_name>).xml(<stage_file_path>) (experimentell) hinzugefügt.

    • Jeder XML-Datensatz wird als eine separate Zeile extrahiert.

    • Jedes Feld innerhalb dieses Datensatzes wird zu einer separaten Spalte des Typs VARIANT, die unter Verwendung der Punktnotation weiter abgefragt werden kann, z. B. col(a.b.c).

  • Aktualisierungen zu DataFrameReader.dbapi (PrPr) hinzugefügt:

    • Der Parameter fetch_merge_count wurde hinzugefügt, um die Leistung zu optimieren, indem mehrere abgerufene Daten in einer einzigen Parquet-Datei zusammengeführt werden.

    • Unterstützung für Databricks wurde hinzugefügt.

    • Unterstützung für das Einlesen mit Snowflake UDTF wurde hinzugefügt.

  • Unterstützung für die folgenden AI-fähigen Funktionen in functions.py (Private Vorschau) hinzugefügt:

    • prompt

    • ai_filter (Unterstützung für die Funktion prompt() und Bilddateien hinzugefügt und den Namen des zweiten Arguments von expr in file geändert)

    • ai_classify

Verbesserungen

  • Benennen Sie den Parameter relaxed_ordering in enforce_ordering für DataFrame.to_snowpark_pandas um. Außerdem lautet der neue Standardwert enforce_ordering=False, was den gegenteiligen Effekt des vorherigen Standardwerts, relaxed_ordering=False, hat.

  • Die Leseleistung von DataFrameReader.dbapi (PrPr) wurde verbessert, indem der Standardwert des Parameters fetch_size auf 1000 gesetzt wurde.

  • Verbessern Sie die Fehlermeldung für Fehler durch ungültige Bezeichner-SQL, indem Sie die potenziell passenden Bezeichner vorschlagen.

  • Die Anzahl der Abfragen zur Beschreibung beim Erstellen eines DataFrame aus einer Snowflake-Tabelle mit session.table wurde reduziert.

  • Verbesserte Leistung und Genauigkeit von DataFrameAnalyticsFunctions.time_series_agg().

Fehlerkorrekturen

  • Ein Fehler in DataFrame.group_by().pivot().agg wurde behoben, wenn die Pivotspalte und die aggregierte Spalte identisch sind.

  • Ein Fehler in DataFrameReader.dbapi (PrPr) wurde behoben, bei dem ein TypeError ausgelöst wurde, wenn create_connection ein Verbindungsobjekt eines nicht unterstützten Treibers zurückgab.

  • Es wurde ein Fehler behoben, bei dem der Aufruf von df.limit(0) nicht korrekt angewendet wurde.

  • Es wurde ein Fehler in DataFrameWriter.save_as_table behoben, der dazu führte, dass reservierte Namen bei der Verwendung des Anfügemodus zu Fehlern führten.

Veraltete Funktionen

  • Veraltete Unterstützung für Python 3.8.

  • Veraltetes Argument sliding_interval in DataFrameAnalyticsFunctions.time_series_agg().

Lokale Snowpark-Testaktualisierungen

Neue Features

  • Unterstützung für Intervall-Ausdrücke zu Window.range_between hinzugefügt.

  • Unterstützung für die Funktion array_construct wurde hinzugefügt.

Fehlerkorrekturen

  • Es wurde ein Fehler beim lokalen Testen behoben, bei dem das transiente Verzeichnis __pycache__ während der Ausführung einer gespeicherten Prozedur über den Import unbeabsichtigt kopiert wurde.

  • Es wurde ein Fehler beim lokalen Testen behoben, der zu einem falschen Ergebnis bei Aufrufen von Column.like führte.

  • Beim lokalen Testen wurde ein Fehler behoben, der dazu führte, dass Column.getItem und snowpark.snowflake.functions.get IndexError auslösten, anstatt null zurückzugeben.

  • Beim lokalen Testen wurde ein Fehler behoben, bei dem der Aufruf von df.limit(0) nicht korrekt angewendet wurde.

  • Beim lokalen Testen wurde ein Fehler behoben, bei dem Table.merge in einer leeren Tabelle eine Ausnahme verursachte.

Snowpark Pandas API-Aktualisierungen

Aktualisierungen der Abhängigkeiten

  • modin von 0.30.1 auf 0.32.0 aktualisiert.

  • Unterstützung für numpy 2.0 und höher wurde hinzugefügt.

Neue Features

  • Unterstützung für DataFrame.create_or_replace_view und Series.create_or_replace_view hinzugefügt.

  • Unterstützung für DataFrame.create_or_replace_dynamic_table und Series.create_or_replace_dynamic_table hinzugefügt.

  • Unterstützung für DataFrame.to_view und Series.to_view hinzugefügt.

  • Unterstützung für DataFrame.to_dynamic_table und Series.to_dynamic_table hinzugefügt.

  • Unterstützung für DataFrame.groupby.resample für die Aggregationen max, mean, median, min und sum wurde hinzugefügt.

  • Unterstützung für das Lesen von Stagingdateien wurde hinzugefügt:

    • pd.read_excel

    • pd.read_html

    • pd.read_pickle

    • pd.read_sas

    • pd.read_xml

  • Unterstützung für DataFrame.to_iceberg und Series.to_iceberg hinzugefügt.

  • Unterstützung für dict-Werte in Series.str.len hinzugefügt.

Verbesserungen

  • Verbessern Sie die Leistung von DataFrame.groupby.apply und Series.groupby.apply, indem Sie den teuren Pivot-Schritt vermeiden.

  • Eine Schätzung für die obere Grenze der Zeilenzahl wurde zu OrderedDataFrame hinzugefügt, um einen besseren Wechsel der Engine zu ermöglichen. Dies könnte zu einer erhöhten Anzahl von Abfragen führen.

  • Benennen Sie den Parameter relaxed_ordering in enforce_ordering in pd.read_snowflake um. Außerdem lautet der neue Standardwert enforce_ordering=False, was den gegenteiligen Effekt des vorherigen Standardwerts, relaxed_ordering=False, hat.

Fehlerkorrekturen

  • Ein Fehler für pd.read_snowflake beim Lesen von Iceberg-Tabellen und enforce_ordering=True wurde behoben.

Version 1.30.0 (2025-03-27)

Neue Features

  • Unterstützung für lockere Konsistenz- und Ordnungsgarantien in Dataframe.to_snowpark_pandas durch Einführung des Parameters relaxed_ordering.

  • DataFrameReader.dbapi (Vorschau) akzeptiert jetzt eine Liste von Strings für den Parameter session_init_statement, so dass mehrere SQL-Anweisungen während der Sitzungsinitialisierung ausgeführt werden können.

Verbesserungen

  • Die Abfragegenerierung für Dataframe.stat.sample_by wurde verbessert, um eine einzige flache Abfrage zu generieren, die bei einem großen fractions-Wörterbuch gut skaliert, verglichen mit der älteren Methode, für jeden Schlüssel in fractions eine Unterabfrage UNION ALL zu erstellen. Um dieses Feature zu aktivieren, stellen Sie session.conf.set("use_simplified_query_generation", True) ein.

  • Die Leistung von DataFrameReader.dbapi wurde verbessert, indem die vektorisierte Option beim Kopieren einer Parkettdatei in eine Tabelle aktiviert wurde.

  • Die Generierung von Abfragen für DataFrame.random_split wurde in folgenden Punkten verbessert Sie können durch die Einstellung session.conf.set("use_simplified_query_generation", True) aktiviert werden:

    • In der internen Implementierung des Eingabedatenrahmens ist es nicht mehr erforderlich, cache_result zu verwenden, was zu einer reinen Lazy-Dataframe-Operation führt.

    • Das Argument seed verhält sich jetzt wie erwartet mit wiederholbaren Ergebnissen über mehrere Aufrufe und Sitzungen hinweg.

  • DataFrame.fillna und DataFrame.replace unterstützen nun beide das Anpassen von int und float in Decimal-Spalten, wenn include_decimal auf True gesetzt ist.

  • Dokumentation für die folgenden UDF und Stored-Procedure-Funktionen in files.py als Ergebnis ihrer allgemeinen Verfügbarkeit hinzugefügt.

    • SnowflakeFile.write

    • SnowflakeFile.writelines

    • SnowflakeFile.writeable

  • Kleinere Änderungen in der Dokumentation für SnowflakeFile und SnowflakeFile.open().

Fehlerkorrekturen

  • Es wurde ein Bug bei den folgenden Funktionen behoben, der zu Fehlern führte. .cast() wird auf deren Ausgabe angewendet:

    • from_json

    • size

Lokale Snowpark-Testaktualisierungen

Fehlerkorrekturen

  • Es wurde ein Fehler in der Aggregation behoben, der dazu führte, dass leere Gruppen immer noch Zeilen erzeugten.

  • Es wurde ein Fehler in Dataframe.except_ behoben, der dazu führte, dass Zeilen fälschlicherweise gelöscht wurden.

  • Es wurde ein Fehler behoben, der dazu führte, dass to_timestamp bei der Umwandlung gefilterter Spalten fehlschlug.

Snowpark Pandas API-Aktualisierungen

Neue Features

  • Unterstützung für Listenwerte in Series.str.__getitem__ (Series.str[...]) wurde hinzugefügt.

  • Unterstützung für pd.Grouper-Objekte in GROUP BY-Operationen hinzugefügt. Wenn freq angegeben wird, werden die Standardwerte der Argumente sort, closed, label und convention unterstützt; origin wird unterstützt, wenn es start oder start_day ist.

  • Durch die Einführung des neuen Parameters relaxed_ordering wurde die Unterstützung für entspannte Konsistenz- und Ordnungsgarantien in pd.read_snowflake sowohl für benannte Datenquellen (z. B. Tabellen und Ansichten) als auch für Abfrage-Datenquellen hinzugefügt.

Verbesserungen

  • Geben Sie eine Warnung aus, wenn festgestellt wird, dass QUOTED_IDENTIFIERS_IGNORE_CASE gesetzt ist, und fordern Sie den Benutzer auf, die Einstellung rückgängig zu machen.

  • Es wurde verbessert, wie ein fehlendes index_label in DataFrame.to_snowflake und Series.to_snowflake behandelt wird, wenn index=True. Anstatt einen ValueError zu melden, werden systemdefinierte Bezeichnungen für die Indexspalten verwendet.

  • Die Fehlermeldung für groupby, DataFrame, oder Series.agg wurde verbessert, wenn der Funktionsname nicht unterstützt wird.

Lokale Snowpark-Testaktualisierungen

Verbesserungen

  • Geben Sie eine Warnung aus, wenn festgestellt wird, dass QUOTED_IDENTIFIERS_IGNORE_CASE gesetzt ist, und fordern Sie den Benutzer auf, die Einstellung rückgängig zu machen.

  • Es wurde verbessert, wie ein fehlendes index_label in DataFrame.to_snowflake und Series.to_snowflake behandelt wird, wenn index=True. Anstatt einen ValueError zu melden, werden systemdefinierte Bezeichnungen für die Indexspalten verwendet.

  • Verbesserte Fehlermeldung für groupby or DataFrame or Series.agg, wenn der Funktionsname nicht unterstützt wird.

Version 1.29.1 (2025-03-12)

Fehlerkorrekturen

  • Es wurde ein Fehler in DataFrameReader.dbapi (private Vorschau) behoben, der die Verwendung in gespeicherten Prozeduren und Snowbooks verhindert.

Version 1.29.0 (2025-03-05)

Neue Features

  • Unterstützung für die folgenden AI-fähigen Funktionen in functions.py (Private Vorschau) hinzugefügt:

    • ai_filter

    • ai_agg

    • summarize_agg

  • Unterstützung für den neuen Typ FILE SQL mit den folgenden zugehörigen Funktionen in functions.py (Private Vorschau) hinzugefügt:

    • fl_get_content_type

    • fl_get_etag

    • fl_get_file_type

    • fl_get_last_modified

    • fl_get_relative_path

    • fl_get_scoped_file_url

    • fl_get_size

    • fl_get_stage

    • fl_get_stage_file_url

    • fl_is_audio

    • fl_is_compressed

    • fl_is_document

    • fl_is_image

    • fl_is_video

  • Unterstützung für den Import von Paketen von Drittanbietern von PyPi mit Hilfe des Artefakt-Repository (Private Vorschau) wurde hinzugefügt:

    • Verwenden Sie die Schlüsselwortargumente artifact_repository und artifact_repository_packages, um bei der Registrierung von gespeicherten Prozeduren oder benutzerdefinierten Funktionen Ihr Artefakt-Repository bzw. Ihre Pakete anzugeben.

    • Unterstützte APIs sind:

      • Session.sproc.register

      • Session.udf.register

      • Session.udaf.register

      • Session.udtf.register

      • functions.sproc

      • functions.udf

      • functions.udaf

      • functions.udtf

      • functions.pandas_udf

      • functions.pandas_udtf

Verbesserungen

  • Verbesserte Versionsvalidierungswarnungen für snowflake-snowpark-python-Paketkompatibilität bei der Registrierung von gespeicherten Prozeduren. Jetzt werden Warnungen nur noch ausgelöst, wenn die Haupt- oder Nebenversion nicht übereinstimmt, während Bugfix-Versionsunterschiede keine Warnungen mehr erzeugen.

  • Die Cloudpickle-Abhängigkeit wurde erhöht, um zusätzlich zu den früheren Versionen auch cloudpickle==3.0.0 zu unterstützen.

Fehlerkorrekturen

  • Es wurde ein Fehler behoben, bei dem das Erstellen eines Datenrahmens mit einer großen Anzahl von Werten zu einem Unsupported feature 'SCOPED_TEMPORARY'.-Fehler führte, wenn die Thread-sichere Sitzung deaktiviert war.

  • Es wurde ein Fehler behoben, bei dem df.describe einen internen SQL-Ausführungsfehler auslöste, wenn DataFrame aus dem Lesen einer Stagingdatei erstellt wurde und die CTE-Optimierung aktiviert war.

  • Es wurde ein Fehler behoben, bei dem df.order_by(A).select(B).distinct() ungültige SQL generierte, wenn die vereinfachte Abfragegenerierung mit session.conf.set("use_simplified_query_generation", True) aktiviert war.

    • Standardmäßig ist die vereinfachte Abfrageerstellung deaktiviert.

Snowpark Pandas API-Aktualisierungen

Verbesserungen

  • Verbessern Sie die Fehlermeldung für pd.to_snowflake, DataFrame.to_snowflake, und Series.to_snowflake, wenn die Tabelle nicht existiert.

  • Verbessern Sie die Lesbarkeit des Docstring für den Parameter if_exists in pd.to_snowflake, DataFrame.to_snowflake und Series.to_snowflake.

  • Verbesserte Fehlermeldung für alle pandas-Funktionen, die UDFs mit Snowpark-Objekten verwenden.

Fehlerkorrekturen

  • Ein Fehler in Series.rename_axis wurde behoben, bei dem ein AttributeError ausgelöst wurde.

  • Ein Fehler wurde behoben, bei dem pd.get_dummies die Werte NULL/NaN nicht standardmäßig ignorierte.

  • Es wurde ein Fehler behoben, bei dem wiederholte Aufrufe von pd.get_dummies zu „Duplicated column name error“ führten.

  • Es wurde ein Fehler in pd.get_dummies behoben, bei dem die Übergabe einer Liste von Spalten zu falschen Spaltenbeschriftungen im Ausgabe-DataFrame führte.

  • Aktualisieren Sie pd.get_dummies, um bool-Werte anstelle von int zurückzugeben.

Lokale Snowpark-Testaktualisierungen

Neue Features

  • Unterstützung von literalen Werten zur Fensterfunktion range_between hinzugefügt.

Version 1.28.0 (2025-02-20)

Neue Features

  • Unterstützung für die folgenden Funktionen in functions.py wurde hinzugefügt:

    • normal

    • randn

  • Unterstützung für den Parameter allow_missing_columns wurde zu Dataframe.union_by_name und Dataframe.union_all_by_name hinzugefügt.

Verbesserungen

  • Die Generierung zufälliger Objektnamen wurde verbessert, um Kollisionen zu vermeiden.

  • Die Generierung von Abfragen für Dataframe.distinct wurde verbessert, um SELECT DISTINCT anstelle von SELECT mit GROUP BY in allen Spalten zu generieren. Um dieses Feature zu deaktivieren, stellen Sie session.conf.set("use_simplified_query_generation", False) ein.

Veraltete Funktionen

  • Veraltete Snowpark Python-Funktion snowflake_cortex_summarize. Benutzer können snowflake-ml-python installieren und stattdessen die Funktion snowflake.cortex.summarize verwenden.

  • Veraltete Snowpark Python-Funktion snowflake_cortex_sentiment. Benutzer können snowflake-ml-python installieren und stattdessen die Funktion snowflake.cortex.sentiment verwenden.

Fehlerkorrekturen

  • Es wurde ein Fehler behoben, bei dem das Abfrage-Tag auf Sitzungsebene durch eine Stapelverfolgung für DataFrames überschrieben wurde, die mehrere Abfragen erzeugt. Jetzt wird das Abfrage-Tag nur dann auf den Stacktrace gesetzt, wenn session.conf.set("collect_stacktrace_in_query_tag", True).

  • Ein Fehler in Session._write_pandas wurde behoben, bei dem beim Schreiben eines Snowpark-Pandas-Objekts der Parameter use_logical_type fälschlicherweise an Session._write_modin_pandas_helper übergeben wurde.

  • Es wurde ein Fehler bei der Erzeugung von Options-SQL behoben, der dazu führen konnte, dass mehrere Werte falsch formatiert wurden.

  • Es wurde ein Fehler in Session.catalog behoben, bei dem leere Zeichenketten für Datenbank oder Schema nicht korrekt behandelt wurden und fehlerhafte SQL-Anweisungen erzeugten.

Experimentelle Features

  • Unterstützung für das Schreiben von Pyarrow-Tabellen in Snowflake-Tabellen wurde hinzugefügt.

Snowpark Pandas API-Aktualisierungen

Neue Features

  • Unterstützung für die Anwendung der Snowflake Cortex-Funktionen Summarize und Sentiment wurde hinzugefügt.

  • Unterstützung für Listenwerte in Series.str.get wurde hinzugefügt.

Fehlerkorrekturen

  • Ein Fehler in apply wurde behoben, bei dem kwargs nicht korrekt an die angewandte Funktion übergeben wurde.

Lokale Snowpark-Testaktualisierungen

Neue Features

  • Unterstützung für die folgenden Funktionen wurde hinzugefügt
    • hour

    • minute

  • Unterstützung für den Parameter NULL_IF wurde dem CSV Reader hinzugefügt.

  • Unterstützung für die Optionen date_format, datetime_format und timestamp_format beim Laden von CSVs wurde hinzugefügt.

Fehlerkorrekturen

  • Es wurde ein Fehler in DataFrame.join behoben, der dazu führte, dass Spalten falsch eingegeben wurden.

  • Es wurde ein Fehler in when-Anweisungen behoben, der zu falschen Ergebnissen in der otherwise-Klausel führte.

Version 1.27.0 (2025-02-05)

Neue Features

Unterstützung für die folgenden Funktionen in functions.py wurde hinzugefügt:

  • array_reverse

  • divnull

  • map_cat

  • map_contains_key

  • map_keys

  • nullifzero

  • snowflake_cortex_sentiment

  • acosh

  • asinh

  • atanh

  • bit_length

  • bitmap_bit_position

  • bitmap_bucket_number

  • bitmap_construct_agg

  • cbrt

  • equal_null

  • from_json

  • ifnull

  • localtimestamp

  • max_by

  • min_by

  • nth_value

  • nvl

  • octet_length

  • position

  • regr_avgx

  • regr_avgy

  • regr_count

  • regr_intercept

  • regr_r2

  • regr_slope

  • regr_sxx

  • regr_sxy

  • regr_syy

  • try_to_binary

  • base64

  • base64_decode_string

  • base64_encode

  • editdistance

  • hex

  • hex_encode

  • instr

  • log1p

  • log2

  • log10

  • percentile_approx

  • unbase64

  • Unterstützung für die Angabe einer Schema-Zeichenfolge (einschließlich impliziter struct-Syntax) beim Aufruf von DataFrame.create_dataframe wurde hinzugefügt.

  • Unterstützung von DataFrameWriter.insert_into/insertInto hinzugefügt. Diese Methode unterstützt auch den lokalen Testmodus.

  • Unterstützung für DataFrame.create_temp_view wurde hinzugefügt, um eine temporäre Ansicht zu erstellen. Dies schlägt fehl, wenn die Ansicht bereits existiert.

  • Unterstützung für mehrere Spalten in den Funktionen map_cat und map_concat wurde hinzugefügt.

  • Es wurde eine Option keep_column_order hinzugefügt, um die ursprüngliche Spaltenreihenfolge in DataFrame.with_column und DataFrame.with_columns beizubehalten.

  • Es wurden Optionen zu den Spaltenumwandlungen hinzugefügt, die das Umbenennen oder Hinzufügen von Feldern in StructType-Spalten ermöglichen.

  • Unterstützung für contains_null parameter wurde zu ArrayType hinzugefügt.

  • Es wurde Unterstützung für die Erstellung einer temporären Ansicht über DataFrame.create_or_replace_temp_view aus einem DataFrame hinzugefügt, der durch Lesen einer Datei aus einem Stagingbereich erstellt wurde.

  • Unterstützung für den Parameter value_contains_null wurde zu MapType hinzugefügt.

  • Interaktiv wurde zur Telemetrie hinzugefügt, die anzeigt, ob die aktuelle Umgebung eine interaktive ist.

  • Erlauben Sie session.file.get in einer Native App, Dateipfade, die mit / beginnen, aus der aktuellen Version zu lesen

  • Unterstützung für mehrere Aggregationsfunktionen nach DataFrame.pivot hinzugefügt.

Experimentelle Features

  • Die Klasse Session.catalog wurde hinzugefügt, um Snowflake-Objekte zu verwalten. Sie kann über Session.catalog aufgerufen werden.

    • snowflake.core ist eine für dieses Feature erforderliche Abhängigkeit.

  • Erlauben Sie die Eingabe von Schemata durch den Benutzer oder die Eingabe von Schemata durch den Benutzer beim Lesen der Datei JSON im Stagingbereich.

  • Unterstützung für die Angabe einer Schema-Zeichenfolge (einschließlich impliziter struct-Syntax) beim Aufruf von DataFrame.create_dataframe wurde hinzugefügt.

Verbesserungen

  • README.md wurde aktualisiert und enthält nun Anweisungen zur Überprüfung von Paketsignaturen mit cosign.

Fehlerkorrekturen

  • Es wurde ein Fehler im lokalen Testmodus behoben, der dazu führte, dass eine Spalte den Wert None enthielt, obwohl sie eigentlich 0 enthalten sollte.

  • Ein Fehler in StructField.from_json wurde behoben, der verhinderte, dass TimestampTypes mit tzinfo korrekt geparst wurde.

  • Ein Fehler in function date_format wurde behoben, der einen Fehler verursachte, wenn die Eingabespalte vom Typ Datum oder Zeitstempel war.

  • Es wurde ein Fehler in DataFrame behoben, durch den Nullwerte in eine nicht-nullbare Spalte eingefügt werden konnten.

  • Es wurde ein Fehler in den Funktionen replace und lit behoben, der bei der Übergabe von Column-Ausdrucksobjekten zu einem Fehler bei der Typ-Hinweis-Assertion führte.

  • Ein Fehler in pandas_udf und pandas_udtf wurde behoben, bei dem Sitzungsparameter fälschlicherweise ignoriert wurden.

  • Es wurde ein Fehler behoben, der einen falschen Typkonvertierungsfehler für Systemfunktionen auslöste, die über session.call aufgerufen wurden.

Snowpark Pandas API-Aktualisierungen

Neue Features

  • Unterstützung für Series.str.ljust und Series.str.rjust hinzugefügt.

  • Unterstützung von Series.str.center hinzugefügt.

  • Unterstützung von Series.str.pad hinzugefügt.

  • Unterstützung für die Anwendung der Snowpark Python-Funktion snowflake_cortex_sentiment wurde hinzugefügt.

  • Unterstützung von DataFrame.map hinzugefügt.

  • Unterstützung für DataFrame.from_dict und DataFrame.from_records hinzugefügt.

  • Unterstützung für gemischte Groß- und Kleinschreibung von Feldnamen in Spalten vom Typ struct wurde hinzugefügt.

  • Unterstützung von SeriesGroupBy.unique hinzugefügt.

  • Unterstützung von Series.dt.strftime mit den folgenden Direktiven wurde hinzugefügt:

    • %d: Tag des Monats als mit Nullen aufgefüllte Dezimalzahl.

    • %m: Monat als mit Nullen aufgefüllte Dezimalzahl.

    • %Y: Jahr mit Jahrhundert als Dezimalzahl.

    • %H: Stunde (24-Stunden-Uhr) als mit Nullen aufgefüllte Dezimalzahl.

    • %M: Minute als mit Nullen aufgefüllte Dezimalzahl.

    • %S: Sekunde als mit Nullen aufgefüllte Dezimalzahl.

    • %f: Mikrosekunde als Dezimalzahl, mit Nullen aufgefüllt auf 6 Ziffern.

    • %j: Tag des Jahres als mit Nullen aufgefüllte Dezimalzahl.

    • %X: Die für das Gebietsschema geeignete Zeitdarstellung.

    • %%: Ein wörtliches ‚%‘-Zeichen.

  • Unterstützung von Series.between hinzugefügt.

  • Unterstützung von include_groups=False in DataFrameGroupBy.apply hinzugefügt.

  • Unterstützung von expand=True in Series.str.split hinzugefügt.

  • Unterstützung für DataFrame.pop und Series.pop hinzugefügt.

  • Unterstützung für first und last in DataFrameGroupBy.agg und SeriesGroupBy.agg hinzugefügt.

  • Unterstützung von Index.drop_duplicates hinzugefügt.

  • Unterstützung für Aggregationen "count", "median", np.median, "skew", "std", np.std "var" und np.var in pd.pivot_table(), DataFrame.pivot_table() und pd.crosstab() hinzugefügt.

Verbesserungen

  • Verbesserte Leistung der Methoden DataFrame.map, Series.apply und Series.map durch Zuordnung von Numpy-Funktionen zu Snowpark-Funktionen, wenn möglich.

  • Dokumentation für DataFrame.map hinzugefügt.

  • Verbesserte Leistung von DataFrame.apply durch Zuordnung von Numpy-Funktionen zu Snowpark-Funktionen, wenn möglich.

  • Dokumentation über den Umfang der Interoperabilität von Snowpark pandas mit scikit-learn hinzugefügt.

  • Ableitung des Rückgabetyps von Funktionen in Series.map, Series.apply und DataFrame.map, wenn kein Typhinweis angegeben ist.

  • call_count wurde zur Telemetrie hinzugefügt, wodurch Methodenaufrufe einschließlich Aufrufen des Interchange-Protokolls gezählt werden.