Snowpark Connect for Spark-Versionshinweise 2026¶

Snowflake verwendet semantische Versionierung für Snowpark Connect for Spark-Aktualisierungen.

Die entsprechende Dokumentation finden Sie unter Apache Spark™-Workloads auf Snowflake mit Snowpark Connect for Spark ausführen und Übermitteln von Spark-Anwendungen.

1.24.0 (April 24, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Disable filter_classpath_jars at server startup
Support UDT cast-to-string and reject invalid UDT casts
Fix DataFrame describe and summary APIs
Add SUPPORTED_SCALES guard to skip workloads at unsupported scales

Neue Features¶

Add Scala 2.13 equivalent JARs to dependency packages
Add Hive partitioning implementation and limitations reference
Remove 29 unused JARs from snowpark_connect_deps packages (~23 MB)
Skip explicit structured cast when server supports implicit cast for Parquet
Bump Snowpark dependency to 1.50.0

1.23.0 (April 22, 2026)¶

Snowpark Connect for Spark¶

Behavior changes¶

Set Parquet useLogicalType default to true

Fehlerkorrekturen¶

Fix count() to match Spark SQL behavior
Relax protobuf version constraint from <6.32.0 to <6.34.0
Consistently coerce to unstructured types
Replace snowflake.snowpark_connect.includes import with pyspark.sql
Always use vectorized Parquet scanner; remove useVectorizedScanner configuration option
Fix regexp_extract defaults, inline flags, and PCRE handling
Fix SQL operator compatibility gaps
Fix IN NULL semantics to match Spark behavior
Support named persistent external stage read in XML UDTF
Preserve UDT metadata through temp views and toDF renames
Use SQL path for catalog table existence checks
Allow star expression in the map columns aggregation

Neue Features¶

Implement sequence support for timestamp/date and interval types
Add CTE session parameter
Initialize tracking nullability of columns and complex types
Track nullability for built-in functions across multiple expression categories
Track nullable in Set command
Add nullability to range
Introduce performance regression gate in GitHub Actions

1.22.0 (April 18, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Fix CTE-qualified column refs in ORDER BY/WHERE/GROUP BY
Fix withColumn on join key after using-style join
Fix fillna raising immediately for missing subset column
Fix case sensitive read of internal stage
Reduce window function boundary materialization
Preserve struct/map/array schema with empty content
Support ON_ERROR=CONTINUE for INFER_SCHEMA in CSV and JSON reads
Fix hex compile-time type dispatch
Avoid redundant temp table creation for read.parquet to saveAsTable
Preserve StructType/MapType in strict mode
Case-insensitive qualifier comparison in column resolution
Use Snowpark builtin for CBRT function
Fix XML nullValue and whitespace handling
Use Decimal for DecimalType in strict mode
Fix map_concat bug
Fix unionByName to handle quotes in column names and respect caseSensitive config
Remove trailing commas from JSON test resource file

Neue Features¶

Snowpark Connect Java Client library to support Spark Scala and Java workloads
Use native implementation for ARRAY_REPEAT and MAP_ENTRIES
Use MAP_ENTRIES in map_cast
Reduce number of queries used for VARIANT inference in read_parquet
Add cross-request sub-plan cache for map_relation

1.21.1 (April 10, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Implement JSON encoding validation
Reduce query size for functions that internally rename columns
Relax py4j version constraints to allow for broader compatibility
Isolate artifacts by spark session

Neue Features¶

Add default application name for session
Add JSON date/time format conversion

1.21.0 (April 09, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Handle glob metacharacter escaping in CSV/JSON paths
Fix JSON non-nullable schema to match Spark behavior
Add default column matching case for XML
Fix TEXT lineSep with hex encoding for RECORD_DELIMITER
Fix spark read xml external stage
Empty CSV returns empty DataFrame
Add default idx to regexp_extract
Fix CSV non-nullable schema to match Spark behavior
Fix temp stage naming collision under parallel tests
Add fast path to regexp functions
Schema coercion on storeAssignmentPolicy
CSV backslash delimiter double-escape
Optimize posexplode
CSV lineSep empty validation
Fix bug that xml cannot read external stage file
Reduce default log verbosity for users

Neue Features¶

Added support for DML row counts
Support overwrite(condition) for DataFrameWriterV2
Iceberg mergeSchema on write — top-level column evolution
Added support for partition overwrites in DataFrameWriterV2
Add app_name parameter to init_spark_session

1.20.0 (April 03, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Fix performance issue
Fix merge schema for JSON
Fix arrays_zip for complex types
Fix LCAs in implicit aggregations

Neue Features¶

Cache result of JSON file format
Resolve known types from map_unresolved_function without typer
Support hive partitioning for JSON copy into mode
Add SCOS session registration on server initialization
Modify warmup query with distinct string for filtering

1.19.0 (26. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Das Problem beim Zugriff auf das Feld „struct“ aus einem Array über „getItem“ wurde behoben.
Das Problem mit den Namen für den Zugriff auf Array-Elemente wurde behoben.
Die fehlende Komprimierung für das TEXT-Format wurde hinzugefügt.
Verringerung der Abfragegröße bei DataFrame.replace, der UDTF-Erstellung und read_parquet
Emulieren von Typen beim Erstellen der Ansicht [temp]
Die Umwandlung strukturierter Typen wurde korrigiert.
Das Problem bei der Validierung des Textschreibtyps wurde behoben.
Unterstützung für das parallele Lesen von XML-Verzeichnissen
Optimierte conv-Funktionsverwendung
Unterstützung für das Lesen und Schreiben des Snowflake- als auch des net.snowflake.spark.snowflake-Formats
Emulieren von Typen für die Erstellungstabelle
Das Problem beim Zugriff auf verschachtelte Strukturen mit Arrays wurde behoben.
Die Parquet-Fehlermeldung wurde behoben.
Optimierte Reduzierung der Abfragegröße für to_number
Das Problem mit dem UDF-Cache wurde behoben, sodass Änderungen an der Abfragedatenbank berücksichtigt werden.
Optimierte mask-Funktion
Übergeben von PATTERN an NVS-Fallback-Leser während der Parquet-Schema-Inferenz
Koersion von Null- und strukturierten Typen

Neue Features¶

Einführung des DIRECTED-Verknüpfungshinweises
Integrieren von XML inferSchema

1.18.0 (19. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Die fehlende JDBC-Typzuordnung wurde hinzugefügt.
Unterstützung des vom Benutzenden bereitgestellten Schemas in Parquet
Optimale Handhabung ungültiger UTF-8 Zeichen in JSON
Auflösen von LCA-Spalten nur, wenn sie tatsächlich verwendet werden
Optimierte Generierung von „get_json_object“-Abfragen
Entferntes Semikolon aus SQL-Abfragen
processInBulk=True als Standard für JSON-Schreibvorgänge und korrigierte NullType-Schema-Inferenz
Der Lesefehler im Stagingbereich wurde behoben.
Die Nichtprüfung in der UDF-Registrierung wurde hinzugefügt.
Engerer Grenzwert für die Fehlermeldung
Fehlende Felder im vom Benutzenden bereitgestellten Schema sind zulässig.
JSON- und CSV-Komprimierungsinferenz
Das Problem mit coalesce(1) beim Erstellen einer einzelnen Datei wurde behoben.

Neue Features¶

Hinzugefügte execute_jar-Methode zum Starten von Java/Scala-Workloads

Snowpark Submit¶

Fehlerkorrekturen¶

Das Problem mit dem --wait-for-completion-Flag wurde behoben.

1.17.0 (13. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

JSON- und CSV-Komprimierungsinferenz.
Problem mit coalesce beim Erstellen einer einzelnen Datei behoben.
Überarbeiten Sie das Lesen von JSON, um COPY INTO für das Lesen einzelner Dateien zu verwenden, und fügen Sie die VariantType-Schema-Inferenz hinzu.
Ermöglichen Sie JSON das Laden ohne explizites Schema.
Problem mit multi_line in JSON behoben.
Problem mit dem JSON-Ableitungsschema behoben, um das Scannen ganzer Dateien zu vermeiden.
Die Umwandlung in Zeitstempel ltz erfolgt nun korrekt.
Rückgabewert des Klammer-Hashes.
Problem mit repartition durch partitionBy behoben.
Problem bei der Verwendung der Abschnittsüberschrift [connections.spark-connect] in config.toml behoben.
Konvertieren von Java-date/timestamp-Format-Token in Snowflake-Äquivalente für CSV-Lesevorgänge.
Berechnen des Schemas für pivot-Funktionen.
Problem mit UDTFs in lateraler Verknüpfung mit Alias wurde behoben.
Anpassen des Ergebnisses für den Befehl SQL SET.
Problem mit dem Rückgabetyp für CEIL- und FLOOR-Funktionen wurde behoben.
Verbessern der Abfragegenerierung in unbase64 v2.
Problem mit Optionen für die Snowflake-Zuordnung für CSV wurde behoben.
Problem mit der Serialisierung für POJO wurde behoben.
Verbessern der CSV-Header-Fehlermeldungen.
Verbessern der mapType-Erkennungslogik mit try_cast für Parquet-Lesevorgänge.

Neue Features¶

Unterstützung von reduceGroups API.
Unterstützung für die Angabe von Verbindungsnamen innerhalb von init_spark_session.
Hinzufügen von Konfigurationsparametern zur Verwendung von UDF für unbase64.

1.16.0 (12. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Optimieren der SQL-Generierung in der Funktion unbase64.
Problem mit der from_json-Regression wurde behoben
Problem mit Datensätzen, die mehrere Grenzen des BZ2-Komprimierungsblocks umfassen, wurde behoben.
Problem mit der Null-Zulässigkeitszuordnung im unaufgelösten Attribut wurde behoben.
Initialisieren der spark-connect-Sitzung mit einer beliebigen Verbindung, nicht nur einer namens spark-connect
Hinzufügen der Validierung von XML-Optionen
Löschen der CSV ESCAPE-Option bei Übereinstimmung mit dem Anführungszeichen, um Kompilierungsfehler zu vermeiden
Problem mit fehlerhafter Konvertierung von benannten Tupeln in productEncoder wurde behoben.
Die Überprüfung von mergeSchema für CSV und JSON wird nicht unterstützt.
Problem mit Roundtrip vom komplexen Parquet-Typ (Schreiben + Lesen) wurde behoben.
Problem mit Schema für pivot/unpivot wurde behoben.
Problem mit dem Rückgabetyp für MOD- und PMOD-Funktionen wurde behoben.
Problem mit der CSV-Header-Extraktion für Dateien mit führenden Leerzeilen wurde behoben.
Korrektes Testen von Zeitzonen und Ersetzen der zeichenfolgenbasierten Datums-/Uhrzeitserialisierung durch epochenbasierte Datums-/Uhrzeitserialisierung
Aktualisieren der Java-Versionsprüfung für Windows
Vereinfachen von verschachtelten withColumn-Aufrufen
Ändern der Logik für Literal _IntegralType in Hinzufüge-/Unteroperationen
Zurückgeben von LongType für COUNT-Funktionen
Lesen von JSON: Testkomprimierung = bz2/bzip2/none
Verbessern der Leistung von to_varchar/to_char
Ermöglichen des besseren Vergleichs bei E/A-Tests
Standardmäßiges Festlegen von multi_line auf False für das Kopieren von JSON

Snowpark Submit¶

Fehlerkorrekturen¶

Löst einen Fehler bei einem nicht spezifizierten Computepool aus.

1.15.0 (06. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Entfernen des Ergebnisscans beim Aufruf von df.count()
Sicherstellen, dass das Inferenzschema zum Lesen von JSON auf begrenzten Zeilen ausgeführt wird
Problem mit createDataFrame für Intervalltypen wurde behoben.
Ändern der Logik für Literal _IntegralType bei Multiplikations- und Divisionsoperationen
Erweitern des Erzwingungstyps für Set-Operationen
Problem mit der Unterstützung mehrerer neo4j-Label wurde behoben.
Ändern von JAR-Metadaten, damit Grype die Netty-Sicherheitslücken nicht erkennt
Zurückgeben des korrekten Typs für ANY_VALUE-Funktion
Zurückgeben des erweiterten Typs für die Sequenz
Unterstützung für die Konfiguration von spark.sql.parquet.inferTimestampNTZ.enabled hinzugefügt
Umbenennen/Umwandeln der Batch-Spalte in _validate_schema_and_get_writer
JDBC hängt, wenn partitionierte Abfragen mit Abrufgröße angegeben werden
Zurückgeben einer verkürzten Ausnahmemeldung, wenn der Wert der HTTP-Header-Limits überschritten wird
Problem mit map_type_to_snowflake_type für BigDecimal wurde behoben.
Korrektur hinsichtlich der Genauigkeit und Skalierung von literalen Dezimalstellen
Verbessern der Generierung von zufälligen Zeichenfolgen
Ignorieren von beschädigten Datensätzen beim BZ2-komprimierten Laden von JSON

Neue Features¶

Verwenden von Stagingdateien aus der Konfiguration in Scala-UDFs
Verwenden von permissiver TRY_CAST in JSON-Lesevorgängen
Anzahl der Server-Threads konfigurierbar machen

Snowpark Submit¶

Fehlerkorrekturen¶

Erneutes Hinzufügen von init_spark_session() zum Testen
Aktualisieren der snowpark-submit-Befehlszeilenausgabe zur Verdeutlichung von snowflake-connection-name ist erforderlich.

1.14.0 (19. Februar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Zwischenspeichern des Tabellentyps bei Ausführung von saveAsTable
Optimieren der literalen Eingabe für Teilzeichenfolgen- und Typumwandlungen für coalesce
Handhabung des Überlaufs von Dezimalstellen in avg/mean und Korrektur der Koersion des Dezimaltyps
Iceberg – Beibehalten von Zuweisungen beim Überschreiben
Standardisieren des SQL-Passthrough-Modus
Optimieren von from_utc_timestamp/to_utc_timestamp für literale Zeitzone
Handhabung von JSON-Nullwerten in strukturierten Typen, damit sie mit der Spark-Semantik übereinstimmen
Emulieren ganzzahliger Typen beim Erstellen von Tabellen mit SQL
Problem mit Grenzfall bei Zuordnung verschachtelter Zeilen in Scala UDFs behoben
Problem mit der Art und Weise behoben, wie Parquet das Lesen und Schreiben von komplexen strukturierten Datentypen handhabt
Unterstützung zum Speichern des ignore-Arguments für Parquet-Dateien
Unterstützung für Artefakt-Repositorys hinzugefügt
Problem mit NULL-Zulässigkeit von Arrays in Scala UDxF behoben
Problem mit log1p für Argumente aus Bereich (-1, 0) behoben
Problem mit first_value und:code:last_value im Aggregationskontext behoben
Problem mit Lesen DayTimeIntervalType für Scala-Client behoben

Neue Features¶

Korrekte Handhabung von Zeitzonen in Scala UDFs
Unterstützung von Java 11 und 17 ohne Konfiguration

Aktualisierungen für Snowpark Submit¶

Neue Features¶

Unterstützung von snowpark-submit für Python 3.9
Optimierung von init_spark_session für die Verwendung im snowpark-submit-Workflow

1.13.0 (13. Februar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Problem mit der split-Funktion behoben
snowflake-snowpark-python-Abhängigkeit auf Version 1.44 herabgestuft
Problem mit Neo4j-Dialektabgleich zur Verbesserung derSQL-Übersetzung behoben
Problem mit Vorgangs-ID, die in Ausführungsantworten zurückgegeben wird, zu Konsistenzwecken behoben
Problem mit der Handhabung von gRPC-Metadaten fürTCP-Kanalverbindungen behoben

Neue Features¶

Unterstützung für partition_hint in mapPartitions-Vorgängen hinzugefügt
Unterstützung für XML-Reader für Szenarios mit benutzerdefinierten Schemas hinzugefügt

1.11.0 (28. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Beibehalten von ausgeblendete Spalten nach verschiedenen DataFrame-Operatoren
Problemen bei Eingabetypen für Scala UDFs (byte, binary, scala.math.BigDecimal) behoben

Sonstige Updates¶

Hinzufügen von benutzerdefinierten snowpark-submit-Argumenten zum Kommentieren

1.10.0 (22. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Fehler mit nicht gesetzter Konfiguration für die Sitzungskonfiguration behoben.
Verwenden Sie „Kopieren in“, um CSV-Dateien parallel zu laden.
Problem mit Schreibvorgängen bei DataFrames mithilfe von äußeren Verknüpfungen behoben.
Verarbeiten von Nullen in Scala-UDFs.
Optimieren der CTE-Abfragegenerierung mit Parameterschutz.
Vermeiden Sie die Umwandlung von Argumenten von DATEDIFF.
Problem mit Anhängen von partitionierten Dateien und Lesen von Nullpartitionen behoben.
Beschleunigen Sie mit SQL die Konvertierung zwischen Dezimal- und Hexadezimalwerten um den Faktor 10.

Neue Features¶

Bei Parquet-Dateien werden nur geänderte Partitionen überschrieben.

Sonstige Updates¶

Die Logik, mit der erkannt wird, ob Snowpark Connect for Spark auf XP ausgeführt wird, wurde aktualisiert.
Unterstützung für das Schreiben in eine Tabelle mit dem Datentyp „Variant“ in Snowflake.
Entfernen unnötiger Info-Protokolle.
Verschieben von Java-Tests aus dem Scala-Testjob in einen separaten Job.
Aktualisieren Sie die Version der Abhängigkeit für gcsfs.

Snowpark Submit¶

Keine.

1.9.0 (14. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Problem mit der Serialisierung von Scala-Tupeln behoben.
Problem mit dem Laden großer JSON-Dateien behoben.
Kleine Korrekturen für Kundenprobleme implementiert.
Korrekturen für struct-Vergleiche implementiert.
Verarbeitung von DataFrames mit 0 Spalten hinzugefügt.
Pfad zum Hochladen der Datei korrigiert.
Das Problem, dass Upload_files_if_needed nicht parallel ausgeführt wird, wurde behoben.
Verbesserung bei der Ableitung von Eingabetypen, wenn UDF-Eingabetypen nicht in der Proto-Datei definiert sind.
Problem mit NA-Grenzfällen wurde behoben.

Snowpark Connect for Spark-Versionshinweise 2026¶

1.24.0 (April 24, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.23.0 (April 22, 2026)¶

Snowpark Connect for Spark¶

Behavior changes¶

Fehlerkorrekturen¶

Neue Features¶

1.22.0 (April 18, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.21.1 (April 10, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.21.0 (April 09, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.20.0 (April 03, 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.19.0 (26. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.18.0 (19. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

Snowpark Submit¶

Fehlerkorrekturen¶

1.17.0 (13. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.16.0 (12. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Snowpark Submit¶

Fehlerkorrekturen¶

1.15.0 (06. März 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

Snowpark Submit¶

Fehlerkorrekturen¶

1.14.0 (19. Februar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

Aktualisierungen für Snowpark Submit¶

Neue Features¶

1.13.0 (13. Februar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

1.11.0 (28. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Sonstige Updates¶

1.10.0 (22. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

Sonstige Updates¶

Snowpark Submit¶

1.9.0 (14. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶

Neue Features¶

Snowpark Submit¶

Fehlerkorrekturen¶

1.8.0 (7. Januar 2026)¶

Snowpark Connect for Spark¶

Fehlerkorrekturen¶