Notes de version de Snowpark Connect for Spark pour 2025

Snowflake utilise la version sémantique pour les mises à jour Snowpark Connect for Spark.

For documentation, see Exécuter les charges de travail Apache Spark™ sur Snowflake avec Snowpark Connect for Spark and Exécuter des charges de travail Spark par lots à partir de Snowpark Submit.

Version 1.2.0 (November 17, 2025)

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Relax version requirements for grpcio and aiobotocore.

Améliorations

  • Specify dependencies version in meta.yaml.

  • Build compiled and architecture-specific conda package.

  • Ensure all CloudPickleSerializer.loads are not done in TCM.

  • Include OSS SQL tests that start with the WITH clause.

  • Do not upload Spark jars when running the server for pyt.

  • Update internal queries count.

Corrections de bogues

  • Fix tests for tcm.

  • Fix CSV column name discrepancy from Spark.

  • Use type cache for empty frames.

  • Resolve Windows OSS runner general issues.

Snowpark Submit

Améliorations

  • Generate unique workload names.

Bug Fixes

  • Fix staged file reading.

Version 1.0.1 (November 3, 2025)

Note

With the release of this version, version 0.24 and previous versions are deprecated.

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Add parameter for view creation strategies.

  • Support string <-> year month interval.

  • Support multiple pivot columns and aliases for pivot values in Spark SQL.

  • Integrate OpenTelemetry span and traces.

Améliorations

Aucun.

Corrections de bogues

  • Add a trailing slash for remove command.

  • Invalid GROUP BY issue with aggregation function and nilary functions.

  • Notebook exceeds gRPC maximum message size.

  • Fix temporary view creation with colliding names.

  • array_size with null argument.

  • Fix for $.0 JSON array access in get_json_object function.

  • Fix self ANTI and SEMI LEFT joins.

  • Handle different types in SQL function range.

  • Fixed temporary view describe.

Version 1.0.0 (October 28, 2025)

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Add rowToInferSchema for CSV reading.

  • Support INSERT INTO with CTE SQL command.

  • I/O changes to add _SUCCESS file generation and metadata file filtering.

  • update(submit): Support installing Snowpark Connect for Spark in the Snowpark Submit client container.

Améliorations

Aucun.

Corrections de bogues

  • Fix _SUCCESS path update.

  • Throw error on remove failure update.

  • Sequence function supporting integral types inputs.

  • Fix types in empty CreateTempViewUsing.

  • Fix Parquet file repartitioning on write.

  • Resolve aliases in ORDER BY clause correctly.

  • Remove scope temp session parameter.

  • Fixed multiple self joins with join condition.

  • Fix column name resolution in pivot.

  • SQL parser aware of session timezone.

  • Interval type coercion with other types.

  • Fix having with nested CTEs.

  • Improve qualified name resolution in Spark.

Version 0.33.0 (October 10, 2025)

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Add script to run on the output from Git action for merging SQLs.

  • Add --rebuild-whl parameter to notebook test runner.

  • Add support for both qualifiers after join.

Améliorations

Aucun.

Corrections de bogues

  • Support escape parameter in SQL LIKE commands.

  • Overwrite bug in partitions.

  • Validate column count on INSERT.

  • Incompatibility for pow with NAN.

  • Cross JOIN with condition.

  • Column attribution logic in nested queries.

  • Update error message for interval test.

  • String type coercion in set operation UNION and EXCEPT, coerce NUMERIC, DATE, DATETIME to STRING.

  • Correctly resolve Snowpark columns after a full outer self JOIN.

  • Expression in aggregate function might be zero improvement.

  • Update: Revert « [SCOS GA BUG] string type coercion in set opera »

  • DataFrame union of decimal type columns now widen as necessary.

  • String type coercion in set operation UNION and EXCEPT, coerce NUMERIC, DATE, DATETIME to STRING (part1).

  • Object not existed issue in TCM.

  • Fix to_binary(x, 'hex') where x has odd number of letters and digits.

  • Fix joins with empty tables.

  • Fix HAVING clause to prioritize grouping columns over aggregate aliases with same name.

Version 0.32.0 (17 octobre 2025)

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Prise en charge de RepairTable.

  • Faites de jdk4py une dépendance facultative de Snowpark Connect for Spark pour simplifier la configuration de l’accueil Java pour les utilisateurs finaux.

  • Prise en charge d’un plus grand nombre de cas de type intervalle.

Améliorations

Aucun.

Corrections de bogues

  • Correction des problèmes Join en refactorisant les qualificatifs

  • Correction de percentile_cont pour autoriser les expressions de filtrage et d’ordre de tri.

  • Correction de histogram_numeric UDAF.

  • Correction de la fonction COUNT lorsqu’elle est appelée avec plusieurs arguments.

Version 0.31.0 (9 octobre 2025)

Snowpark Connect for Spark

Nouvelles fonctionnalités

  • Ajout de la prise en charge des expressions dans la clause GROUP BY lorsque la clause est explicitement sélectionnée.

  • Ajout des codes d’erreur aux messages d’erreur pour une meilleur résolution des problèmes.

Améliorations

Aucun.

Corrections de bogues

  • Correction du problème de conversion non prise en charge de la fonction de fenêtre.