2026年の Snowpark Connect for Spark リリースノート¶
Snowflake は、 Snowpark Connect for Spark の更新にセマンティックバージョニングを使用します。
ドキュメントについては、 Snowpark Connect for Spark を使用してSnowflakeで Apache Spark™ ワークロードを実行する および Sparkアプリケーションの送信 をご参照ください。
1.24.0(2026年4月24日)¶
Snowpark Connect for Spark¶
バグ修正¶
サーバー起動時に
filter_classpath_jarsを無効化UDT 文字列にキャストし、無効な UDT キャストを拒否するをサポート
DataFrame
describeおよびsummaryAPIs を修正SUPPORTED_SCALESガードを追加してサポートされていないスケールでワークロードをスキップ
新機能¶
依存関係パッケージにScala 2.13と同等の JARs を追加
Hiveパーティションの実装と制限のリファレンスを追加
未使用の29個の JARs を :code:`snowpark_connect_deps`パッケージ(~23 MB)から削除
サーバーがParquetの暗黙的なキャストをサポートしている場合は、明示的な構造化キャストをスキップ
Snowparkの依存関係を1.50.0に更新
1.23.0(2026年4月22日)¶
Snowpark Connect for Spark¶
動作の変更¶
Parquet
useLogicalTypeのデフォルトをtrueに設定
バグ修正¶
Spark SQL の動作と一致するように
count()を修正protobufバージョンの制約を
<6.32.0から<6.34.0に緩和非構造化型への一貫した強制
pyspark.sqlを使用してsnowflake.snowpark_connect.includesのインポートを置換常にベクトル化されたParquetスキャナーを使用。
useVectorizedScanner構成オプションを削除regexp_extractのデフォルト、インラインフラグ、および PCRE の処理を修正SQL 演算子の互換性のギャップを修正
Sparkの動作と一致するように
IN NULLセマンティクスを修正XML UDTF で読み取られる名前付き永続外部ステージをサポート
一時的なビューにおいて、また
toDFの名前が変更された後も UDT メタデータを保持カタログテーブルの存在チェックのために SQL パスを使用
マップ列の集計でスター式を許可する
新機能¶
タイムスタンプ/日付と間隔型のシーケンスサポートの実装
CTE セッションパラメーターを追加
列および複雑な型のNull許容性追跡の初期化
複数の式カテゴリにわたる組み込み関数のNull許容性の追跡
SetコマンドでNull許容性を追跡rangeにNull許容性を追加GitHub アクションにパフォーマンス回帰ゲートを導入
1.22.0(2026年4月18日)¶
Snowpark Connect for Spark¶
バグ修正¶
ORDER BY/WHERE/GROUP BY 内の CTE 修飾列参照を修正
スタイル結合を使用した後の結合キーに対する
withColumnを修正サブセット列が見つからない場合に
fillnaが即時発生することを修正内部ステージの大文字と小文字を区別する読み取りを修正
ウィンドウ関数の境界のマテリアライゼーションの削減
空のコンテンツで構造体/マップ/配列スキーマを保持
CSV および JSON の読み取りで INFER_SCHEMA に対して ON_ERROR=CONTINUE をサポート
16進数のコンパイル時間タイプのディスパッチを修正
read.parquetからsaveAsTableへの冗長な一時テーブル作成を回避厳密なモードで
StructType/MapTypeを保持列解決における大文字と小文字を区別しない修飾子の比較
CBRT関数にSnowparkの組み込みを使用XML
nullValueと空白の処理を修正厳密モードで
DecimalTypeに10進数を使用map_concatのバグを修正unionByNameを修正して、列名で引用符を処理し、大文字と小文字を区別する構成を尊重JSON テストリソースファイルから後続のコンマを削除
新機能¶
Spark ScalaとJavaワークロードをサポートするためのSnowpark Connect Javaクライアントライブラリ
ARRAY_REPEATおよびMAP_ENTRIESのネイティブ実装を使用map_castでMAP_ENTRIESを使用read_parquetでの VARIANT 推論に使用されるクエリの数を削減map_relationのクロスリクエストサブプランキャッシュを追加
1.21.1(2026年4月10日)¶
Snowpark Connect for Spark¶
バグ修正¶
JSON エンコードの検証を実装
内部で列の名前を変更する関数のクエリサイズを削減
py4jのバージョン制約を緩和し、より広範な互換性を実現
Sparkセッションによりアーティファクトを分離
新機能¶
セッションのデフォルトアプリケーション名を追加
JSON 日付/時刻形式の変換を追加
1.21.0(2026年4月9日)¶
Snowpark Connect for Spark¶
バグ修正¶
CSV/JSON パスでグロブメタ文字のエスケープを処理
Sparkの動作と一致するように JSON Null非許容スキーマを修正
XML のデフォルト列の一致ケースを追加
RECORD_DELIMITER の16進数エンコードにより TEXT
lineSepを修正Spark読み取りxml外部ステージを修正
空の DataFrame を返す空の CSV
regexp_extractにデフォルトIDXを追加Sparkの動作と一致するように CSV Null非許容スキーマを修正
並列テストにおける一時ステージ名の競合を修正
正規表現関数に高速パスを追加
storeAssignmentPolicyでのスキーマの強制CSV バックスラッシュのダブルエスケープ
posexplodeを最適化CSV
lineSepの空の検証xmlが外部ステージファイルを読み取れないバグを修正
ユーザーのデフォルトのログ冗長性を低減
新機能¶
DML 行カウントのサポートを追加
DataFrameWriterV2に対するoverwrite(condition)のサポート書き込みにおける Iceberg
mergeSchema- トップレベルの列進化DataFrameWriterV2でのパーティション上書きのサポートを追加app_nameパラメーターをinit_spark_sessionに追加
1.20.0(2026年4月3日)¶
Snowpark Connect for Spark¶
バグ修正¶
パフォーマンスの問題を修正
JSON のマージスキーマを修正
複雑な型の場合の
arrays_zipを修正暗黙的な集計における LCAs を修正
新機能¶
JSON ファイル形式のキャッシュ結果
typerを使用せずに既知の型を
map_unresolved_functionから解決モードへの JSON コピーのHiveパーティション分割をサポート
サーバー初期化での SCOS セッション登録を追加
フィルタリングのための異なる文字列を使用して準備クエリを変更
1.19.0(2026年3月26日)¶
Snowpark Connect for Spark¶
バグ修正¶
getItemを介した配列からの構造体フィールドへのアクセスを修正
配列要素にアクセスするための名前を修正
TEXT 形式の欠落していた圧縮を追加
DataFrame.replace、UDTF の作成、およびread_parquetでのクエリサイズを縮小[temp] ビューの作成時に型をエミュレート
構造化された型のキャストを修正
テキスト書き込みタイプの検証を修正
XML の並列ディレクトリ読み取りをサポート
conv関数の使用を最適化Snowflakeと
net.snowflake.spark.snowflakeの両方の形式の読み取りと書き込みをサポートテーブル作成時の型をエミュレート
配列を使用したネストされた構造体へのアクセスを修正
Parquetエラーメッセージを修正
クエリサイズを縮小するためにto_numberを最適化
クエリデータベースの変更を考慮するように UDF キャッシュを修正
mask関数を最適化Parquetスキーマ推論中に PATTERN を NVS フォールバックリーダーに渡す
Nullおよび構造化された型の強制
新機能¶
DIRECTED 結合ヒントを導入
XML inferSchemaを統合
1.18.0(2026年3月19日)¶
Snowpark Connect for Spark¶
バグ修正¶
不足している JDBC 型マッピングを追加
Parquetでユーザー提供のスキーマをサポート
JSON 内の無効な UTF-8文字を適切に処理
実際に使用される場合にのみ LCA 列を解決
get_json_objectクエリ生成を最適化
SQL クエリからセミコロンを削除
JSON 読み取りのデフォルトを
processInBulk=Trueにし、NullTypeスキーマ推論を修正誤ったステージ読み取りに関するバグを修正
UDF登録にチェックなしを追加
エラーメッセージの制限を強化
ユーザーが提供するスキーマでのフィールドの欠落を許可
JSON および CSV の圧縮推論
coalesce(1)が単一のファイルを作成する問題を修正
新機能¶
Java/Scalaワークロードを起動するための
execute_jarメソッドを追加
Snowpark Submit¶
バグ修正¶
--wait-for-completionフラグによるエラーの握りつぶしを修正
1.17.0(2026年3月13日)¶
Snowpark Connect for Spark¶
バグ修正¶
JSONおよびCSVの圧縮推論。
単一のファイルを作成する:code:`coalesce`の修正。
単一ファイルの読み取りに:code:`COPY INTO`を使用するようにJSONの読み取りをリファクタリングし、:code:`VariantType`のスキーマ推論を追加。
明示的スキーマなしでのJSONのロードを許可。
JSONの:code:`multi_line`を修正。
ファイル全体のスキャンを回避するように、JSONの推論スキーマを修正。
タイムスタンプ:code:`ltz`へのキャストを正しく処理。
ハッシュの戻り値をクランプ。
:file:`config.toml`で:code:`[connections.spark-connect]`セクションヘッダーを使用するように修正。
CSVの読み取り用に、Javaの:code:
date/:code:`timestamp`形式のトークンをSnowflakeの同等物に変換。:code:`pivot`関数のスキーマを計算。
エイリアスされたラテラル結合のUDTFsを修正。
SQL :code:`SET`コマンドの結果を調整。
unbase64v2でのクエリ生成を改善。CSVのSnowflakeマッピングの一部オプションを修正。
:code:`POJO`のシリアル化を修正。
CSVヘッダーのエラーメッセージを改善。
新機能¶
1.16.0(2026年3月12日)¶
Snowpark Connect for Spark¶
バグ修正¶
関数:code:`unbase64`でのSQL生成を最適化。
:code:`from_json`の回帰を修正
複数のBZ2圧縮ブロックの境界にまたがる記録を修正
未解決属性におけるNULL値許容度のマッピングを修正
:code:`spark-connect`という名前の接続だけでなく、任意の接続で:code:`spark-connect`セッションを初期化
XMLオプションの検証を追加
コンパイルエラーを防ぐため、引用符文字と一致する場合はCSV ESCAPEオプションをドロップ
:code:`productEncoder`内の名前付きタプルの誤変換を修正
CSVおよびJSONの:code:`mergeSchema`がサポートされていないことを確認
Parquetの複合型ラウンドトリップ(書き込みと読み取り)を修正
pivot/:code:`unpivot`のスキーマを修正先頭に空白行があるファイルのCSVヘッダー抽出を修正
タイムゾーンを正しくテストし、文字列ベースの日付と時刻のシリアル化をエポックベースに置き換え
WindowsのJavaバージョンチェックを更新
ネストされた:code:`withColumn`呼び出しをフラット化
加算/減算操作での:code:`Literal _IntegralType`のロジックを変更
JSONの読み取り:テスト圧縮 = bz2/bzip2/none
to_varchar/:code:`to_char`のパフォーマンスを改善I/Oテストでの比較を改善
Snowpark Submit¶
バグ修正¶
指定されていないコンピューティングプールについてエラーをスロー。
1.15.0(2026年3月6日)¶
Snowpark Connect for Spark¶
バグ修正¶
:code:`df.count()`の呼び出し時に結果スキャンを削除
JSONの読み取り時に限られた行で推論スキーマを実行
間隔型の:code:`createDataFrame`を修正
乗算および除算演算での:code:`Literal _IntegralType`のロジックを変更
:code:`Set`操作の型の拡張および強制
:code:`neo4j`のマルチラベルサポートを修正
GrypeがNettyの脆弱性を検出しないようにJARのメタデータを変更
:code:`ANY_VALUE`関数に返す値を正しい型に設定
シーケンスに拡張された型を返すよう設定
構成:code:`spark.sql.parquet.inferTimestampNTZ.enabled`のサポートを追加
:code:`_validate_schema_and_get_writer`でのバッチ列の名前変更/キャスト
パーティション化されたクエリでフェッチサイズが指定された場合にJDBCがハングする
HTTPのヘッダー制限を超えた場合、トリミングされた例外メッセージが返される
リテラルの小数の精度とスケールを修正
ランダムな文字列生成を改善
BZ2で圧縮されたJSONをロードする際、破損した記録を無視するよう設定
新機能¶
ScalaのUDFsにおいて構成からステージングされたファイルを使用
JSONの読み取りに寛容な:code:`TRY_CAST`を使用
サーバースレッドの数を構成可能に
Snowpark Submit¶
バグ修正¶
1.14.0(2026年2月19日)¶
Snowpark Connect for Spark¶
バグ修正¶
:code:`saveAsTable`実行時のテーブルタイプのキャッシュ
サブストリングのリテラル入力および:code:`coalesce`の型キャストの最適化
avg/:code:`mean`における10進数型のオーバーフロー対応と型強制の修正Iceberg - 上書き時の権限保持
SQLパススルーモードの標準化
リテラルタイムゾーンに対する:code:
from_utc_timestamp/:code:`to_utc_timestamp`の最適化Sparkのセマンティクスに合わせるための構造化された型におけるJSON null値の処理
SQLからのテーブル作成時における整数型のエミュレート
Scala UDFsにおけるネストされた行のマッピングに関するエッジケースの修正
Parquetによる複雑な構造化データ型の読み書き処理の修正
Parquetファイルに対するsave ignore引数のサポート追加
アーティファクトリポジトリのサポート追加
Scala UDxFにおける配列のNull許容性の修正
範囲(-1, 0)の引数に対する:code:`log1p`の修正
Scalaクライアント向けの:code:`DayTimeIntervalType`読み取りの修正
新機能¶
Scala UDFsにおけるタイムゾーンの正しい処理
Java 11および17の構成なしでのサポート
Snowpark Submitの更新¶
新機能¶
1.13.0(2026年2月13日)¶
Snowpark Connect for Spark¶
バグ修正¶
新機能¶
1.11.0(2026年1月28日)¶
Snowpark Connect for Spark¶
バグ修正¶
さまざまなDataFrame演算子の実行後も隠し列を保持するように修正
Scala UDFの入力型(
byte、binary、scala.math.BigDecimal)に関する問題を修正
その他の更新¶
:code:`snowpark-submit`のユーザー定義引数(User Defined Args)をコメントに追加
1.10.0(2026年1月22日)¶
Snowpark Connect for Spark¶
バグ修正¶
セッション構成の構成解除エラーを修正します。
CSV ファイルを並列にロードするには、copy intoを使用します。
外部結合を使用した DataFrames の書き込みを修正します。
Scala UDFs でnullを処理します。
パラメーター保護を使用して CTE クエリ生成を最適化します。
DATEDIFFの引数のキャストを回避します。パーティション化されたファイルの追加とnullパーティションの読み取りを修正しました。
SQL を使用して10進法と16進法間の変換パフォーマンスを10倍向上させます。
新機能¶
Parquetファイルの変更されたパーティションのみを上書きします。
その他の更新¶
Snowpark Connect for Spark が XP 上で実行されているかどうかを検出するためのロジックを更新しました。
Snowflakeでバリアントデータ型のテーブルへの書き込みをサポートします。
不要な情報ログを削除します。
JavaテストをScalaテストジョブから別のジョブに移動します。
gcsfsの依存関係バージョンを更新します。
Snowpark Submit¶
なし。
1.9.0(2026年1月14日)¶
Snowpark Connect for Spark¶
バグ修正¶
Scalaタプルのシリアル化を修正しました。
巨大な JSON ファイルの読み込みを修正しました。
顧客の問題に対する小さな修正を実装します。
構造比較の修正を実装します。
0列の DataFrames の処理を追加します。
アップロードファイルのパスを修正します。
Upload_files_if_neededが並行実行されない問題を修正しました。UDF 入力型がprotoで定義されていない場合の入力型推論を改善します。
NA エッジケースを修正します。
新機能¶
シングル JSONBZ2 ファイルの読み取りをサポートします。
サーバー側 Snowpark Connect for Spark でScala UDFs をサポートします。
文字列と
daytimeの間のキャストを実装します。group_mapにScala UDFs のサポートを追加します。
Snowpark Submit¶
バグ修正¶
生成されたワークロード名を減らします。
1.8.0(2026年1月7日)¶
Snowpark Connect for Spark¶
バグ修正¶
Windowsの JAVA_HOME 処理を修正しました。
新機能¶
JDBC 経由で
neo4jデータソースをサポートします。
Snowpark Submit¶
なし。