Snowpark Library for Pythonの2025年リリースノート¶

この記事には、 Snowpark Library for Python のリリースノートが含まれています。また、該当する場合は以下が含まれます。

動作の変更
新機能
顧客向けバグ修正

Snowflake は、 Snowpark Library for Python の更新にセマンティックバージョニングを使用します。

ドキュメントについては、 Python用Snowpark開発者ガイドをご参照ください。

警告

Python 3.8が ` サポート終了 <https://devguide.python.org/versions/>`_ に達したため、Python 3.8でSnowpark-pythonを使用する際に非推奨の警告がトリガーされます。詳細については、 Snowflake Pythonランタイムのサポートをご参照ください。Snowpark Python 1.24.0は、 Anacondaのポリシーに従い、Python 3.8をサポートする最後のクライアントとサーバーバージョンとなります。既存のPython 3.8オブジェクトをPython 3.9以上にアップグレードしてください。

Version 1.44.0: Dec 15, 2025¶

新機能¶

Added support for targeted delete-insert via the overwrite_condition parameter in DataFrameWriter.save_as_table.

改善¶

Improved DataFrameReader to return columns in deterministic order when using INFER_SCHEMA.
Added a dependency on protobuf<6.34 (was <6.32).

バージョン1.43.0:2025年12月3日¶

新機能¶

DataFrame.lateral_join のサポートを追加しました。
プライベートプレビュー機能 Session.client_telemetry のサポートが追加されました。
Session.udf_profiler のサポートを追加しました。
functions.ai_translate のサポートを追加しました。
DataFrameWriter.save_as_table および DataFrame.copy_into_table で次の iceberg_config オプションのサポートが追加されました。
- target_file_size
- partition_by
functions.py で以下の関数のサポートを追加しました。
- 文字列とバイナリ関数:
  - base64_decode_binary
  - bucket
  - compress
  - day
  - decompress_binary
  - decompress_string
  - md5_binary
  - md5_number_lower64
  - md5_number_upper64
  - sha1_binary
  - sha2_binary
  - soundex_p123
  - strtok
  - truncate
  - try_base64_decode_binary
  - try_base64_decode_string
  - try_hex_decode_binary
  - try_hex_decode_string
  - unicode
  - uuid_string
- 条件式:
  - booland_agg
  - boolxor_agg
  - regr_valy
  - zeroifnull
- 数値式:
  - cot
  - mod
  - pi
  - square
  - width_bucket

バグ修正¶

自動生成された仮オブジェクトが正しくクリーンアップされないバグを修正しました。
DataFrame.alias を使用して作成された2つの DataFrames を結合し、 CTE 最適化が有効になっている場合の SQL 生成のバグを修正しました。
行タグの開始位置を検索すると誤ったファイル位置が返される可能性がある XMLReader のバグを修正しました。

改善¶

列が指定されていない場合でも ORDER BY ALL をサポートするように DataFrame.sort() を拡張しました。
Session.cte_optimization_enabled から実験的警告を削除しました。

Snowpark Pandas API の更新¶

新機能¶

DataFrame.groupby.rolling() のサポートを追加しました。
DataFrame およびSeries入力を使用した np.percentile のマッピングを Series.quantile にサポートするようになりました。
DataFrame.sample または Series.sample を呼び出すときに random_state パラメーターを整数に設定するためのサポートが追加されました。
to_iceberg で以下の iceberg_config オプションのサポートを追加しました。
- target_file_size
- partition_by

改善¶

次のサポートされていない引数の組み合わせを持つメソッドについて、Snowflakeからネイティブpandasへの自動切り替え機能を強化しました。
- suffix または非整数 periods パラメーターを持つ shift()
- sort_index() と axis=1 または key パラメーター
- sort_values() を使用した axis=1
- melt() と col_level パラメーター
- DataFrame の result_type パラメーター付き apply()
- sort=True の pivot_table()、文字列以外の index リスト、文字列以外の columns リスト、文字列以外の values リスト、または文字列以外の値を持つ aggfunc dict
- downcast パラメーターで fillna() するか、 value と一緒に limit を使用する
- dropna() を使用した axis=1
- how パラメータ、 fill_value パラメータ、 normalize=True、または freq パラメータ（週、月、四半期、年）を指定した asfreq()
- groupby() に axis=1、 by!=None and level!=None またはpandas以外のハッシュ化可能なラベルを含む。
- groupby_fillna() と downcast パラメーター
- groupby_first() を使用した min_count>1
- groupby_last() を使用した min_count>1
- groupby_shift() と freq パラメーター
1列の DataFrame およびSeriesオブジェクトに対する agg、 nunique、 describe および関連メソッドのパフォーマンスがわずかに向上しました。
高速版のpandasに以下のサポートを追加します。
- groupby.apply
- groupby.nunique
- groupby.size
- concat
- copy
- str.isdigit
- str.islower
- str.isupper
- str.istitle
- str.lower
- str.upper
- str.title
- str.match
- str.capitalize
- str.__getitem__
- str.center
- str.count
- str.get
- str.pad
- str.len
- str.ljust
- str.rjust
- str.split
- str.replace
- str.strip
- str.lstrip
- str.rstrip
- str.translate
- dt.tz_localize
- dt.tz_convert
- dt.ceil
- dt.round
- dt.floor
- dt.normalize
- dt.month_name
- dt.day_name
- dt.strftime
- dt.dayofweek
- dt.weekday
- dt.dayofyear
- dt.isocalendar
- rolling.min
- rolling.max
- rolling.count
- rolling.sum
- rolling.mean
- rolling.std
- rolling.var
- rolling.sem
- rolling.corr
- expanding.min
- expanding.max
- expanding.count
- expanding.sum
- expanding.mean
- expanding.std
- expanding.var
- expanding.sem
- cumsum
- cummin
- cummax
- groupby.groups
- groupby.indices
- groupby.first
- groupby.last
- groupby.rank
- groupby.shift
- groupby.cumcount
- groupby.cumsum
- groupby.cummin
- groupby.cummax
- groupby.any
- groupby.all
- groupby.unique
- groupby.get_group
- groupby.rolling
- groupby.resample
- to_snowflake
- to_snowpark
- resample.min
- resample.max
- resample.count
- resample.sum
- resample.mean
- resample.median
- resample.std
- resample.var
- resample.size
- resample.first
- resample.last
- resample.quantile
- resample.nunique
より高速なpandasをデフォルトで無効にします（オプトアウトではなくオプトイン）
高速なpandasで keep!=False の場合に結合を回避することで、 drop_duplicates のパフォーマンスが向上します。

バグ修正¶

funcが出力列の名前を設定するために使用されるタプルのリストである DataFrameGroupBy.agg のバグを修正しました。
タイムゾーンのあるmodin datetimeインデックスを np.asarray 付きのnumpy配列に変換すると、 TypeError が発生するバグを修正しました。
Series引数を持つ Series.isin が行位置ではなくインデックスラベルと一致するバグを修正しました。

バージョン1.42.0（2025年10月29日）¶

新機能¶

Snowpark Python DB-API は一般公開されています。

この機能にアクセスするには、DataFrameReader.dbapi() を使用して、データベーステーブルからデータを読み込むか、DB-API 接続を使用して DataFrame にクエリを実行します。

バージョン1.41.0:2025年10月23日¶

新機能¶

snowflake.snowpark.functions に、ユーザーが |spcs|（SPCS）サービスを表す呼び出し可能な関数を作成できる新しい関数 service を追加しました。
DataFrame クラスに新しい関数 group_by_all() を追加しました。
DataFrameReader.dbapi()`（パブリックプレビュー）メソッドに、キーワード引数を :code:`create_connection 呼び出し可能関数に渡せる connection_parameters パラメーターを追加しました。
Session.begin_transaction、 Session.commit、および Session.rollback のサポートを追加しました。
functions.py で以下の関数のサポートを追加しました。
- 地理空間関数:
  - st_interpolate
  - st_intersection
  - st_intersection_agg
  - st_intersects
  - st_isvalid
  - st_length
  - st_makegeompoint
  - st_makeline
  - st_makepolygon
  - st_makepolygonoriented
  - st_disjoint
  - st_distance
  - st_dwithin
  - st_endpoint
  - st_envelope
  - st_geohash
  - st_geomfromgeohash
  - st_geompointfromgeohash
  - st_hausdorffdistance
  - st_makepoint
  - st_npoints
  - st_perimeter
  - st_pointn
  - st_setsrid
  - st_simplify
  - st_srid
  - st_startpoint
  - st_symdifference
  - st_transform
  - st_union
  - st_union_agg
  - st_within
  - st_x
  - st_xmax
  - st_xmin
  - st_y
  - st_ymax
  - st_ymin
  - st_geogfromgeohash
  - st_geogpointfromgeohash
  - st_geographyfromwkb
  - st_geographyfromwkt
  - st_geometryfromwkb
  - st_geometryfromwkt
  - try_to_geography
  - try_to_geometry
interval_day_time_from_parts 関数と interval_year_month_from_parts 関数の、列名の自動エイリアス作成を有効および無効にするパラメーターを追加しました。

バグ修正¶

ignoreNamespace が True の場合に、 DataFrameReader.xml が、宣言されていない名前空間を持つ XML ファイルの解析に失敗するバグを修正しました。
interval_day_time_from_parts の浮動小数点精度の不一致の修正を追加しました。
pandasバックエンドの列マルチインデックスを持つSnowpark pandas DataFrames を to_snowflake を使ってSnowflakeに書き込むと KeyError が発生するバグを修正しました。
DataFrameReader.dbapi （パブリックプレビュー）がoracledb 3.4.0と互換性がないバグを修正しました。
いくつかのシナリオにおいて、セッションの初期化中に modin が意図せずインポートされてしまうバグを修正しました。
余分なセッション引数が渡された場合に session.udf|udtf| udaf|sproc.register が失敗するバグを修正しました。これらのメソッドはセッション引数を期待しません。提供された場合には、削除してください。

改善¶

DataFrameReader.dbapi のスキーマ推論で推論される StringType 列のデフォルトの最大長は、Parquetファイルベースの取り込みにおいて、16 MB から 128 MB に増加しました。

依存関係の更新¶

snowflake-connector-python>=3.17,<5.0.0 の依存関係を更新しました。

Snowpark Pandas API の更新¶

新機能¶

pd.get_dummies の dtypes パラメーターのサポートを追加しました。
df.pivot_table 、 df.agg 、その他の集計関数が使用可能な場所において、 nunique のサポートを追加しました。
「linear」、「ffill」/「pad」、「backfill」/「bfill」メソッドで、 DataFrame.interpolate と Series.interpolate のサポートを追加しました。これらは、 SQL INTERPOLATE_LINEAR 、 INTERPOLATE_FFILL 、 INTERPOLATE_BFILL 関数を使用します（パブリックプレビュー）。

改善¶

Parquetファイル経由でデータをアップロードすることにより、大規模データに対する Series.to_snowflake と pd.to_snowflake(series) のパフォーマンスを改善しました。Snowpark pandasがParquetに切り替えるデータセットサイズは、変数 modin.config.PandasToSnowflakeParquetThresholdBytes で制御できます。
次のサポートされていない引数の組み合わせを持つメソッドについて、Snowflakeからネイティブpandasへの自動切り替え機能を強化しました。
- get_dummies()`と :code:`dummy_na=True 、 drop_first=True 、またはカスタム dtype パラメーター
- cumsum() 、 cummin() 、 cummax() と axis=1 （列幅操作）
- skew() と axis=1 または numeric_only=False パラメーター
- round() とシリーズとして decimals パラメーター
- corr() と method!=pearson パラメーター
すべてのSnowpark pandasセッションの cte_optimization_enabled をTrueに設定します。
高速版のpandasに以下のサポートを追加します。
- isin
- isna
- isnull
- notna
- notnull
- str.contains
- str.startswith
- str.endswith
- str.slice
- dt.date
- dt.time
- dt.hour
- dt.minute
- dt.second
- dt.microsecond
- dt.nanosecond
- dt.year
- dt.month
- dt.day
- dt.quarter
- dt.is_month_start
- dt.is_month_end
- dt.is_quarter_start
- dt.is_quarter_end
- dt.is_year_start
- dt.is_year_end
- dt.is_leap_year
- dt.days_in_month
- dt.daysinmonth
- sort_values
- loc （列の設定）
- to_datetime
- drop
- invert
- duplicated
- iloc
- head
- columns （例: df.columns = ["A", "B"]）
- agg
- min
- max
- count
- sum
- mean
- median
- std
- var
- groupby.agg
- groupby.min
- groupby.max
- groupby.count
- groupby.sum
- groupby.mean
- groupby.median
- groupby.std
- groupby.var
- drop_duplicates
relaxed query compilerの行カウントを get_axis_len に再利用します。

バグ修正¶

count_rows() が呼び出されるたびに順序付き DataFrame に行カウントがキャッシュされないバグを修正しました。

バージョン1.40.0（2025年10月6日）¶

新機能¶

Python UDFs およびSnowflake内で実行されるストアドプロシージャ内でSnowflake SecretsにアクセスするためのPythonラッパーを提供する新しいモジュール snowflake.snowpark.secrets を追加しました。
- get_generic_secret_string
- get_oauth_access_token
- get_secret_type
- get_username_password
- get_cloud_provider_token
functions.py で以下のスカラー関数のサポートを追加しました。
- 条件式関数:
  - booland
  - boolnot
  - boolor
  - boolxor
  - boolor_agg
  - decode
  - greatest_ignore_nulls
  - least_ignore_nulls
  - nullif
  - nvl2
  - regr_valx
- 半構造化データ関数と構造化データ関数:
  - array_remove_at
  - as_boolean
  - map_delete
  - map_insert
  - map_pick
  - map_size
- 文字列とバイナリ関数:
  - chr
  - hex_decode_binary
- 数値関数:
  - div0null
- 差分プライバシー関数:
  - dp_interval_high
  - dp_interval_low
- コンテキスト関数:
  - last_query_id
  - last_transaction
- 地理空間関数:
  - h3_cell_to_boundary
  - h3_cell_to_children
  - h3_cell_to_children_string
  - h3_cell_to_parent
  - h3_cell_to_point
  - h3_compact_cells
  - h3_compact_cells_strings
  - h3_coverage
  - h3_coverage_strings
  - h3_get_resolution
  - h3_grid_disk
  - h3_grid_distance
  - h3_int_to_string
  - h3_polygon_to_cells
  - h3_polygon_to_cells_strings
  - h3_string_to_int
  - h3_try_grid_path
  - h3_try_polygon_to_cells
  - h3_try_polygon_to_cells_strings
  - h3_uncompact_cells
  - h3_uncompact_cells_strings
  - haversine
  - h3_grid_path
  - h3_is_pentagon
  - h3_is_valid_cell
  - h3_latlng_to_cell
  - h3_latlng_to_cell_string
  - h3_point_to_cell
  - h3_point_to_cell_string
  - h3_try_coverage
  - h3_try_coverage_strings
  - h3_try_grid_distance
  - st_area
  - st_asewkb
  - st_asewkt
  - st_asgeojson
  - st_aswkb
  - st_aswkt
  - st_azimuth
  - st_buffer
  - st_centroid
  - st_collect
  - st_contains
  - st_coveredby
  - st_covers
  - st_difference
  - st_dimension

バグ修正¶

ストアドプロシージャ/udxf以外の環境で使用した場合、実行された SQL にパラメーターバインディングが含まれていると DataFrame.limit() が失敗するバグを修正しました。
ネスト化および構造化された型を使用する際に無効なSQLの付与を引き起こす可能性のあるスキーマクエリ生成のバグに実験的な修正を追加しました。
DataFrameReader.dbapi （パブリックプレビュー）の複数のバグを修正しました。
- 未処理の行データに起因する pyodbc ドライバーでの UDTF 取り込みの失敗を修正しました。
- 不正な選択クエリ生成による SQL Server クエリ入力の失敗を修正しました。
- UDTF の取り込みで、出力スキーマで列のヌル許容性が保持されない問題を修正しました。
- マルチスレッドのParquetベースの取り込みにおいて、データ取得エラーが発生するとプログラムがハングする問題を修正しました。
- カスタムのスキーマ文字列が大文字のデータ型名（ NUMERIC 、 NUMBER 、 DECIMAL 、 VARCHAR 、 STRING 、 TEXT ）を使用していた場合のスキーマ解析のバグを修正しました。
Session.create_dataframe で、大文字のデータ型名（たとえば NUMERIC 、 NUMBER 、 DECIMAL 、 VARCHAR 、 STRING 、 TEXT など）を使用した場合にスキーマ文字列の解析に失敗するバグを修正しました。

改善¶

:code:`DataFrameReader.dbapi`（パブリックプレビュー）を改善し、外部データソースクエリの SQL 構文エラーなど、リトライ不可能なエラーでリトライしないようにしました。
session.read.option('rowTag', <tag_name>).xml(<stage_file_path>) または xpath 関数を使用時の、ローカルパッケージバージョンの不一致に関する不要な警告を削除しました。
fetch_size パラメーターのデフォルト値を100000に設定することで、 :code:`DataFrameReader.dbapi`（パブリックプレビュー）の読み取りパフォーマンスを改善しました。
session.read.option('rowValidationXSDPath', <xsd_path>).xml(<stage_file_path>) を使用して XML ファイルを読み込むときの XSD 検証の失敗に対するエラーメッセージを改善しました。

Snowpark Pandas API の更新¶

依存関係の更新¶

サポートされる modin バージョンを、>=0.36.0および <0.38.0 (was >= 0.35.0および<0.37.0）に更新しました。

新機能¶

単一レベルのインデックスを持つ DataFrames の DataFrame.query のサポートを追加しました。
Added support for DataFrameGroupby.__len__ and SeriesGroupBy.__len__.

改善¶

ハイブリッド実行モードがデフォルトで有効になりました。より小さなデータに対する特定の操作が、ネイティブのpandasのメモリ内で自動的に実行されるようになりました。これをオフにし、すべての実行をSnowflakeで行うようにするには、 from modin.config import AutoSwitchBackend; AutoSwitchBackend.disable() を使用します。
AutoSwitchBackend を使用する代わりに、ハイブリッド実行を有効/無効にするセッションパラメーター pandas_hybrid_execution_enabled を追加しました。
特定の条件下で read_snowflake から発行される不要な SHOW OBJECTS クエリを削除しました。
ハイブリッド実行が有効な場合に、 pd.merge 、 pd.concat 、 DataFrame.merge 、 DataFrame.join で、関数の引数に含まれているバックエンド以外にも引数を移動できるようになりました。
Parquetファイル経由でデータをアップロードすることにより、大規模データに対する DataFrame.to_snowflake と pd.to_snowflake(dataframe) のパフォーマンスを改善しました。Snowpark pandasがParquetに切り替えるデータセットサイズは、変数 modin.config.PandasToSnowflakeParquetThresholdBytes で制御できます。

バージョン1.39.1:2025年9月25日¶

バグ修正¶

ネスト化および構造化された型を使用する際に無効な SQL の付与を引き起こす可能性のあるスキーマクエリ生成のバグに実験的な修正を追加しました。

バージョン1.39.0:2025年9月17日¶

新機能¶

ログメッセージが内部 DataFrameReference オブジェクトのSnowpark DataFrame 参照が変更されましたと伝えるレベル logging.DEBUG - 1 にダウングレードしました。
セッションを取得するときに、大文字と小文字のステータスに対する重複するパラメーターチェッククエリを排除します。
オブジェクトメタデータを介して DataFrame 行カウントを取得し、COUNT（*）クエリ（パフォーマンス）を回避します
Snowflake Cortex関数 Complete の適用のサポートを追加しました。
高速のpandasを導入します。行位置の計算を延期することで、パフォーマンスを改善しました。
- 次の操作は現在サポートされており、最適化の恩恵を受けることができます。read_snowflake、repr、loc、reset_index、merge およびバイナリ演算子。
- 遅延オブジェクト（例: DataFrame または Series）がサポートされている操作とサポートされていない操作の組み合わせに依存する場合、最適化は使用されません。
Snowpark pandasが apply 内で参照されている場合のエラーメッセージを更新しました。
高速pandasのダミー行位置の最適化を有効または無効にするセッションパラメーター dummy_row_pos_optimization_enabled を追加しました。

依存関係の更新¶

サポートされる modin バージョンを、>=0.35.0および <0.37.0 (was previously >= 0.34.0および<0.36.0）に更新しました。

バグ修正¶

同じデータソースが同じクエリで複数回読み込まれることがあるが、毎回異なる順序で読み取られるため、最終結果の行が欠落する drop_duplicates の問題を修正しました。この修正により、データソースが1回だけ読み取られるようになります。
AssertionError が特定のインデックス操作によって予期せず発生するハイブリッド実行モードのバグを修正しました。

Snowparkローカルテストの更新¶

新機能¶

パッチ適用 functions.ai_complete の許可のサポートを追加しました。

バージョン1.38.0:2025年9月4日¶

新機能¶

functions.py で以下の AI 駆動型関数のサポートを追加しました。
- ai_extract
- ai_parse_document
- ai_transcribe
履歴データをクエリするためのTime Travelサポートが追加されました。
- Session.table() はTime Travelパラメーターをサポートするようになりました。
  - time_travel_mode
  - statement
  - offset
  - timestamp
  - timestamp_type
  - stream
- DataFrameReader.table() は、直接引数と同じTime Travelパラメーターをサポートします。
- DataFrameReader オプションの連結を介してTime Travelをサポートします（例: session.read.option("time_travel_mode", "at").option("offset", -60).table("my_table")）。
検証と外部ロケーションへのデータ書き込みのために、以下のパラメーターに DataFrameWriter.copy_into_location を指定するサポートを追加しました。
- validation_mode
- storage_integration
- credentials
- encryption
メタデータとともにステージ上のすべてのファイルのリストを取得する Session.directory および Session.read.directory のサポートを追加しました。
DataFrameReader.jdbc(Private Preview) ドライバーに外部データソースを取り込むことを許可する JDBC のサポートを追加しました。
ソースの場所から出力ステージにファイルをコピーする FileOperation.copy_files のサポートを追加しました。
functions.py で以下のスカラー関数のサポートを追加しました。
- all_user_names
- bitand
- bitand_agg
- bitor
- bitor_agg
- bitxor
- bitxor_agg
- current_account_name
- current_client
- current_ip_address
- current_role_type
- current_organization_name
- current_organization_user
- current_secondary_roles
- current_transaction
- getbit

バグ修正¶

それが表す実際のサブタイプを照合する TimestampType の _repr_ を修正しました。
UDTF インジェスチョンがストアドプロシージャで機能しない DataFrameReader.dbapi のバグを修正しました。
誤ったステージプレフィックスが使用されるスキーマ推論のバグを修正しました。

改善¶

不要な操作を防ぐために DataFrameReader.dbapi スレッドベースのインジェスチョンでエラーの処理を強化し、リソース効率を改善しました。
以前のバージョンに加えて cloudpickle==3.1.1 もサポートするように、cloudpickleの依存関係を更新しました。
サーバー側のカーソルを使用してデータを取得することで、PostgreSQL および MySQL の :code:`DataFrameReader.dbapi`（パブリックプレビュー）インジェスチョンパフォーマンスを改善しました。

Snowpark pandas API の更新¶

新機能¶

「Pandas」および「Ray」バックエンドで、次の関数のサポートを完了しました。
- pd.read_snowflake()
- pd.to_iceberg()
- pd.to_pandas()
- pd.to_snowpark()
- pd.to_snowflake()
- DataFrame.to_iceberg()
- DataFrame.to_pandas()
- DataFrame.to_snowpark()
- DataFrame.to_snowflake()
- Series.to_iceberg()
- Series.to_pandas()
- Series.to_snowpark()
- Series.to_snowflake()
  
  「Pandas」および「Ray」バックエンド。以前は、これらの関数とメソッドの一部のみがPandasバックエンドでサポートされていました。
Index.get_level_values() のサポートを追加しました。

改善¶

Snowflakeから送信するデータのハイブリッド実行におけるデフォルト転送制限を100kに設定します。これは:codenowrap: SnowflakePandasTransferThreshold 環境変数で上書きできます。この構成は、リレーショナルワークロードで2つの利用可能なエンジン、「pandas」と「Snowflake」を使用するシナリオに適しています。
--upgrade をメッセージの pip install "snowflake-snowpark-python[modin]" に追加することで、インポートエラーメッセージを改善しました。
5秒間のウィンドウに事前に集約し、ハイブリッド実行とネイティブpandasパフォーマンスの追跡に役立つ狭い範囲のメトリックのみを維持することで、modinクライアントからのテレメトリーメッセージを削減しました。
ハイブリッド実行が有効な場合にのみ初期行カウントを設定すると、多くのワークロードに対して発行されるクエリの数が減ります。
ハイブリッド実行を有効にするための統合テスト用の新しいテストパラメーターを追加しました。

バグ修正¶

pandasまたはrayバックエンドを使用して DataFrames またはシリーズでSnowflake拡張関数/メソッド to_dynamic_table()、cache_result()、to_view()、create_or_replace_dynamic_table() および create_or_replace_view() を呼び出そうとしたときに AttributeError ではなく NotImplementedError が発生します。

バージョン1.37.0（2025年8月18日）¶

新機能¶

functions.py で以下の xpath 関数のサポートを追加しました。
- xpath
- xpath_string
- xpath_boolean
- xpath_int
- xpath_float
- xpath_double
- xpath_long
- xpath_short
Session.write_arrow() 関数にある use_vectorized_scanner パラメーターのサポートを追加しました。
DataFrame プロファイラーは各クエリについて以下の情報を追加します：describe query time、 execution time`および :code:`sql query text。この情報を表示するには、session.dataframe_profiler.enable()`を呼び出し、 DataFrame上で :code:`get_execution_profile を呼び出します。
DataFrame.col_ilike のサポートを追加しました。
AsyncJob オブジェクトを返す、ノンブロッキングストアドプロシージャ呼び出しのサポートが追加されました。
- Session.call() に block: bool = True のパラメーターを追加しました。block=False のとき、ブロックする代わりに完了まで AsyncJob を返します。
- 名前付きストアドプロシージャと匿名ストアドプロシージャの両方で非同期をサポートするため、StoredProcedure.__call__() への block: bool = True パラメーターを追加しました。
- Session.call(block=False)`と同等の:code:`Session.call_nowait() を追加しました。

バグ修正¶

大規模な入力データを使用しながら DataFrame が session.create_dataframe() を使ってローカルに作成される際、内部プランの deepcopy がメモリ急増を引き起こす可能性のある CTE 最適化ステージでのバグを修正しました。
infer_schema_options の ignore_case オプションが尊重されない DataFrameReader.parquet におけるバグを修正しました。
クエリ結果の形式が JSON および ARROW に設定されている場合、 to_pandas() の列名に異なる形式が使用されるバグを修正しました。

非推奨¶

pkg_resources を廃止しました。

依存関係の更新¶

Protobuf<6.32 に依存関係を追加しました。

Snowpark pandas API の更新¶

新機能¶

DataFrame.set_backend メソッドを使用した、Snowflakeと <Ray <https://www.ray.io/>`_間でのデータの効率的な転送サポートが追加されました。:code:`modin のインストールされているバージョンは少なくとも0.35.0および ray をインストールする必要があります。

依存関係の更新¶

サポートされるModinバージョンを>=0.34.0、 <0.36.0 (was previously >= 0.33.0および<0.35.0）に更新しました。
インストールされたModinバージョンが0.35.0以上の場合、pandas 2.3のサポートを追加しました。

バグ修正¶

pd.to_datetime および pd.to_timedelta が予期せず IndexError を発生させるハイブリッド実行モード（プライベートプレビュー）の問題を修正しました。
潜在的な切り替え操作が実行される前に呼び出された際、 pd.explain_switch が:code:IndexError を発生させるか None を返すバグを修正しました。

バージョン1.36.0（2025年8月5日）¶

新機能¶

pandas DataFrame からか pyarrow テーブルから、 DataFrame を作成する際、 Session.create_dataframe は Session.write_pandas または Session.write_arrow への内部呼び出しで転送されるキーワード引数を受け入れるようになりました。
AsyncJob に新しい APIs を追加しました。
- AsyncJob.is_failed() は、ジョブが失敗したかどうかを示すbool値を返します。ジョブが終了し、エラーが発生したかどうかを判断するために AsyncJob.is_done() と組み合わせて使用できます。
- result() を呼び出すことなく詳細なモニタリングを行うために、AsyncJob.status() は、現在のクエリステータスを表す文字列（"RUNNING"、 "SUCCESS"、 "FAILED_WITH_ERROR"など）を返します。
DataFrame プロファイラーを追加しました。使用するには、ご希望の DataFrame で get_execution_profile() を呼び出すことができます。このプロファイラーは、各クエリ演算子に関する統計と、 DataFrame を評価するために実行されたクエリをレポートします。現在は、実験的な機能です。
functions.py で以下の関数のサポートを追加しました。
- ai_sentiment
context.configure_development_features 実験的な機能のインターフェースを更新しましたユーザーが明示的に有効にしない限り、すべての開発機能はデフォルトで無効になります。

改善¶

ハイブリッド実行行の推定を改善し、先行呼び出しを縮小しました。
ハイブリッド実行使用時にSnowflakeからの転送コストを制御する新しい構成変数を追加しました。
DataFrame/Series/GroupBy.applyを使用した、永続的で不変の UDFs/UDTFs、マップ、および snowflake_udf_params キーワード引数を渡すことによる変換を作成するサポートを追加しました。
mapping np.unique から DataFrame、および pd.unique を使用したシリーズ入力のためのサポートを追加しました。

バグ修正¶

ユーザーがプログラムで、または環境変数を使用して明示的に構成している場合でも、Snowpark pandas プラグインが無条件に AutoSwitchBackend を無効にする問題を修正しました。

バージョン1.35.0（2025年7月24日）¶

新機能¶

functions.py で以下の関数のサポートを追加しました。
- ai_embed
- try_parse_json

改善¶

クエリを囲むための括弧が不要になるように、 DataFrameReader.dbapi （プライベートプレビュー）の query パラメーターを改善しました。
ターゲットデータソースのスキーマを推論するときに発生する例外に対する DataFrameReader.dbapi （プライベートプレビュー）でのエラーエクスペリエンスが改善されました。

バグ修正¶

Pythonストアドプロシージャで、プロセス終了コード1で dbapi を失敗する:code:DataFrameReader.dbapi (プライベートプレビュー)のバグを修正しました。
custom_schema が無効なスキーマを受け入れる DataFrameReader.dbapi （プライベートプレビュー）のバグを修正しました。
custom_schema がPostgresおよび MySQL に接続する場合に機能しない DataFrameReader.dbapi （プライベートプレビュー）のバグを修正しました。
外部ステージで失敗するスキーマ推論のバグを修正しました。

Snowparkローカルテストの更新¶

新機能¶

SnowflakeFile でファイルを読み取るためのローカルテストサポートを追加しました。テストサポートは、ローカルファイルパス、Snow URL セマンティック（snow://...）、ローカルテストフレームワークステージ、Snowflakeステージ（@stage/file_path）を使用します。

バージョン1.34.0（2025年7月14日）¶

新機能¶

DataFrameReader に新しいオプション TRY_CAST を追加しました。TRY_CAST が True の場合、データをロードする際ハードキャストの代わりに列は TRY_CAST ステートメントでラップされます。
DataFrameReader の INFER_SCHEMA_OPTIONS に新しいオプション USE_RELAXED_TYPES を追加しました。True`に設定した場合、このオプションはすべての文字列を最長文字列にキャストし、すべての数値型を :code:`DoubleType にキャストします。
データフレームスキーマのメタデータを積極的に検証するため、デバッグ性を改善しました。snowflake.snowpark.context.configure_development_features() を使用して有効にします。
ユーザーがデータフレーム全体で関数をマッピングできるように、新しい関数 snowflake.snowpark.dataframe.map_in_pandas を追加しました。マッピング関数は、Pandas DataFrames のイテレーターを入力として取り、出力として1つ提供します。
クエリを説明する ttl cache を追加しました。15秒間隔で繰り返されるクエリは、Snowflakeを再クエリするのではなく、キャッシュされた値を使用します。
ローカルインジェスチョンで並列データをフェッチするための複数の処理を有効にするため、パラメーター fetch_with_process を DataFrameReader.dbapi （PrPr）に追加しました。デフォルトでは、ローカルインジェスチョンはマルチスレッドを使用します。複数処理により、Parquetファイルの生成などの CPU バウンドタスクのパフォーマンスを向上させることができます。
ユーザーがモデルのメソッドを呼び出せるように、新しい関数 snowflake.snowpark.functions.model を追加しました。

改善¶

rowTag オプションを使用した行タグを持つ XML ファイル読み取り時の、 rowValidationXSDPath オプションを使用した XSD スキーマを使用する行検証のサポートを追加しました。
session.table().sample() がフラットな SQL ステートメントを生成するために、SQL の生成を改善しました。
functions.explode の入力として、複雑な列式のサポートが追加されました。
どのPython行が SQL コンパイルエラーに対応しているかを示すデバッグ性の向上を追加しました。snowflake.snowpark.context.configure_ Development_features()`を使用して有効にします。この機能は :code:`session.ast_enabled = True を使用して実行する、セッション内での AST コレクションの有効化にも依存します。
Set enforce_ordering=True when calling to_snowpark_pandas() from a Snowpark DataFrame containing DML/DDL queries instead of throwing a NotImplementedError.

バグ修正¶

Icebergテーブルを作成する際の冗長検証によって発生するバグを修正しました。
カーソルまたは接続を閉じると、予期せずエラーが発生し、プログラムが終了する可能性があった :code:`DataFrameReader.dbapi`（プライベートプレビュー）のバグを修正しました。
DataFrame の入力列と一致する出力列を持つ DataFrame.select() でテーブル関数を使用する際のあいまいな列エラーを修正しました。DataFrame 列が Column オブジェクトとして提供される際に、この改善が機能します。
DecimalTypes の列に NULL がある際、代わりに列を FloatTypes にキャストし、精度の低下につながるバグを修正しました。

Snowparkローカルテストの更新¶

ウィンドウ関数を処理する際に、結果のインデックス作成が不正になるバグを修正しました。
スカラー数値が fillna に渡されると、Snowflakeはエラーを生成する代わりに、数値以外の列を無視します。

Snowpark pandas API の更新¶

新機能¶

DataFrame.to_excel および Series.to_excel のサポートを追加しました。
pd.read_feather、 pd.read_orc、および pd.read_stata のサポートを追加しました。
ハイブリッド実行決定に関するデバッグ情報を返す pd.explain_switch() のサポートを追加しました。
グローバルModinバックエンドが Pandas の場合、 pd.read_snowflake をサポートします。
pd.to_dynamic_table、 pd.to_iceberg、および pd.to_view のサポートを追加しました。

改善¶

API コールとハイブリッドエンジンスイッチにModinテレメトリーを追加しました。
modin または pandas バージョンが要件と一致しない際、Snowflake Notebookユーザーに対して、より役立つエラーメッセージを表示します。
ハイブリッド実行モード（プライベートプレビュー）のコスト関数に、データ型の互換性をチェックするデータ型ガードを追加しました。
pandas on Snowflakeに直接実装されていない多くのメソッドに対して、ハイブリッド実行モード（プライベートプレビュー）のpandasバックエンドに自動切り替えを追加しました。
pandas on Snowflakeテレメトリーの type およびその他の標準フィールドを設定しました。

依存関係の更新¶

ユーザーがModinのバックエンドを切り替えたときに進行状況バーが表示されるように、 tqdm および ipywidgets を依存関係として追加しました。
サポートされる modin バージョンを、>=0.33.0および <0.35.0 (was previously >= 0.32.0および<0.34.0）に更新しました。

バグ修正¶

ハイブリッド実行モード（プライベートプレビュー）で、特定の系列操作が TypeError: numpy.ndarray object is not callable を発生させるバグを修正しました。
Pandasバックエンドを使用したmodinオブジェクトに対する np.where のような numpy 操作の呼び出しが AttributeError を発生させる、ハイブリッド実行モード（プライベートプレビュー）でのバグを修正しました。この修正には modin バージョン0.34.0以降が必要です。
結果の値に、追加のサフィックスが適用される:code:df.melt での問題を修正しました。

バージョン1.33.0（2025-06-19）¶

新機能¶

Parquetと UDTF ベースのインジェスチョンの両方の DataFrameWriter.dbapi （プライベートプレビュー）での MySQL のサポートを追加しました。
Parquetと UDTF ベースのインジェスチョンの両方の DataFrameReader.dbapi （プライベートプレビュー）での PostgreSQL のサポートを追加しました。
Databricksサポートの他の例と統合して、 UDTF ベースのインジェスチョン用の DataFrameWriter.dbapi （プライベートプレビュー）でのDatabricksのサポートを追加しました。
有効化された INFER_SCHEMA でファイルの読み取りをするとき PATTERN の使用を可能にする DataFrameReader のサポートを追加しました。
functions.py で以下の AI 駆動型関数のサポートを追加しました。
- ai_complete
- ai_similarity
- ai_summarize_agg （元は summarize_agg）
- ai_classify のさまざまな構成オプション
rowTag オプションを使用した行タグを持つ XML ファイル読み取り時の、より多くのオプションのサポートが追加されました。
- ignoreNamespace を使用して列名から名前空間プレフィックスを削除するためのサポートを追加しました。
- attributePrefix オプションを使用して、結果テーブルの属性列のプレフィックスを指定するためのサポートを追加しました。
- excludeAttributes オプションを使用して XML 要素から属性を除外するためのサポートを追加しました。
- valueTag オプションを使用して、子要素を持たない要素に属性がある場合に値の列名を指定できるようにするサポートを追加しました。
- nullValue オプションを使用してnull値として扱う値を指定するためのサポートを追加しました。
- charset オプションを使用して XML ファイルの文字エンコードを指定するサポートを追加しました。
- ignoreSurroundingWhitespace オプションを使用して XML 要素の周囲の空白を無視するサポートを追加しました。
関数の戻り型を DataFrame オブジェクトに設定するために使用できる Session.call のパラメーター return_dataframe のサポートが追加されました。
文字列に対して計算される stddev および mean をトリガーする strings_include_math_stats と呼ばれる Dataframe.describe に新しい引数を追加しました。
DataFrame.lineage.trace の DGQL から系統を取得する場合に Edge.properties を取得するためのサポートを追加しました。
テーブルが既に存在するかどうかを指定できるパラメーター table_exists を DataFrameWriter.save_as_table に追加しました。これにより、コストがかかる可能性のあるテーブルルックアップをスキップできます。

バグ修正¶

ローカル関数として定義されている create_connection がマルチプロセッシングと互換性を持たない DataFrameReader.dbapi （プライベートプレビュー）のバグを修正しました。
TIMESTAMP_LTZ 型であるべきDatabricks TIMESTAMP 型が、Snowflake TIMESTAMP_NTZ 型に変換された DataFrameReader.dbapi （プライベートプレビュー）のバグを修正しました。
同じリーダーオブジェクトで繰り返し読み込みを行うと、誤って引用符で囲まれた列が作成される DataFrameReader.json のバグを修正しました。
選択ステートメントからのものではない DataFrame を変換するときに列名を削除する可能性がある DataFrame.to_pandas() のバグを修正しました。
DataFrame が UDTF を含み UDTF 内の SELECT * が正しく解析されないとき、 DataFrame.create_or_replace_dynamic_table がエラーを生じるバグを修正しました。
キャストされた列が関数の値句で使用できないバグを修正しました。

改善¶

入力pandas DataFrame に列がないときの Session.write_pandas() および :code:`Session.create_dataframe()`のエラーメッセージを改善しました。
現在の DataFrame の列と衝突する出力列を持つテーブル関数が引数に含まれる際の DataFrame.select を改善しました。改善により、ユーザーが df.select("col1", "col2", table_func(...)) に衝突しない列を文字列引数として提供した場合、Snowparkクライアントによって生成されるクエリがあいまいな列エラーを発生させることはなくなりました。
パフォーマンスとセキュリティを向上させるため、インメモリParquetベースインジェスチョンを使用できるように DataFrameReader.dbapi （プライベートプレビュー）を改善しました。
テーブルへのコピー操作において MATCH_BY_COLUMN_NAME=CASE_SENSITIVE を使用するために DataFrameReader.dbapi （プライベートプレビュー）を改善しました。

Snowparkローカルテストの更新¶

新機能¶

ローカルファイルテストにsnow URLs （snow://）のサポートを追加しました。

バグ修正¶

結合されたデータまたは以前にフィルタリングされたデータの誤ったフィルタリングを引き起こす可能性がある :code:`Column.isin`のバグを修正しました。
結果が不正なインデックスを持つ可能性がある snowflake.snowpark.functions.concat_ws のバグを修正しました。

Snowpark pandas API の更新¶

依存関係の更新¶

modin の依存関係制約を0.32.0から>=0.32.0, <0.34.0に更新しました。Snowpark Pandasでテストされた最新バージョンは modin 0.33.1です。

新機能¶

ハイブリッド実行（プライベートプレビュー） のサポートを追加しました。from modin.config import AutoSwitchBackend; AutoSwitchBackend.enable() の実行により、pandas on Snowflakeは特定のpandas操作をローカルで実行するか、Snowflake上で実行するかを自動的に選択します。この機能はデフォルトで無効になっています。

改善¶

DataFrame.to_view、 Series.to_view、 DataFrame.to_dynamic_table および Series.to_dynamic_table のために index パラメーターのデフォルト値を False に設定しました。
テーブル作成関数の iceberg_version オプションを追加しました。
入力データのサイズを取得するクエリを以前に発行した insert、 repr および groupby を含む多くの操作のクエリ数を削減しました。

バグ修正¶

other パラメーターが名前のない Series の際、 :code:`Series.where`のバグを修正しました。

バージョン1.32.0（2025-05-15）¶

改善¶

Snowflakeシステムプロシージャを呼び出しても、プロシージャの戻り値タイプをチェックする追加の describe procedure 呼び出しは起動しません。
ステージURLと FILE データタイプを持つ Session.create_dataframe() に対するサポートが追加されました。
session.read.option('mode', <mode>), option('rowTag', <tag_name>).xml(<stage_file_path>) を使用してXMLファイルを読み込む際に、破損したXML記録を処理するための異なるモードに対するサポートが追加されました。現在、 PERMISSIVE、 DROPMALFORMED、 FAILFAST がサポート対象になります。
指定された ROWTAG がファイル内に見つからない場合のXMLリーダーのエラーメッセージが改善されました。
Dataframe.drop のクエリ生成が改善されました。SELECT * EXCLUDE () を使用してドロップされた列を除外できるようになります。この機能を有効にするには、 session.conf.set("use_simplified_query_generation", True) を設定します。
StructType.from_json に VariantType のサポートを追加しました。

バグ修正¶

外部データベース内のユニコードまたは二重引用符で囲まれた列名が正しく引用されないためにエラーが発生していた DataFrameWriter.dbapi （プライベートプレビュー）のバグを修正しました。
ネストされた OBJECT データの名前付きフィールドにスペースが含まれるとエラーになるバグを修正しました。

Snowparkローカルテストの更新¶

バグ修正¶

ソート方向を無視する snowflake.snowpark.functions.rank のバグを修正しました。
フィルターにかけたデータに対して不正な結果を引き起こす snowflake.snowpark.functions.to_timestamp_* のバグを修正しました。

Snowpark pandas API の更新¶

新機能¶

Series.str.get、 Series.str.slice、 Series.str.__getitem__ （Series.str[...]）のdict値に対するサポートを追加しました。
DataFrame.to_html のサポートを追加しました。
DataFrame.to_string および Series.to_string のサポートを追加しました。
pd.read_csv を使用してS3バケットからファイルを読み込むサポートを追加しました。

改善¶

iceberg_config が DataFrame.to_iceberg と Series.to_iceberg の必須パラメーターになります。

バージョン1.31.0（2025-04-24）¶

新機能¶

Added support for the restricted caller permission of execute_as argument in StoredProcedure.register().
DataFrame.to_pandas() における非選択ステートメントに対するサポートを追加しました。
Session.add_packages、 Session.add_requirements、 Session.get_packages、 Session.remove_package、 Session.clear_packages に artifact_repository パラメーターのサポートを追加しました。
session.read.option('rowTag', <tag_name>).xml(<stage_file_path>) で行タグを使用してXMLファイルを読み込むサポートを追加しました（実験的）。
- XMLの各記録が個別の行として抽出されます。
- その記録内の各フィールドが VARIANT タイプの独立した列になり、 col(a.b.c) などのドット記法でさらにクエリを実行できるようになります。
DataFrameReader.dbapi （PrPr）に更新を追加しました。
- 取り込んだ複数のデータを1つのParquetファイルにマージしてパフォーマンスを最適化するための fetch_merge_count パラメーターを追加しました。
- Databricksに対するサポートを追加しました。
- Snowflake UDTFによるインジェストに対するサポートを追加しました。
functions.py でのAI対応関数のサポートを追加しました（プライベートプレビュー）。
- prompt
- ai_filter （prompt() 関数と画像ファイルに対するサポートを追加し、第2引数名を expr から file に変更）
- ai_classify

改善¶

DataFrame.to_snowpark_pandas の relaxed_ordering パラメーター名を enforce_ordering に変更しました。また、新しいデフォルト値は enforce_ordering=False になり、以前のデフォルト値 relaxed_ordering=False とは逆の効果になります。
デフォルトの fetch_size パラメーター値を1000に設定することで、 DataFrameReader.dbapi （PrPr）の読み込みパフォーマンスを改善しました。
一致する可能性のある識別子を提案することにより、無効な識別子SQLエラーのエラーメッセージを改善しました。
session.table を使用してSnowflakeテーブルからDataFrameを作成する際に発行されるdescribeクエリの数を減らしました。
DataFrameAnalyticsFunctions.time_series_agg() のパフォーマンスと精度を向上させました。

バグ修正¶

ピボット列と集計列が同じ場合の DataFrame.group_by().pivot().agg のバグを修正しました。
create_connection が未対応のドライバータイプの接続オブジェクトを返した場合に TypeError が発生する DataFrameReader.dbapi （PrPr）のバグを修正しました。
df.limit(0) 呼び出しが正しく適用されないバグを修正しました。
アペンドモードを使用すると予約名がエラーになる DataFrameWriter.save_as_table のバグを修正しました。

非推奨¶

Python3.8のサポートが廃止予定になりました。
DataFrameAnalyticsFunctions.time_series_agg() の sliding_interval 引数が廃止予定になりました。

Snowparkローカルテストの更新¶

新機能¶

Window.range_between にインターバル式のサポートを追加しました。
array_construct 関数に対するサポートを追加しました。

バグ修正¶

ローカルテストにおいて、一時ディレクトリの __pycache__ がインポートによるストアドプロシージャの実行中に意図せずコピーされるバグを修正しました。
ローカルテストにおいて、 Column.like の呼び出しに不正な結果が生じるバグを修正しました。
ローカルテストにおいて、 Column.getItem と snowpark.snowflake.functions.get が null ではなく IndexError を返すバグを修正しました。
ローカルテストにおいて、 df.limit(0) の呼び出しが正しく適用されないバグを修正しました。
ローカルテストにおいて、空のテーブルに Table.merge を入力すると例外が発生するバグを修正しました。

Snowpark Pandas API の更新¶

依存関係の更新¶

modin を0.30.1から0.32.0に更新しました。
numpy 2.0以上に対するサポートを追加しました。

新機能¶

DataFrame.create_or_replace_view および Series.create_or_replace_view のサポートを追加しました。
DataFrame.create_or_replace_dynamic_table および Series.create_or_replace_dynamic_table のサポートを追加しました。
DataFrame.to_view および Series.to_view のサポートを追加しました。
DataFrame.to_dynamic_table および Series.to_dynamic_table のサポートを追加しました。
集計の max、 mean、 median、 min、 sum に対する DataFrame.groupby.resample のサポートを追加しました。
次を使用したステージファイルの読み込み対するサポートを追加しました。
- pd.read_excel
- pd.read_html
- pd.read_pickle
- pd.read_sas
- pd.read_xml
DataFrame.to_iceberg および Series.to_iceberg のサポートを追加しました。
Series.str.len でのdict値のサポートを追加しました。

改善¶

高価なピボットステップを回避することで、 DataFrame.groupby.apply と Series.groupby.apply のパフォーマンスを向上させました。
より良いエンジン切り替えを可能にするため、 OrderedDataFrame に行数の上限推定値を追加しました。その結果、クエリ数が増加する可能性があります。
relaxed_ordering パラメーター名を enforce_ordering に変更しました（ pd.read_snowflake ）。また、新しいデフォルト値は enforce_ordering=False になり、以前のデフォルト値 relaxed_ordering=False とは逆の効果になります。

バグ修正¶

icebergテーブルと enforce_ordering=True の読み込み時における pd.read_snowflake のバグを修正しました。

バージョン1.30.0（2025-03-27）¶

新機能¶

relaxed_ordering パラメーターを採用することで、 Dataframe.to_snowpark_pandas における緩和された一貫性と順序保証のサポートを追加しました。
DataFrameReader.dbapi （プレビュー）で session_init_statement パラメーターに文字列のリストを指定できるようになり、セッションの初期化中に複数のSQLステートメントを実行できるようになります。

改善¶

Dataframe.stat.sample_by のクエリ生成を改善しました。fractions の各キーに対してUNION ALLサブクエリを作成する旧方式と比較して、大規模な fractions ディクショナリで適切なスケーリングを行う単一のフラットクエリを生成するようになります。この機能を有効にするには、 session.conf.set("use_simplified_query_generation", True) を設定します。
Parquetファイルをテーブルにコピーする際にベクトル化オプションを有効にすることで、 DataFrameReader.dbapi のパフォーマンスが向上しました。
次を行うことで DataFrame.random_split のクエリ生成を改善しました。session.conf.set("use_simplified_query_generation", True) を設定すると有効になります。
- データフレームの純粋なレイジー動作になる入力データフレームの内部実装での cache_result に対する必要性を削除しました。
- 引数 seed が複数の呼び出しやセッションにわたって再現性のある結果で期待通りに動作するようになりました。
include_decimal が True に設定されている場合、 DataFrame.fillna と DataFrame.replace の両方で、 int と float を Decimal 列に入れられるようになります。
一般公開に伴い、次に挙げる files.py のストアドプロシージャ関数とUDFに関するドキュメントを追加しました。
- SnowflakeFile.write
- SnowflakeFile.writelines
- SnowflakeFile.writeable
SnowflakeFile と SnowflakeFile.open() のドキュメントに若干の変更が行われました。

バグ修正¶

エラーが発生する以下の関数のバグを修正しました。.cast() が出力に適用されます。
- from_json
- size

Snowparkローカルテストの更新¶

バグ修正¶

空のグループでも行が生成される集計のバグを修正しました。
行が正しくドロップされない Dataframe.except_ のバグを修正しました。
フィルターされた列をキャストすると to_timestamp が失敗するバグを修正しました。

Snowpark Pandas API の更新¶

新機能¶

Series.str.__getitem__ （Series.str[...]）のリスト値に対するサポートを追加しました。
GROUP BYの操作で pd.Grouper オブジェクトに対するサポートを追加しました。freq を指定すると、引数 sort、 closed、 label、 convention のデフォルト値がサポートされます。start または start_day の場合は origin がサポートされます。
新しいパラメーター relaxed_ordering を導入することで、 pd.read_snowflake で、名前付きデータソース（テーブルやビューなど）とクエリデータソースの両方に対して、緩和された一貫性と順序保証をサポートするようになりました。

改善¶

QUOTED_IDENTIFIERS_IGNORE_CASE がセットされていることが判明するたびに警告を発し、ユーザーに設定解除が求められます。
index_label の場合、 DataFrame.to_snowflake および Series.to_snowflake における index=True の欠落に対する処理が改善されました。ValueError を発する代わりに、インデックス列にシステム定義のラベルが使用されます。
関数名がサポートされていない場合の groupby、 DataFrame、 Series.agg のエラーメッセージを改善しました。

Snowparkローカルテストの更新¶

改善¶

QUOTED_IDENTIFIERS_IGNORE_CASE がセットされていることが判明するたびに警告を発し、ユーザーに設定解除が求められます。
index_label の場合、 DataFrame.to_snowflake および Series.to_snowflake における index=True の欠落に対する処理が改善されました。ValueError を発する代わりに、インデックス列にシステム定義のラベルが使用されます。
関数名がサポートされていない場合の groupby or DataFrame or Series.agg のエラーメッセージを改善しました。

バージョン1.29.1（2025-03-12）¶

バグ修正¶

ストアドプロシージャとSnowbooksでの使用を妨げる DataFrameReader.dbapi （プライベートプレビュー）のバグを修正しました。

バージョン1.29.0（2025-03-05）¶

新機能¶

functions.py でのAI対応関数のサポートを追加しました（プライベートプレビュー）。
- ai_filter
- ai_agg
- summarize_agg

functions.py （プライベートプレビュー）で、以下の関連関数を持つ新しいFILE SQLタイプに対するサポートが追加されました。

fl_get_content_type

fl_get_etag

fl_get_file_type

fl_get_last_modified

fl_get_relative_path

fl_get_scoped_file_url

fl_get_size

fl_get_stage

fl_get_stage_file_url

fl_is_audio

fl_is_compressed

fl_is_document

fl_is_image

fl_is_video

Artifact Repository（プライベートプレビュー）を使用したPyPiからのサードパーティパッケージのインポートに対するサポートを追加しました。

ストアドプロシージャやユーザー定義関数を登録する際、アーティファクトリポジトリとパッケージをそれぞれ指定できるように、キーワード引数 artifact_repository および packages を使用します。

サポート対象のAPIsは以下の通りです。

Session.sproc.register

Session.udf.register

Session.udaf.register

Session.udtf.register

functions.sproc

functions.udf

functions.udaf

functions.udtf

functions.pandas_udf

functions.pandas_udtf

改善¶

ストアドプロシージャの登録時に、 snowflake-snowpark-python パッケージの互換性に関するバージョン検証警告が改善されました。メジャーバージョンとマイナーバージョンが一致しない場合にのみ警告が発せられ、バグ修正バージョンの違いについては警告を発さなくなります。

cloudpickleの依存関係を改善し、以前のバージョンに加えて cloudpickle==3.0.0 にも対応するようになります。

バグ修正¶

スレッドセーフセッションが無効の場合に、多数の値を持つDataframeを作成すると Unsupported feature 'SCOPED_TEMPORARY'. エラーが発生するバグを修正しました。

DataFrameがステージファイルを読み込んで作成され、CTEの最適化が有効になっている場合に、 df.describe が内部SQL実行エラーを発生させるバグを修正しました。

session.conf.set("use_simplified_query_generation", True) を使用して簡易クエリ生成を有効にした場合、 df.order_by(A).select(B).distinct() が無効なSQLを生成するバグを修正しました。

簡易クエリ生成をデフォルトで無効にしました。

Snowpark Pandas API の更新¶

改善¶

テーブルが存在しない場合の pd.to_snowflake、 DataFrame.to_snowflake、 Series.to_snowflake のエラーメッセージを改善しました。

pd.to_snowflake、 DataFrame.to_snowflake、 Series.to_snowflake の if_exists パラメーターのdocstringの可読性を改善しました。

SnowparkオブジェクトでUDFsを使用するすべてのpandas関数のエラーメッセージを改善しました。

バグ修正¶

Series.rename_axis で AttributeError が発生するバグを修正しました。

pd.get_dummies がNULL/NaNの値をデフォルトで無視しなかったバグを修正しました。

pd.get_dummies を繰り返し呼び出すと「列名の重複エラー」が発生するバグを修正しました。

pd.get_dummies で、列のリストを渡すと、出力DataFrameに誤った列ラベルが生成されるバグを修正しました。

pd.get_dummies を更新し、intではなくbool値を返すようにしました。

Snowparkローカルテストの更新¶

新機能¶

range_between ウィンドウ関数にリテラル値のサポートを追加しました。

バージョン1.28.0（2025-02-20）¶

新機能¶

functions.py で以下の関数のサポートを追加しました。
- normal
- randn
Dataframe.union_by_name と Dataframe.union_all_by_name に allow_missing_columns パラメーターのサポートを追加しました。

改善¶

競合を避けるためにオブジェクト名のランダム生成を改善しました。
Dataframe.distinct のクエリ生成を改善し、SELECTの代わりにSELECT DISTINCTを生成し、GROUP BYの全列を生成するようにしました。この機能を無効にするには、 session.conf.set("use_simplified_query_generation", False) をセットします。

非推奨¶

Snowpark Python関数 snowflake_cortex_summarize が廃止予定になりました。ユーザーは snowflake-ml-python をインストールし、代わりに snowflake.cortex.summarize 関数を使用することができます。
Snowpark Python関数 snowflake_cortex_sentiment が廃止予定になりました。ユーザーは snowflake-ml-python をインストールし、代わりに snowflake.cortex.sentiment 関数を使用することができます。

バグ修正¶

複数のクエリを生成するDataFramesにおいて、セッションレベルのクエリタグがスタックトレースによって上書きされるバグを修正しました。これで、 session.conf.set("collect_stacktrace_in_query_tag", True) の場合、クエリタグはスタックトレースにのみセットされるようになります。
Session._write_pandas で、Snowpark pandasオブジェクトを書き込む際に Session._write_modin_pandas_helper に use_logical_type のパラメーターを誤って渡していたバグを修正しました。
SQLオプション生成において、複数の値が正しくフォーマットされないバグを修正しました。
Session.catalog で、データベースまたはスキーマの空文字列が正しく処理されず、誤ったSQLステートメントを生成していたバグを修正しました。

実験的機能¶

Snowflakeテーブルへのpyarrowテーブルの書き込みに対するサポートを追加しました。

Snowpark Pandas API の更新¶

新機能¶

Snowflake Cortex関数 Summarize および Sentiment の適用に対するサポートを追加しました。
Series.str.get におけるリスト値のサポートを追加しました。

バグ修正¶

apply で、kwargsが正しく適用関数に渡されないバグを修正しました。

Snowparkローカルテストの更新¶

新機能¶

以下の関数のサポートを追加しました。
- hour
- minute
CSVリーダーにNULL_IFパラメーターのサポートを追加しました。
CSVsをロードする場合の date_format、 datetime_format、 timestamp_format オプションに対するサポートを追加しました。

バグ修正¶

DataFrame.join で、列のタイプに誤りがあったバグを修正しました。
when ステートメントで、 otherwise 句の結果が不正になるバグを修正しました。

バージョン1.27.0（2025-02-05）¶

新機能¶

functions.py で以下の関数のサポートを追加しました。

array_reverse
divnull
map_cat
map_contains_key
map_keys
nullifzero
snowflake_cortex_sentiment
acosh
asinh
atanh
bit_length
bitmap_bit_position
bitmap_bucket_number
bitmap_construct_agg
cbrt
equal_null
from_json
ifnull
localtimestamp
max_by
min_by
nth_value
nvl
octet_length
position
regr_avgx
regr_avgy
regr_count
regr_intercept
regr_r2
regr_slope
regr_sxx
regr_sxy
regr_syy
try_to_binary
base64
base64_decode_string
base64_encode
editdistance
hex
hex_encode
instr
log1p
log2
log10
percentile_approx
unbase64
DataFrame.create_dataframe を呼び出す際にスキーマ文字列（暗黙の構造体構文を含む）を指定できるようになりました。
DataFrameWriter.insert_into/insertInto のサポートを追加しました。この方法はローカルテストモードもサポートしています。
DataFrame.create_temp_view で仮ビューを作成できるようになりました。ビューが既に存在する場合は失敗します。
関数 map_cat および map_concat において、複数列のサポートを追加しました。
DataFrame.with_column と DataFrame.with_columns で元の列の並び順を維持するためのオプション keep_column_order を追加しました。
StructType 列でのフィールドの名前変更や追加を可能にするオプションを列キャストに追加しました。
ArrayType に contains_null parameter のサポートを追加しました。
ステージからファイルを読み込んで作成された DataFrame から DataFrame.create_or_replace_temp_view 経由で仮ビューを作成する機能を追加しました。
MapType への value_contains_null パラメーターのサポートを追加しました。
現在の環境がインタラクティブなものであるかどうかを示すテレメトリーにインタラクティブを追加しました。
現在のバージョンから/で始まるファイルパスを読み込めるように、Native Appsで session.file.get を許可します。
DataFrame.pivot 以降、複数の集計関数をサポートするようになりました。

実験的機能¶

Snowflakeオブジェクトを管理する Session.catalog クラスを追加しました。Session.catalog からアクセスできます。
- snowflake.core はこの機能に必要な依存関係です。
ステージ上でJSONファイルを読み込む際に、ユーザー入力のスキーマ（複数可）を許可しています。
DataFrame.create_dataframe を呼び出す際にスキーマ文字列（暗黙の構造体構文を含む）を指定できるようになりました。

改善¶

README.md を更新し、 cosign を使用したパッケージ署名の検証方法の説明を追加しました。

バグ修正¶

ローカルテストモードで、列に0が含まれる必要がある場合にNoneが含まれるバグを修正しました。
StructField.from_json で tzinfo を含む TimestampTypes が正しく解析されないバグを修正しました。
function date_format で入力列が日付タイプまたはタイムスタンプタイプの場合にエラーとなるバグを修正しました。
DataFrameで、NULL値が挿入できない列にNULL値が挿入されてしまうバグを修正しました。
関数 replace および lit において、列式オブジェクトを渡すとタイプヒントアサーションエラーが発生するバグを修正しました。
pandas_udf および pandas_udtf において、セッションパラメーターが誤って無視されていたバグを修正しました。
session.call を通して呼び出されたシステム関数で、タイプ変換エラーが発生するバグを修正しました。

Snowpark Pandas API の更新¶

新機能¶

Series.str.ljust および Series.str.rjust のサポートを追加しました。
Series.str.center のサポートを追加しました。
Series.str.pad のサポートを追加しました。
Snowpark Python関数 snowflake_cortex_sentiment の適用に対するサポートを追加しました。
DataFrame.map のサポートを追加しました。
DataFrame.from_dict および DataFrame.from_records のサポートを追加しました。
構造体型列で大文字と小文字が混在するフィールド名のサポートを追加しました。
SeriesGroupBy.unique のサポートを追加しました。
以下のディレクティブによる Series.dt.strftime のサポートを追加しました。
- %d: ゼロ埋めした10進数としての月の日付。
- %m: ゼロ埋めした10進数としての月。
- %Y: 世紀を10進数で表した年。
- %H: ゼロ埋めした10進数としての時間（24時間制）。
- %M: ゼロ埋めした10進数としての分。
- %S: ゼロ埋めした10進数としての秒。
- %f: マイクロ秒を10進数で表し、6桁にゼロ埋め。
- %j: ゼロ埋めした10進数としての年の日付。
- %X: ロケールの適切な時間表現。
- %%: リテラル「%」文字。
Series.between のサポートを追加しました。
DataFrameGroupBy.apply での include_groups=False のサポートを追加しました。
Series.str.split での expand=True のサポートを追加しました。
DataFrame.pop および Series.pop のサポートを追加しました。
DataFrameGroupBy.agg と SeriesGroupBy.agg で first と last のサポートを追加しました。
Index.drop_duplicates のサポートを追加しました。
"count"、 "median"、 np.median、 "skew"、 "std"、 np.std "var"、および np.var の pd.pivot_table()、 DataFrame.pivot_table()、および pd.crosstab() における集計のサポートを追加しました。

改善¶

可能な場合、numpy関数をSnowpark関数にマッピングすることで、 DataFrame.map、 Series.apply、 Series.map のメソッドのパフォーマンスを改善しました。
DataFrame.map のドキュメントを追加しました。
可能な場合、numpy関数をSnowpark関数にマッピングすることで、 DataFrame.apply のパフォーマンスを改善しました。
Snowparkのpandasとscikit-learnの相互運用性の範囲に関するドキュメントを追加しました。
型ヒントが提供されていない場合、 Series.map、 Series.apply、 DataFrame.map の関数の戻り値の型を推測します。
交換プロトコルの呼び出し含むメソッド呼び出しをカウントするテレメトリーに call_count を追加しました。