2025年5月19日 --- Snowflake ML Data Connectorリリースノート

Snowflake ML Data Connector for Container Runtime --- 一般公開

Snowflake ML Data ConnectorがノートブックセッションやMLジョブなどのコンテナーランタイムのインスタンスでの使用を目的として一般提供されます。このコネクタを使用すると、Snowflakeデータソースからコンテナー化されたPython環境に効率的にデータを取り込むことができます。分散処理を活用してデータの読み込みを高速化します。

主な機能は以下の通りです。

  • あらゆるSnowflakeデータソース(テーブルまたはステージ)からオープンソースMLワークフローで使用するpandasデータフレームに直接データを読み込みます。

  • SnowflakeデータからPyTorchおよびTensorFlowのデータセットを作成し、一般的なMLフレームワークとシームレスに統合します。

  • Snowflakeのコンテナーランタイムの内側と外側の両方で同じコードを使用します。

  • Snowpark DataFrames(開発に最適)とSnowflake Datasets(バージョン管理されたスキーマレベルの本番用オブジェクト)の両方をサポートします。

  • 大規模モデルのトレーニングとチューニング向けにSnowflakeの分散APIsと統合できます。