Snowpark ML リリースノート

この記事には、 Snowpark ML のリリースノートが含まれています。また、該当する場合は以下が含まれます。

  • 動作の変更

  • 新機能

  • 顧客向けバグ修正

注釈

これらの注記には、一般に公開されていない機能の変更は含まれていません。

バージョン1.1.2(2023-12-18)

新機能および更新

モデル開発の更新:

  • precision_score メトリックスを SQL で実装しました。

バグ修正

  • テレメトリーによってスタックトレースが隠されていた問題を修正しました。

モデル開発の修正:

  • モデルの署名を推論する際に、メモリ上のデータフレーム全体が具体化されなくなりました。

バージョン1.1.1(2023-12-6)

新機能および更新

  • Snowpark ML Modeling API を一般公開としました。

  • モデリング API の新しい passthrough_col パラメーターを使用すると、 input_cols を明示的に指定しない場合、トレーニングまたは推論中にインデックス列などの特定の列を除外できます。

バグ修正

  • モデル開発の修正:

    • 行番号をバッチサイズで割ることができない場合、 confusion_matrix は誤った結果を返していました。

バージョン1.1.0(2023-12-1)

新機能および更新

  • GridSearchCV および RandomizedSearchCV の実行がマルチノードウェアハウスに分散されるようになりました。

バグ修正

  • モデル開発の修正:

    • 正規化された名前が OrdinalEncoder および LabelEncoderoutput_columns で指定された名前と一致しない場合、列は除外されていました。出力列が有効なSnowflake識別子である必要がなくなりました。

バージョン1.0.12(2023-11-15)

新機能および更新

  • なし

バグ修正

  • モデル開発の修正:

    • OrdinalEncoder の列容量を増加しました。

バージョン1.0.11(2022-10-28)

新機能および更新

  • kneighbors のサポートを追加します。

  • データ型として DecimalType をサポートします。

バグ修正

  • モデル開発の修正:

    • SKLearn グリッドサーチおよびランダムサーチモデルセレクターを使用した XGBoost および LightGBM モデルのサポートを修正します。

    • Snowflake識別子を使用するSnowpark DataFrames とのメトリックの互換性を修正します。

バージョン1.0.10(2022-10-15)

新機能および更新

  • precision_scorerecall_scoref1_scorefbeta_scoreprecision_recall_fscore_supportmean_absolute_errormean_squared_errormean_absolute_percentage_error メトリック計算の配布を開始しました。

バグ修正

  • モデル開発の修正:

    • Windowsでモデリングモジュールを使用する際の UTF-8のデコードエラーを修正します。

    • 推論で SnowparkSQLUnexpectedAliasException を引き起こすエイリアス定義を修正します。

バージョン1.0.9(2022-09-28)

新機能および更新

  • log_loss メトリックの計算の配布を開始しました。

バグ修正

  • モデル開発の修正:

    • 一部のDocker設定で画像の構築に失敗しなくなりました。

    • ライブラリがzipimportによってインポートされるときに、ローカルの ML ライブラリの埋め込みに失敗しなくなりました。

    • deploy 関数のプラットフォーム引数に関する誤ったドキュメントを更新します。

バージョン1.0.8(2023-09-15)

新機能および更新

  • なし

バグ修正

  • モデル開発の修正:

    • 順序エンコーダーは、入力列の型が混在していても使用できます。

    • sklearnのデフォルト値が np.nan である場合の問題を修正します。

バージョン1.0.7(2023-09-05)

新機能および更新

  • テレメトリーの無効化を許可します。

バグ修正

  • モデル開発の修正:

    • pandas.io.json.json_normalizer に関連するエラーを修正します。

バージョン1.0.6(2023年9月1日)

新機能および更新

  • モデル開発: メトリクス結果のサイズが以前の 8MB の制限を超過できるようになりました。

バグ修正

  • モデル開発の修正:

    • シンプルインピュターを NumPy >= 1.25で使用した場合のバグを修正しました。

    • ラベル列のタイプを推測する際のバグを修正しました。

バージョン1.0.5(2023年8月17日)

このリリースには内部的な変更のみが含まれています。

バージョン1.0.4(2023年7月28日)

新機能および更新

  • モデル開発: 入力データフレームをステージングされたファイルからロードされたデータに対して結合できるようになりました。

  • モデル開発: 英語以外の言語のサポートを追加しました。

バグ修正

  • なし

バージョン1.0.3(2023年7月14日)

このリリースには内部的な変更のみが含まれています。

バージョン1.0.2(2023年6月22日)

新機能および更新

  • モデル開発: メトリクスを追加しました。

    • d2_absolute_error_score

    • d2_pinball_score

    • explained_variance_score

    • mean_absolute_error

    • mean_absolute_percentage_error

    • mean_squared_error

バグ修正

モデル開発: accuracy_score が単一の値のリストであるラベル列名を与えられたときに動作するようになりました。

バージョン1.0.1(2023年6月16日)

動作の変更

  • モデル開発: メトリクス APIs をscikit-learnのメトリクスモジュールに従うように変更しました。

    • accuracy_scoreconfusion_matrixprecision_recall_fscore_supportprecision_score メソッドは metrics.classification に移動しました。

新機能および更新

  • モデル開発: メトリクスを追加しました。

    • f1_score

    • fbeta_score

    • recall_score

    • roc_auc_score

    • roc_curve

    • log_loss

    • precision_recall_curve

バージョン1.0.0(2023年6月9日)

初回公開プレビューリリース。