ML 関数

これらの強力な分析関数は、機械学習を使用してデータの自動予測やインサイトを提供します。Snowflakeは各機能に対して適切な型のモデルを提供するため、機械学習エキスパートでなくても活用できます。必要なのはデータのみです。

このトピックの内容:

時系列関数

これらの特徴量は、時系列データに対して機械学習モデルを学習させ、指定されたメトリック(例: 売上高)が時間の経過とともに、またデータの他の特徴量に対して、どのように変化するかを判断します。そしてモデルは、データから検出された傾向に基づいて洞察または予測を提供します。

  • 予測 は、時系列データの過去の傾向から将来のメトリック値を予測します。

  • 異常検出 は、標準的な期待値とは異なるメトリック値にフラグを立てます。

その他の分析関数

これらの特徴量は時系列データを必要としません。

  • 分類 は、最も予測しやすい特徴量に基づいて、行を2つ以上のクラスに分類します。

  • Top Insights は、意外な方法でメトリックに影響するディメンションや値を見つけるのに役立ちます。

コストの考慮事項

ML 関数を使用すると、ストレージとコンピューティングのコストが発生します。これらのコストは、使用される特徴量と、トレーニングと予測に使用されるデータ量によって異なります。

発生するストレージコストは、トレーニングステップで作成された ML モデルインスタンスのストレージに反映されます。モデルインスタンスに関連付けられたオブジェクトを表示するには、 Account Usageビュー (ACCOUNT_USAGE.TABLES と ACCOUNT_USAGE.STAGES)に移動します。これらのオブジェクトは、nullのデータベース列とスキーマ列で表示されます。しかし、 instance_id 列には、これらのオブジェクトがモデルインスタンスに含まれていることを示す値が入力されます。これらのオブジェクトはモデルインスタンスによって包括的に管理され、個別にアクセスしたり削除したりすることはできません。モデルに関連するストレージコストを削減するために、未使用のモデルや古いモデルは削除します。

Snowflakeのコンピューティングコストに関する一般的な情報については、 コンピューティングコストについて をご参照ください。

Snowparkでの ML 関数の使用

session.call はまだ ML 関数で作成されたモデルに対応していません。このようなモデルをSnowparkで呼び出すには、次のように session.sql を使用します。

session.sql('call my_model!FORECAST(...)').collect()
Copy