Python用Snowpark開発者ガイド¶
Snowparkライブラリ は、データパイプライン内のデータをクエリおよび処理するための直感的な API を提供します。Snowparkライブラリを使用すると、アプリケーションコードが実行されるシステムにデータを移動することなく、Snowflakeでデータを処理するアプリケーションをビルドできます。ストアドプロシージャを作成し、それらのプロシージャを Snowflake のタスクとしてスケジュールすることで、データの変換と処理を自動化することもできます。
始めましょう¶
Snowpark Pythonコードは、ローカル開発環境または Snowsight のPythonワークシートで記述できます。
クライアントアプリケーションを作成する必要がある場合は、次の手順でローカル開発環境を設定します。
お好みの開発環境を設定して、Snowparkアプリを構築します。 Snowpark Pythonの開発環境の設定 をご参照ください。
Snowflakeデータベースとやり取りするためのセッションを確立します。 Snowpark Pythonのセッションの作成 をご参照ください。
Snowflakeでタスクを自動化するストアドプロシージャを作成する場合は、 Snowsight でPythonワークシートを使用します。 PythonワークシートでSnowparkコードを記述する をご参照ください。
Snowpark Pythonコードの記述¶
Snowpark Pythonを使用して、さまざまな方法でデータのクエリ、処理、および変換を行うことができます。
DataFrame
オブジェクトを使用してデータをクエリおよび処理します。 Snowpark PythonでのDataFramesの使用 をご参照ください。カスタムラムダと関数を、データを処理するために呼び出すことができるユーザー定義関数(UDFs)に変換します。 Pythonでの DataFrames 用ユーザー定義関数(UDFs)の作成 をご参照ください。
データを処理し、1つ以上の列を持つ一連の行でデータを返すユーザー定義の表形式関数(UDTF)を記述します。 PythonでのDataFramesのユーザー定義テーブル関数(UDTFs)の作成 をご参照ください。
データを処理するために呼び出すことができるストアド プロシージャを作成するか、データパイプラインを構築するタスクを自動化します。 PythonでDataFramesのストアドプロシージャを作成 をご参照ください。
機械学習タスクの実行¶
Snowpark Pythonを使用して、モデルのトレーニングなどの機械学習タスクを実行できます。
ストアドプロシージャを記述して、機械学習モデルをトレーニングします。 Snowpark Pythonを使用した機械学習モデルのトレーニング をご参照ください。
Snowpark Pythonストアドプロシージャを使用して機械学習モデルをトレーニング、スコアリング、および調整し、ユーザー定義関数を使用してトレーニング済みモデルをデプロイします。 Snowpark Pythonを使用した機械学習 - クレジットカード承認予測 (Snowflakeクイックスタート)をご参照ください。
Snowpark Pythonコードのトラブルシューティング¶
ログステートメントを使用し、基になる SQL を表示して、コードをトラブルシューティングします。 Snowpark Pythonのトラブルシューティング をご参照ください。
コード実行に関するデータを記録し、分析する¶
ログメッセージを記録し、後で分析するためにイベントテーブルにイベントを追跡できます。詳細については、 ログおよびトレースの概要 をご参照ください。
API 参照情報¶
Python用Snowpark API リファレンスには、利用可能なクラスとメソッドに関する広範な詳細が含まれています。 Python用Snowparkライブラリ API リファレンス をご参照ください。
バージョン間の API の変更リストを確認するには、 Python用Snowparkライブラリのリリースノート をご参照ください。