Snowflake Notebooksについて

Snowflake Notebooks はSnowsightの開発インターフェイスで、Pythonと SQL 用のインタラクティブなセルベースのプログラミング環境を提供します。 Snowflake Notebooks では、探索的データ分析、機械学習モデルの開発、その他のデータサイエンスおよびデータエンジニアリングのタスクをすべて1か所で実行できます。

  • すでにSnowflakeにあるデータの探索と実験、またはローカルファイル、外部クラウドストレージ、 Snowflake Marketplace からのデータセットから新しいデータをSnowflakeにアップロードします。

  • SQLまたはPythonコードを記述し、セルごとの開発と実行で結果をすばやく比較できます。

  • 埋め込みStreamlit可視化や、Altair、Matplotlib、seabornなどのライブラリを使って、データをインタラクティブに可視化できます。

  • 結果を文脈化し、Markdownセルで異なる結果についてメモを作成します。

  • セルとそれに先行するすべての変更されたセルを実行するデフォルトの動作に依存してデータを新鮮に保つ、またはセルごとに実行してノートブックをデバッグします。

  • ノートブックはスケジュール通りに実行します。 Snowflake Notebookの実行スケジュール をご参照ください。

  • Snowflakeで利用可能なロールベースのアクセスコントロールやその他のデータガバナンス機能を利用して、同じロールを持つ他のユーザーにノートブックの表示やコラボレーションを許可します。

Snowsight UIのノートブックの例

Notebookランタイム

Snowflake Notebooks は、ウェアハウスランタイムとコンテナランタイムの2種類のランタイムを提供します。Notebooksは、コンピューティングリソースを提供するために、仮想ウェアハウスや Snowpark Container Services コンピューティングプールに依存しています。両方のアーキテクチャで、 SQL とSnowparkのクエリは、パフォーマンスを最適化するために、常にウェアハウス上で実行されるようにプッシュダウンされます。

ウェアハウスランタイムは、一般的に利用可能な馴染みのあるウェアハウス環境で、最速でスタートアップする方法を提供します。コンテナランタイムは、 SQL 分析やデータエンジニアリングなど、さまざまなタイプのワークロードをサポートできる、より柔軟な環境を提供します。コンテナランタイムにデフォルトで必要なものが含まれていない場合は、追加のPythonパッケージをインストールできます。コンテナランタイムには CPU と GPU のバージョンもあり、多くの一般的な ML パッケージがプリインストールされているため、 ML やディープラーニングのワークロードに最適です。

以下のテーブルは、ランタイムのタイプごとにサポートされている機能を示したものです。このテーブルを使うと、どのランタイムが自分のユースケースに適しているかを判断するのに役立ちます。

サポートされている機能

Warehouse Runtime

Container Runtime

計算

カーネルはSnowflakeが管理するデフォルトのウェアハウス上で実行されます。

カーネルは Compute Pool ノード上で実行されます。

環境

Python 3.9

Python 3.10

ベース画像

Streamlit + Snowpark

Snowflakeコンテナランタイム。CPU と GPU の画像には、Pythonライブラリ一式がプリインストールされています。

その他のPythonライブラリ

インストールは、Snowflake Anacondaを使用するか、Snowflakeステージから行います。

インストールは、 pip を使用するか、Snowflakeステージから行います。

編集サポート

  • Python、 SQL、Markdownセル。

  • SQL セルからの出力をPythonセルで参照します。

  • Streamlitのような可視化ライブラリを使用します。

ウェアハウスと同じ

アクセス

ノートブックへのアクセスと編集に必要な所有権。

ウェアハウスと同じ

サポートされているNotebookの機能

  • Git統合

  • マルチファイル編集

  • スケジューリング

ウェアハウスと同じ

Snowflake Notebooks 入門

Snowflake Notebooks を使い始めるには、 Snowsight にサインインし、 ノートブックを使用するようにアカウントを設定 した上で、 Projects ペインから Notebooks を選択します。アカウントでアクセス権のあるノートブックのリストが表示されます。ゼロから新しいノートブックを作成するか、既存の .ipynb ファイルをアップロードすることができます。

次のテーブルは、 Snowflake Notebooks を初めて使用する場合に確認すべきトピックを示しています。

入門ガイド

Snowflake Notebookの設定

Snowflake Notebooksの設定

Notebookを使用する前の、開発者と管理者向け説明。

Snowflake Notebookを作成する

Snowflake Notebooksを作成する

ゼロから、または既存のファイルから新しいノートブックを作成します。

Snowflake Notebookでコードを開発して実行する

Snowflake Notebookでコードを開発して実行する

Python、SQL、Markdownセルを作成、編集、実行します。

開発者ガイド

ガイド

説明

ノートブックのセッションコンテキスト

セッションコンテキストへのアクセスと変更

結果をノートブックに保存する

セッションをまたいだノートブックと結果の保存。

ノートブックで使用するPythonパッケージをインポートする

AnacondaチャンネルからのPythonパッケージのインポート。

Notebookでデータを可視化し、操作します。

matplotlib、plotly、altairでデータを可視化し、Streamlitでデータアプリを開発します。

Notebookのセルと変数の参照

SQLセル出力とPython変数値を参照します。

Snowflake Notebooksのキーボードショートカット

キーボードショートカットを活用して、編集作業を効率化します。

ノートブックワークフローのレベルアップ

ガイド

説明

Snowflake NotebooksとGitの同期

共同作業や開発のためにノートブックをバージョン管理します。

ノートブックでファイルを操作する

ノートブック環境でファイルを管理および作業します。

ノートブック実行をスケジュールする

ノートブックをスケジュールして、Snowflake内でコードを実行します。

ノートブックでSnowflakeを体験する

Snowflake Notebooks 内の他のSnowflake機能を活用します。

Snowflake Notebooks でのエラーのトラブルシューティング

Snowflake Notebooks を使用中に発生する可能性のあるエラーをトラブルシューティングします。

クイックスタート

注目のユースケース

Github 内で、データサイエンス、データエンジニアリング、 ML/AI の強調表示されたユースケースをご参照ください。

Snowflake Notebookでのデータエンジニアリング

データエンジニアリング

SQLおよびSnowparkを使用したスケーラブルなデータパイプラインの開発、管理、スケジューリング、実行を行います。

Snowflake Notebookを使ったデータサイエンス

データサイエンス

PythonとSQLを使用して、データを探索、可視化、分析します。

Snowflake Notebookを使った機械学習

機械学習およびAI

CortexとSnowpark MLを使った機能エンジニアリング、モデルトレーニング、開発。

注釈

これらのクイックスタートはあくまで例として示したものです。例に従った場合、Snowflakeが所有または提供していないサードパーティのデータ、製品、またはサービスに対する追加の権利が必要になる場合があります。Snowflakeはこの例の正確性を保証するものではありません。

追加のリソース

  • ノートブックのデモ、チュートリアル、例については、 Github の Snowflake Notebooks デモをご参照ください。

  • チュートリアルビデオを表示するには、 Snowflake Notebooks Youtubeプレイリスト をご参照ください。

  • ノートブックを作成、実行、表示する SQL コマンドについては、 Snowflake Notebooks API リファレンス をご参照ください。

  • 参照アーキテクチャ、業界固有のユースケース、ノートブックを使用したソリューションのベストプラクティスをお探しですか?Snowflake Solution Centerの ノートブックの例 をご参照ください。