Snowflake Notebooksについて¶
Snowflake Notebooks はSnowsightの開発インターフェイスで、Pythonと SQL 用のインタラクティブなセルベースのプログラミング環境を提供します。 Snowflake Notebooks では、探索的データ分析、機械学習モデルの開発、その他のデータサイエンスおよびデータエンジニアリングのタスクをすべて1か所で実行できます。
すでにSnowflakeにあるデータの探索と実験、またはローカルファイル、外部クラウドストレージ、 Snowflake Marketplace からのデータセットから新しいデータをSnowflakeにアップロードします。
SQLまたはPythonコードを記述し、セルごとの開発と実行で結果をすばやく比較できます。
埋め込みStreamlit可視化や、Altair、Matplotlib、seabornなどのライブラリを使って、データをインタラクティブに可視化できます。
結果を文脈化し、Markdownセルで異なる結果についてメモを作成します。
セルとそれに先行するすべての変更されたセルを実行するデフォルトの動作に依存してデータを新鮮に保つ、またはセルごとに実行してノートブックをデバッグします。
ノートブックはスケジュール通りに実行します。 Snowflake Notebookの実行スケジュール をご参照ください。
Snowflakeで利用可能なロールベースのアクセスコントロールやその他のデータガバナンス機能を利用して、同じロールを持つ他のユーザーにノートブックの表示やコラボレーションを許可します。

Notebookランタイム¶
Snowflake Notebooks は、ウェアハウスランタイムとコンテナランタイムの2種類のランタイムを提供します。Notebooksは、コンピューティングリソースを提供するために、仮想ウェアハウスや Snowpark Container Services コンピューティングプールに依存しています。両方のアーキテクチャで、 SQL とSnowparkのクエリは、パフォーマンスを最適化するために、常にウェアハウス上で実行されるようにプッシュダウンされます。
ウェアハウスランタイムは、一般的に利用可能な馴染みのあるウェアハウス環境で、最速でスタートアップする方法を提供します。コンテナランタイムは、 SQL 分析やデータエンジニアリングなど、さまざまなタイプのワークロードをサポートできる、より柔軟な環境を提供します。コンテナランタイムにデフォルトで必要なものが含まれていない場合は、追加のPythonパッケージをインストールできます。コンテナランタイムには CPU と GPU のバージョンもあり、多くの一般的な ML パッケージがプリインストールされているため、 ML やディープラーニングのワークロードに最適です。
以下のテーブルは、ランタイムのタイプごとにサポートされている機能を示したものです。このテーブルを使うと、どのランタイムが自分のユースケースに適しているかを判断するのに役立ちます。
サポートされている機能 |
Warehouse Runtime |
Container Runtime |
---|---|---|
計算 |
カーネルはSnowflakeが管理するデフォルトのウェアハウス上で実行されます。 |
カーネルは Compute Pool ノード上で実行されます。 |
環境 |
Python 3.9 |
Python 3.10 |
ベース画像 |
Streamlit + Snowpark |
Snowflakeコンテナランタイム。CPU と GPU の画像には、Pythonライブラリ一式がプリインストールされています。 |
その他のPythonライブラリ |
インストールは、Snowflake Anacondaを使用するか、Snowflakeステージから行います。 |
インストールは、 |
編集サポート |
|
ウェアハウスと同じ |
アクセス |
ノートブックへのアクセスと編集に必要な所有権。 |
ウェアハウスと同じ |
サポートされているNotebookの機能 |
|
ウェアハウスと同じ |
Snowflake Notebooks 入門¶
Snowflake Notebooks を使い始めるには、 Snowsight にサインインし、 ノートブックを使用するようにアカウントを設定 した上で、 Projects ペインから Notebooks を選択します。アカウントでアクセス権のあるノートブックのリストが表示されます。ゼロから新しいノートブックを作成するか、既存の .ipynb
ファイルをアップロードすることができます。
次のテーブルは、 Snowflake Notebooks を初めて使用する場合に確認すべきトピックを示しています。
入門ガイド |
|
---|---|
Notebookを使用する前の、開発者と管理者向け説明。 |
|
ゼロから、または既存のファイルから新しいノートブックを作成します。 |
|
Snowflake Notebookでコードを開発して実行する Python、SQL、Markdownセルを作成、編集、実行します。 |
開発者ガイド¶
ガイド |
説明 |
---|---|
セッションコンテキストへのアクセスと変更 |
|
セッションをまたいだノートブックと結果の保存。 |
|
AnacondaチャンネルからのPythonパッケージのインポート。 |
|
matplotlib、plotly、altairでデータを可視化し、Streamlitでデータアプリを開発します。 |
|
SQLセル出力とPython変数値を参照します。 |
|
キーボードショートカットを活用して、編集作業を効率化します。 |
ノートブックワークフローのレベルアップ¶
ガイド |
説明 |
---|---|
共同作業や開発のためにノートブックをバージョン管理します。 |
|
ノートブック環境でファイルを管理および作業します。 |
|
ノートブックをスケジュールして、Snowflake内でコードを実行します。 |
|
Snowflake Notebooks 内の他のSnowflake機能を活用します。 |
|
Snowflake Notebooks を使用中に発生する可能性のあるエラーをトラブルシューティングします。 |
クイックスタート¶
はじめてのSnowflake Notebooks入門 [ビデオ _] [ソース]
最初のノートブックプロジェクトを10分以内ですぐに始める方法を学びましょう。
Snowflake Notebooksによるビジュアルデータストーリー [ビデオ _] [ソース]
ビジュアライゼーション、Markdown、画像、インタラクティブなデータアプリケーションを使用して、説得力のあるデータナラティブを作成する方法を、コードやデータと一緒にノートブック内で学ぶことができます。
注目のユースケース¶
Github 内で、データサイエンス、データエンジニアリング、 ML/AI の強調表示されたユースケースをご参照ください。
SQLおよびSnowparkを使用したスケーラブルなデータパイプラインの開発、管理、スケジューリング、実行を行います。 |
|
PythonとSQLを使用して、データを探索、可視化、分析します。 |
|
CortexとSnowpark MLを使った機能エンジニアリング、モデルトレーニング、開発。 |
注釈
これらのクイックスタートはあくまで例として示したものです。例に従った場合、Snowflakeが所有または提供していないサードパーティのデータ、製品、またはサービスに対する追加の権利が必要になる場合があります。Snowflakeはこの例の正確性を保証するものではありません。
追加のリソース¶
ノートブックのデモ、チュートリアル、例については、 Github の Snowflake Notebooks デモをご参照ください。
チュートリアルビデオを表示するには、 Snowflake Notebooks Youtubeプレイリスト をご参照ください。
ノートブックを作成、実行、表示する SQL コマンドについては、 Snowflake Notebooks API リファレンス をご参照ください。
参照アーキテクチャ、業界固有のユースケース、ノートブックを使用したソリューションのベストプラクティスをお探しですか?Snowflake Solution Centerの ノートブックの例 をご参照ください。