Snowflake Notebooksについて¶
Snowflake Notebooks は、Python、 SQL 、Markdown用の対話的なセルベースのプログラミング環境を提供する、 Snowsight の統一開発インターフェイスです。 Snowflake Notebooks では、Snowflake データを活用して、探索的データ分析、機械学習モデルの開発、その他のデータサイエンスおよびデータエンジニアリングワークフローを、すべて同じインターフェイス内で実行できます。
すでにSnowflakeにあるデータの探索と実験、またはローカルファイル、外部クラウドストレージ、 Snowflake Marketplace からのデータセットから新しいデータをSnowflakeにアップロードします。
SQLまたはPythonコードを記述し、セルごとの開発と実行で結果をすばやく比較できます。
埋め込みStreamlit可視化や、Altair、Matplotlib、seabornなどのライブラリを使って、データをインタラクティブに可視化できます。
Gitと統合し、効果的なバージョン管理でコラボレーション。 Snowflake NotebooksとGitリポジトリの同期 をご参照ください。
結果を文脈化し、Markdownのセルとチャートで異なる結果についてメモを作成します。
パイプラインを自動化するために、スケジュールでNotebooksを実行します。 Snowflake Notebookの実行スケジュール をご参照ください。
Snowflakeで利用可能なロールベースのアクセスコントロールやその他のデータガバナンス機能を利用して、同じロールを持つ他のユーザーにノートブックの表示やコラボレーションを許可します。
個人データベースに保存されたプライベートノートブックを作成し、インタラクティブにコードを開発したり、本番データ資産を実験したりできます。 プライベートノートブック をご参照ください。

Notebookランタイム¶
Snowflake Notebooks は、ウェアハウスランタイムとコンテナーランタイムの2種類のランタイムを提供します。Notebooksは、コンピューティングリソースを提供するために、仮想ウェアハウスや Snowpark Container Services コンピューティングプールに依存しています。両方のアーキテクチャで、 SQL とSnowparkのクエリは、パフォーマンスを最適化するために、常にウェアハウス上で実行されるようにプッシュダウンされます。
ウェアハウス・ランタイムは、一般的に可用性に優れた使い慣れたウェアハウス環境で、最も早く始めることができます。コンテナランタイムは、 SQL 分析やデータエンジニアリングなど、さまざまなタイプのワークロードをサポートできる、より柔軟な環境を提供します。コンテナランタイムにデフォルトで必要なものが含まれていない場合は、追加のPythonパッケージをインストールできます。コンテナーランタイムには、 CPU および GPU バージョンもあり、多くの一般的な ML パッケージがプリインストールされているため、 ML やディープラーニングのワークロードに最適です。
以下のテーブルは、ランタイムのタイプごとにサポートされている機能を示したものです。このテーブルを使うと、どのランタイムが自分のユースケースに適しているかを判断するのに役立ちます。
サポートされている機能 |
Warehouse Runtime |
Container Runtime |
---|---|---|
計算 |
カーネルはウェアハウス上で動作します。 |
カーネルは Compute Pool ノード上で実行されます。 |
環境 |
Python 3.9 |
Python 3.10 |
ベース画像 |
Streamlit + Snowpark |
Snowflakeコンテナランタイム。CPU と GPU の画像には、Pythonライブラリ一式がプリインストールされています。 |
その他のPythonライブラリ |
インストールは、Snowflake Anacondaを使用するか、Snowflakeステージから行います。 |
インストールは、 |
編集サポート |
|
ウェアハウスと同じ |
アクセス |
ノートブックへのアクセスと編集に必要な所有権。 |
ウェアハウスと同じ |
サポートされるNotebooksの機能(まだプレビュー) |
|
ウェアハウスと同じ |
Snowflake Notebooks 入門¶
Snowflake Notebooks を使い始めるには、 Snowsight にサインインし、 ノートブックを使用するようにアカウントを設定 した上で、 Projects ペインから Notebooks を選択します。アカウントでアクセス権のあるノートブックのリストが表示されます。ゼロから新しいノートブックを作成するか、既存の .ipynb
ファイルをアップロードすることができます。
次のテーブルは、 Snowflake Notebooks を初めて使用する場合に確認すべきトピックを示しています。
入門ガイド |
|
---|---|
Notebookを使用する前の、開発者と管理者向け説明。 |
|
ゼロから、または既存のファイルから新しいノートブックを作成します。 |
|
Snowflake Notebookでコードを開発して実行する Python、SQL、Markdownセルを作成、編集、実行します。 |
開発者ガイド¶
ガイド |
説明 |
---|---|
セッションコンテキストへのアクセスと変更 |
|
セッションをまたいだノートブックと結果の保存。 |
|
AnacondaチャンネルからのPythonパッケージのインポート。 |
|
matplotlib、plotly、altairでデータを可視化し、Streamlitでデータアプリを開発します。 |
|
SQLセル出力とPython変数値を参照します。 |
|
キーボードショートカットを活用して、編集作業を効率化します。 |
ノートブックワークフローのレベルアップ¶
ガイド |
説明 |
---|---|
共同作業や開発のためにノートブックをバージョン管理します。 |
|
ノートブック環境でファイルを管理および作業します。 |
|
ノートブックをスケジュールして、Snowflake内でコードを実行します。 |
|
Snowflake Notebooks 内の他のSnowflake機能を活用します。 |
|
Snowflake Notebooks を使用中に発生する可能性のあるエラーをトラブルシューティングします。 |
クイックスタート¶
はじめてのSnowflake Notebooks入門 [ビデオ _] [ソース]
最初のノートブックプロジェクトを10分以内ですぐに始める方法を学びましょう。
Snowflake Notebooksによるビジュアルデータストーリー [ビデオ _] [ソース]
ビジュアライゼーション、Markdown、画像、インタラクティブなデータアプリケーションを使用して、説得力のあるデータナラティブを作成する方法を、コードやデータと一緒にノートブック内で学ぶことができます。
注目のユースケース¶
Github 内で、データサイエンス、データエンジニアリング、 ML/AI の強調表示されたユースケースをご参照ください。
SQLおよびSnowparkを使用したスケーラブルなデータパイプラインの開発、管理、スケジューリング、実行を行います。 |
|
PythonとSQLを使用して、データを探索、可視化、分析します。 |
|
CortexとSnowpark MLを使った機能エンジニアリング、モデルトレーニング、開発。 |
注釈
これらのクイックスタートはあくまで例として示したものです。例に従い、Snowflakeが所有または提供していない第三者のデータ、製品、またはサービスに対する追加の権利が必要となる場合があります。Snowflakeはこの例の正確性を保証するものではありません。
追加のリソース¶
Notebooks のデモ、チュートリアル、例については、 GitHub の Snowflake Notebooks デモ 集を参照してください。
チュートリアルビデオを表示するには、 Snowflake Notebooks YouTube プレイリスト をご覧ください。
ノートブックを作成、実行、表示する SQL コマンドについては、 Snowflake Notebooks API リファレンス をご参照ください。
参照アーキテクチャ、業界固有のユースケース、ノートブックを使用したソリューションのベストプラクティスをお探しですか?Snowflake Solution Centerの ノートブックの例 をご参照ください。