Allgemeine Informationen zu Snowflake Notebooks

Snowflake Notebooks ist eine Entwicklungsoberfläche in Snowsight, die eine interaktive, zellenbasierte Programmierumgebung für Python und SQL bietet. In Snowflake Notebooks können Sie explorative Datenanalysen durchführen, Machine-Learning-Modelle entwickeln und andere Data Science- und Data Engineering-Aufgaben an einem Ort erledigen.

  • Erforschen und experimentieren Sie mit Daten, die sich bereits in Snowflake befinden, oder laden Sie neue Daten aus lokalen Dateien, externen Cloudspeichern oder Datenset aus Snowflake Marketplace in Snowflake hoch.

  • Schreiben Sie SQL- oder Python-Code und vergleichen Sie die Ergebnisse schnell mithilfe der zellenweisen Entwicklung und Ausführung.

  • Visualisieren Sie Ihre Daten interaktiv mit eingebetteten Streamlit-Visualisierungen und anderen Bibliotheken wie Altair, Matplotlib oder seaborn.

  • Kontextualisieren Sie Ergebnisse. und machen Sie sich Notizen zu verschiedenen Ergebnissen mithilfe von Markdown-Zellen.

  • Halten Sie Ihre Daten auf dem neuesten Stand, indem Sie sich auf das Standardverhalten verlassen, eine Zelle und alle ihr vorausgehenden geänderten Zellen auszuführen, oder debuggen Sie Ihr Notebook, indem Sie es Zelle für Zelle ausführen.

  • Führen Sie Ihr Notebook nach einem Zeitplan aus. Siehe Ausführung des Snowflake Notebook planen.

  • Nutzen Sie die rollenbasierte Zugriffssteuerung und andere Data Governance-Funktionen, die in Snowflake verfügbar sind, um anderen Benutzern mit derselben Rolle die Ansicht des Notebooks und die Zusammenarbeit daran zu ermöglichen.

Ein Beispiel-Notebook in der Snowsight-UI

Notebook-Laufzeiten

Snowflake Notebooks bietet zwei Arten von Laufzeiten, Warehouse-Laufzeit und Container-Laufzeit. Notebooks stützen sich auf virtuelle Warehouses und/oder Snowpark Container Services-Computepools, um die Computeressourcen bereitzustellen. Bei beiden Architekturen werden SQL- und Snowpark-Abfragen immer an das Warehouse übergeben, um die Leistung zu optimieren.

Die Warehouse-Laufzeit bietet Ihnen den schnellsten Einstieg in eine vertraute, allgemein verfügbare Umgebung. Die Container-Laufzeit bietet eine flexiblere Umgebung, die viele verschiedene Arten von Workloads unterstützen kann, darunter SQL-Analysen und Data Engineering. Sie können zusätzliche Python-Pakete installieren, wenn Container Runtime nicht das enthält, was Sie standardmäßig benötigen. Container Runtime gibt es auch in CPU- und GPU-Versionen, auf denen viele beliebte ML-Pakete vorinstalliert sind, was sie ideal für ML- und Deep Learning-Workloads macht.

Die folgende Tabelle zeigt die unterstützten Features für die einzelnen Typen von Laufzeiten. Anhand dieser Tabelle können Sie entscheiden, welche Laufzeit die richtige Wahl für Ihren Anwendungsfall ist.

Unterstützte Features

Warehouse-Laufzeit

Container Runtime

Compute

Der Kernel läuft auf einem von Snowflake verwalteten Standard-Warehouse.

Kernel wird auf dem Computepool-Knoten ausgeführt;

Umgebung

Python 3.9

Python 3.10

Basisbild

Streamlit + Snowpark

Snowflake Container-Laufzeit. CPU und GPU sind mit einer Reihe von Python Bibliotheken vorinstalliert.

Zusätzliche Python-Bibliotheken

Installieren Sie mit Snowflake Anaconda oder von einem Snowflake-Stagingbereich aus.

Installieren Sie mit pip oder von einem Snowflake Stagingbereich aus.

Unterstützung bei der Bearbeitung

  • Python-, SQL- und Markdown-Zellen.

  • Referenzieren Sie Ausgaben von SQL-Zellen in Python-Zellen und umgekehrt.

  • Verwenden Sie Visualisierungsbibliotheken wie Streamlit.

Gleich wie Warehouse

Zugriff

Eigentümerschaft für den Zugriff auf und die Bearbeitung von Notebooks erforderlich

Gleich wie Warehouse

Unterstützte Notebook-Features

  • Git-Integration

  • Bearbeitung mehrerer Dateien

  • Zeitplan

Gleich wie Warehouse

Erste Schritte mit Snowflake Notebooks

Um mit Snowflake Notebooks zu experimentieren, melden Sie sich bei Snowsight an, richten Sie unter Ihr Konto für die Verwendung von Notebooks ein und wählen Sie dann Notebooks aus dem Bereich Projects aus. Es wird eine Auflistung der Notebooks angezeigt, auf die Sie über Ihr Konto Zugriff haben. Sie können entweder ein neues Notebook von Grund auf erstellen oder eine bestehende Datei .ipynb hochladen.

Die folgende Tabelle zeigt die Themen, die Ihnen beim Einstieg in Snowflake Notebooks helfen werden:

Leitfäden für den Einstieg

Snowflake Notebook einrichten

Einrichten von Snowflake Notebooks

Anweisungen für Entwickler und Administratoren vor der Verwendung von Notebook.

Snowflake Notebook erstellen

Snowflake Notebook erstellen

Erstellen eines neuen Notebooks von Grund auf oder aus einer bestehenden Datei

Code in Snowflake Notebook entwickeln und ausführen

Code in Snowflake Notebook entwickeln und ausführen

Erstellen, Bearbeiten, Ausführen von Python, SQL, Markdown-Zellen.

Entwicklerhandbücher

Benutzerhandbuch

Beschreibung

Sitzungskontext in Notebooks

Zugriff auf und Ändern des Sitzungskontexts.

Speichern von Ergebnissen in Notebooks

Speichern von Notebooks und Ergebnissen über mehrere Sitzungen hinweg.

Python-Pakete zur Verwendung in Notebooks importieren

Importieren eines Python-Pakets aus dem Anaconda-Kanal.

Daten in Notebook visualisieren und mit ihnen interagieren

Visualisieren Sie Daten mit matplotlib, plotly, altair, und entwickeln Sie eine Daten-App mit Streamlit.

Zellen- und Variablenreferenzierung in Notebook

Referenzieren der SQL-Zellenausgabe und von Python-Variablenwerten.

Tastaturkürzel für Notebooks

Nutzen Sie Tastenkombinationen zum Navigieren und zur Optimierung der Bearbeitungsprozesse.

Optimieren der Notebook-Workflows

Benutzerhandbuch

Beschreibung

Snowflake Notebooks mit Git synchronisieren

Versionskontrolle Ihres Notebooks für Zusammenarbeit und Entwicklung.

Mit Dateien im Notebook arbeiten

Verwalten und verwenden Sie Dateien in Ihrer Notebook-Umgebung.

Notebook-Ausführungen planen

Planen Sie Notebooks für die Ausführung von Code innerhalb von Snowflake.

Snowflake mit Notebooks erleben

Nutzen Sie andere Snowflake-Funktionen innerhalb von Snowflake Notebooks.

Fehler in Snowflake Notebooks beheben

Beheben von Fehlern, auf die Sie möglicherweise bei der der Verwendung von Snowflake Notebooks stoßen.

Quickstarts

Wichtige Anwendungsfälle

Informieren Sie sich auf Github über wichtige Anwendungsfälle in Data Science, Data Engineering und ML/AI.

Data Engineering mit Snowflake Notebook

Data Engineering

Entwickeln, Verwalten, Planen und Ausführen von skalierbaren Datenpipelines mit SQL und Snowpark.

Data Science mit Snowflake Notebook

Data Science

Erforschen, visualisieren und analysieren Sie Ihre Daten mit Python und SQL.

Maschinelles Lernen mit Snowflake Notebook

Machine Learning and AI

Feature Engineering, Modelltraining und Entwicklung mit Cortex und Snowpark ML.

Bemerkung

Diese werden nur als Beispiele dargestellt. Wenn Sie dem Beispiel folgen, benötigen Sie möglicherweise zusätzliche Rechte für Daten, Produkte oder Dienste von Drittanbietern, die nicht im Besitz von Snowflake sind oder von Snowflake bereitgestellt werden. Snowflake übernimmt keine Garantie für die Richtigkeit dieser Beispiele.

Zusätzliche Ressourcen

  • Demos, Tutorials und Beispiele zu Notebook finden Sie in der Sammlung von Snowflake Notebooks-Demos auf Github.

  • Tutorial-Videos finden Sie in der Snowflake Notebooks Youtube-Playlist.

  • Mehr zu den SQL-Befehlen zum Erstellen, Ausführen und Anzeigen von Notebooks finden Sie in der Snowflake Notebooks-API-Referenz.

  • Sie suchen nach Referenzarchitekturen, branchenspezifischen Anwendungsfällen und Best Practices für den Einsatz von Notebooks? All dies finden Sie im Snowflake Solution Center unter Notebooks-Beispiele.