Allgemeine Informationen zu Snowflake Notebooks¶
Snowflake Notebooks ist eine Entwicklungsoberfläche in Snowsight, die eine interaktive, zellenbasierte Programmierumgebung für Python und SQL bietet. In Snowflake Notebooks können Sie explorative Datenanalysen durchführen, Machine-Learning-Modelle entwickeln und andere Data Science- und Data Engineering-Aufgaben an einem Ort erledigen.
Erforschen und experimentieren Sie mit Daten, die sich bereits in Snowflake befinden, oder laden Sie neue Daten aus lokalen Dateien, externen Cloudspeichern oder Datenset aus Snowflake Marketplace in Snowflake hoch.
Schreiben Sie SQL- oder Python-Code und vergleichen Sie die Ergebnisse schnell mithilfe der zellenweisen Entwicklung und Ausführung.
Visualisieren Sie Ihre Daten interaktiv mit eingebetteten Streamlit-Visualisierungen und anderen Bibliotheken wie Altair, Matplotlib oder seaborn.
Kontextualisieren Sie Ergebnisse. und machen Sie sich Notizen zu verschiedenen Ergebnissen mithilfe von Markdown-Zellen.
Halten Sie Ihre Daten auf dem neuesten Stand, indem Sie sich auf das Standardverhalten verlassen, eine Zelle und alle ihr vorausgehenden geänderten Zellen auszuführen, oder debuggen Sie Ihr Notebook, indem Sie es Zelle für Zelle ausführen.
Führen Sie Ihr Notebook nach einem Zeitplan aus. Siehe Ausführung des Snowflake Notebook planen.
Nutzen Sie die rollenbasierte Zugriffssteuerung und andere Data Governance-Funktionen, die in Snowflake verfügbar sind, um anderen Benutzern mit derselben Rolle die Ansicht des Notebooks und die Zusammenarbeit daran zu ermöglichen.
Notebook-Laufzeiten¶
Snowflake Notebooks bietet zwei Arten von Laufzeiten, Warehouse-Laufzeit und Container-Laufzeit. Notebooks stützen sich auf virtuelle Warehouses und/oder Snowpark Container Services-Computepools, um die Computeressourcen bereitzustellen. Bei beiden Architekturen werden SQL- und Snowpark-Abfragen immer an das Warehouse übergeben, um die Leistung zu optimieren.
Die Warehouse-Laufzeit bietet Ihnen den schnellsten Einstieg in eine vertraute, allgemein verfügbare Umgebung. Die Container-Laufzeit bietet eine flexiblere Umgebung, die viele verschiedene Arten von Workloads unterstützen kann, darunter SQL-Analysen und Data Engineering. Sie können zusätzliche Python-Pakete installieren, wenn Container Runtime nicht das enthält, was Sie standardmäßig benötigen. Container Runtime gibt es auch in CPU- und GPU-Versionen, auf denen viele beliebte ML-Pakete vorinstalliert sind, was sie ideal für ML- und Deep Learning-Workloads macht.
Die folgende Tabelle zeigt die unterstützten Features für die einzelnen Typen von Laufzeiten. Anhand dieser Tabelle können Sie entscheiden, welche Laufzeit die richtige Wahl für Ihren Anwendungsfall ist.
Unterstützte Features |
Warehouse-Laufzeit |
Container Runtime |
---|---|---|
Compute |
Der Kernel läuft auf einem von Snowflake verwalteten Standard-Warehouse. |
Kernel wird auf dem Computepool-Knoten ausgeführt; |
Umgebung |
Python 3.9 |
Python 3.10 |
Basisbild |
Streamlit + Snowpark |
Snowflake Container-Laufzeit. CPU und GPU sind mit einer Reihe von Python Bibliotheken vorinstalliert. |
Zusätzliche Python-Bibliotheken |
Installieren Sie mit Snowflake Anaconda oder von einem Snowflake-Stagingbereich aus. |
Installieren Sie mit |
Unterstützung bei der Bearbeitung |
|
Gleich wie Warehouse |
Zugriff |
Eigentümerschaft für den Zugriff auf und die Bearbeitung von Notebooks erforderlich |
Gleich wie Warehouse |
Unterstützte Notebook-Features |
|
Gleich wie Warehouse |
Erste Schritte mit Snowflake Notebooks¶
Um mit Snowflake Notebooks zu experimentieren, melden Sie sich bei Snowsight an, richten Sie unter Ihr Konto für die Verwendung von Notebooks ein und wählen Sie dann Notebooks aus dem Bereich Projects aus. Es wird eine Auflistung der Notebooks angezeigt, auf die Sie über Ihr Konto Zugriff haben. Sie können entweder ein neues Notebook von Grund auf erstellen oder eine bestehende Datei .ipynb
hochladen.
Die folgende Tabelle zeigt die Themen, die Ihnen beim Einstieg in Snowflake Notebooks helfen werden:
Leitfäden für den Einstieg |
|
---|---|
Einrichten von Snowflake Notebooks Anweisungen für Entwickler und Administratoren vor der Verwendung von Notebook. |
|
Erstellen eines neuen Notebooks von Grund auf oder aus einer bestehenden Datei |
|
Code in Snowflake Notebook entwickeln und ausführen Erstellen, Bearbeiten, Ausführen von Python, SQL, Markdown-Zellen. |
Entwicklerhandbücher¶
Benutzerhandbuch |
Beschreibung |
---|---|
Zugriff auf und Ändern des Sitzungskontexts. |
|
Speichern von Notebooks und Ergebnissen über mehrere Sitzungen hinweg. |
|
Importieren eines Python-Pakets aus dem Anaconda-Kanal. |
|
Visualisieren Sie Daten mit matplotlib, plotly, altair, und entwickeln Sie eine Daten-App mit Streamlit. |
|
Referenzieren der SQL-Zellenausgabe und von Python-Variablenwerten. |
|
Nutzen Sie Tastenkombinationen zum Navigieren und zur Optimierung der Bearbeitungsprozesse. |
Optimieren der Notebook-Workflows¶
Benutzerhandbuch |
Beschreibung |
---|---|
Versionskontrolle Ihres Notebooks für Zusammenarbeit und Entwicklung. |
|
Verwalten und verwenden Sie Dateien in Ihrer Notebook-Umgebung. |
|
Planen Sie Notebooks für die Ausführung von Code innerhalb von Snowflake. |
|
Nutzen Sie andere Snowflake-Funktionen innerhalb von Snowflake Notebooks. |
|
Beheben von Fehlern, auf die Sie möglicherweise bei der der Verwendung von Snowflake Notebooks stoßen. |
Quickstarts¶
Erste Schritte mit Ihrem ersten Snowflake Notebook [Video] [Quelle]
Lernen Sie, wie Sie in weniger als 10 Minuten mit Ihrem ersten Notebook-Projekt beginnen können.
Visuelle Daten-Storys mit Snowflake Notebooks [Video] [Quelle]
Lernen Sie, wie Sie mit Visualisierungen, Markdown, Bildern und interaktiven Daten-Apps in Ihrem Notebook neben Ihrem Code und Ihren Daten überzeugende Daten-Storys erstellen können.
Wichtige Anwendungsfälle¶
Informieren Sie sich auf Github über wichtige Anwendungsfälle in Data Science, Data Engineering und ML/AI.
Entwickeln, Verwalten, Planen und Ausführen von skalierbaren Datenpipelines mit SQL und Snowpark. |
|
Erforschen, visualisieren und analysieren Sie Ihre Daten mit Python und SQL. |
|
Feature Engineering, Modelltraining und Entwicklung mit Cortex und Snowpark ML. |
Bemerkung
Diese werden nur als Beispiele dargestellt. Wenn Sie dem Beispiel folgen, benötigen Sie möglicherweise zusätzliche Rechte für Daten, Produkte oder Dienste von Drittanbietern, die nicht im Besitz von Snowflake sind oder von Snowflake bereitgestellt werden. Snowflake übernimmt keine Garantie für die Richtigkeit dieser Beispiele.
Zusätzliche Ressourcen¶
Demos, Tutorials und Beispiele zu Notebook finden Sie in der Sammlung von Snowflake Notebooks-Demos auf Github.
Tutorial-Videos finden Sie in der Snowflake Notebooks Youtube-Playlist.
Mehr zu den SQL-Befehlen zum Erstellen, Ausführen und Anzeigen von Notebooks finden Sie in der Snowflake Notebooks-API-Referenz.
Sie suchen nach Referenzarchitekturen, branchenspezifischen Anwendungsfällen und Best Practices für den Einsatz von Notebooks? All dies finden Sie im Snowflake Solution Center unter Notebooks-Beispiele.