Allgemeine Informationen zu Snowflake Notebooks

Snowflake Notebooks ist eine einheitliche Entwicklungsoberfläche in Snowsight, die eine interaktive, zellenbasierte Programmierumgebung für Python, SQL und Markdown bietet. In Notebooks können Sie Ihre Snowflake-Daten nutzen, um explorative Datenanalysen durchzuführen, Modelle für maschinelles Lernen zu entwickeln und andere Data Science- und Data-Engineering-Workflows durchzuführen – und das alles über dieselbe Weboberfläche.

  • Erforschen und experimentieren Sie mit Daten, die sich bereits in Snowflake befinden, oder laden Sie neue Daten aus lokalen Dateien, externen Cloudspeichern oder Datenset aus Snowflake Marketplace in Snowflake hoch.

  • Schreiben Sie SQL- oder Python-Code und vergleichen Sie die Ergebnisse schnell mithilfe der zellenweisen Entwicklung und Ausführung.

  • Visualisieren Sie Ihre Daten interaktiv mit eingebetteten Streamlit-Visualisierungen und anderen Bibliotheken wie Altair, Matplotlib oder seaborn.

  • Integrieren Sie Git für die Zusammenarbeit mit effektiver Versionskontrolle. Siehe Synchronisierung von Notebooks mit einem Git-Repository.

  • Kontextualisieren Sie Ergebnisse, und machen Sie sich Notizen zu verschiedenen Ergebnissen mit Markdown-Zellen und Diagrammen.

  • Führen Sie Ihr Notebook nach einem Zeitplan aus, um Pipelines zu automatisieren. Siehe Notebook-Ausführungen planen.

  • Nutzen Sie die rollenbasierte Zugriffssteuerung und andere Data Governance-Funktionen, die in Snowflake verfügbar sind, um anderen Benutzern mit derselben Rolle die Ansicht des Notebooks und die Zusammenarbeit daran zu ermöglichen.

  • Erstellen Sie ein privates Notebook in Ihrer persönlichen Datenbank, in dem Sie interaktiv Code entwickeln und mit Produktionsdaten experimentieren können. Siehe Private Notebooks.

Ein Beispiel-Notebook in der Snowsight-UI

Notebook-Laufzeiten

Snowflake Notebooks bieten zwei verschiedene Laufzeiten, die jeweils für bestimmte Workloads konzipiert sind: Warehouse Runtime und Container Runtime. Notebooks nutzen Computeressource entweder aus virtuellen Warehouses (für Warehouse Runtime) oder aus Snowpark Container Services Computepools (für Container Runtime), um Ihren Code auszuführen. Für beide Laufzeiten werden die Abfragen von SQL und Snowpark immer nach unten verschoben, um sie im Warehouse auszuführen und so die Leistung zu optimieren.

Die Warehouse Runtime bietet den schnellsten Einstieg mit einer vertrauten und allgemein verfügbaren Warehouse-Umgebung. Die Container Runtime bietet eine flexiblere Umgebung, die viele verschiedene Arten von Workloads unterstützen kann, darunter SQL-Analysen und Data-Engineering. Sie können zusätzliche Python-Pakete installieren, wenn die Container Runtime nicht das enthält, was Sie standardmäßig benötigen. Die Container-Laufzeit ist auch in den Versionen CPU und GPU erhältlich, auf denen viele beliebte ML-Pakete vorinstalliert sind, was sie ideal für ML und Deep Learning Workloads macht.

Die folgende Tabelle zeigt die unterstützten Features für die einzelnen Typen von Laufzeiten. Anhand dieser Tabelle können Sie entscheiden, welche Laufzeit die richtige Wahl für Ihren Anwendungsfall ist.

Unterstützte Features

Warehouse-Laufzeit

Container Runtime

Compute

Der Kernel läuft auf dem Notebook-Warehouse.

Der Kernel läuft auf einem Computepool-Knoten.

Umgebung

Python 3.9

Python 3.10

Basisbild

Streamlit + Snowpark

Snowflake Container Runtime (CPU- und GPU-Images mit vorinstallierten Python-Bibliotheken).

Zusätzliche Python-Bibliotheken

Installieren Sie mit Snowflake Anaconda oder von einem Snowflake-Stagingbereich aus.

Installieren Sie mit pip, conda oder von einem Snowflake Stagingbereich aus. | Falls erforderlich, geben Sie eine bestimmte Paketversion an.

Unterstützung bei der Bearbeitung

Python, SQL, und Markdown-Zellen. | Reference outputs from SQL cells in Python cells and vice versa. | Verwenden Sie Visualisierungsbibliotheken wie Streamlit.

Gleich wie Warehouse

Zugriff

Eigentümerschaft für den Zugriff auf und die Bearbeitung von Notebooks erforderlich

Gleich wie Warehouse

Unterstützte Notebook-Features (noch in der Vorschau)

Git-Integration (Vorschau) | Zeitplanung (Vorschau)

Gleich wie Warehouse

Einzelheiten zum Erstellen, Ausführen und Verwalten von Notebooks auf Container Runtime finden Sie unter Notebooks auf Container Runtime für ML.

Notebooks untersuchen

Die Symbolleiste Snowflake Notebooks enthält die Steuerelemente zur Verwaltung des Notebooks und zur Anpassung der Einstellungen für die Zellenanzeige.

Kontrollieren

Beschreibung

../../_images/ui-notebooks-packages.png

Package selector: Wählen und installieren Sie Pakete für die Verwendung im Notebook. Siehe Importieren Sie Python-Pakete zur Verwendung in Notebooks.

../../_images/ui-notebooks-start.png

Start: Starten Sie die Notebooks-Sitzung. Wenn die Sitzung beginnt, wechselt das Bild zu Active.

../../_images/ui-notebooks-active.png

Active: Bewegen Sie den Mauszeiger über die Schaltfläche, um Sitzungsdetails und aggregierte Metriken zum Ressourcenverbrauch in Echtzeit anzuzeigen (für Container Runtime Notebooks werden Metriken zur Speichernutzung und CPU/GPU angezeigt). Wählen Sie den Pfeil nach unten, um die Optionen zum Neustarten oder Beenden der Sitzung aufzurufen. Wählen Sie Active, um die aktuelle Sitzung zu beenden.

../../_images/ui-notebooks-run-all.png

Run All/Stop: Alle Zellen ausführen oder die Ausführung der Zellen stoppen. Siehe Zellen in Snowflake Notebooks ausführen.

../../_images/ui-notebooks-scheduler.png

Scheduler: Legen Sie einen Zeitplan fest, um Ihr Notebook in der Zukunft als Aufgabe auszuführen. Siehe Notebook-Ausführungen planen.

../../_images/ui-notebooks-ellipsis.png

Vertical ellipsis menu: Passen Sie die Einstellungen des Notebooks an, löschen Sie Zellausgaben, duplizieren, exportieren oder löschen Sie das Notebook.

Zellen in einem Notebook ausblenden

Sie können den Code in einer Zelle ausblenden, um nur die Ausgabe anzuzeigen. Blenden Sie zum Beispiel eine Python-Zelle aus, um nur die von Ihrem Code erzeugten Visualisierungen anzuzeigen, oder klappen Sie eine SQL-Zelle aus, um nur die Ergebnistabelle anzuzeigen.

  • Um zu ändern, was sichtbar ist, wählen Sie Collapse results.

    Die Dropdown-Liste bietet Optionen zum Ausblenden bestimmter Teile der Zelle.

    Zellen ein- und ausklappen.