Snowpark Migration Accelerator: Installationsanleitung für die Interactive Assessment Application

Dieser Abschnitt führt Sie durch die Bereitstellung der Interactive Assessment Application (IAA) in Ihrem Snowflake-Konto. Die IAA ist eine Streamlit-App, die die Leistungsfähigkeit von Snowflake innerhalb von Snowflake nutzt, um die Ausgabedaten des Snowpark Migration Accelerators (SMA) zu analysieren. Dieses Dokument beschreibt die notwendigen Schritte und Ressourcen, um Ihren Workload innerhalb Ihrer Snowflake-Umgebung mit der IAA zu analysieren.

Schritt-für-Schritt-Anleitung

Stellen Sie vor der Bereitstellung der IAA sicher, dass Sie die folgenden Voraussetzungen erfüllen:

  • Sie haben den SMA ausgeführt, und die Ausgabedaten sind für die Analyse bereit.

  • Sie verfügen über ein Snowflake-Konto. (Dies ist erforderlich, um die IAA zu hosten und auszuführen.) Wenn nicht, funktioniert ein Snowflake-Testkonto.

  • Sie haben VSCode oder Jupyter installiert, um das Notebook: VSCode oder Jupyter auszuführen.

  • Stellen Sie sicher, dass Sie Python 3.11 oder höher installiert haben. Diese Version ist für die Kompatibilität mit dem IAA-Notebook erforderlich.

    • Möglicherweise haben Sie Python bereits auf Ihrem System installiert. Wenn nicht, wählen Sie eine der folgenden Optionen aus.

Das Hochladen der gesamten Zuordnungstabelle kann länger dauern als nur das Auswählen der neuesten Version. Wir empfehlen, die neueste Version hochzuladen, wenn Sie nicht daran interessiert sind, Ihre Ausführung mit früheren Versionen zu vergleichen

In VS Code können Sie den „Map“-Ordner auswählen, der alle Ordner mit den APIs- und EWIs-Versionen enthält. Löschen Sie anschließend die, die Sie nicht hochladen möchten. In diesem Fall können Sie es bei der Version 7.1.2 belassen bleiben.

Verfügbare Zuordnungen zum Hochladen

Sobald Sie die Überprüfung der Voraussetzungen abgeschlossen haben, fahren Sie mit der Bereitstellung fort.

Lassen Sie uns die IAA bereitstellen.

Bemerkung

Diese Schritt-für-Schritt-Anleitung gilt für VS Code

Repository

  1. Wechseln Sie zur Open-Source-GitHub von Snowflake Labs: https://github.com/Snowflake-Labs/IAA-Support.

  2. Klicken Sie auf die Schaltfläche „Code“, und kopieren Sie Ihre bevorzugte Methode zum Klonen des Repositorys (z. B. HTTPS oder SSH)

  3. Wählen Sie ggf. das Verzeichnis auf Ihrem lokalen Computer aus, in dem Sie das Repository speichern möchten

Ausführen des Notebooks in VS Code

Bemerkung

Hinweis: Dieser Bereitstellungsprozess verwendet die Snowflake CLI.

  1. Öffnen Sie das heruntergeladene Repository in der VSCode-Umgebung.

  2. Klicken Sie in VS Code auf Yes, I trust the authors

Datei „iaa_config.toml“

Teil 1: Abrufen von Anmeldeinformationen für „Connect a tool to Snowflake“

  1. Klicken Sie in Ihrem Snowflake-Konto unten links auf Ihre Initialen.

  2. Wählen Sie „Connect a tool to Snowflake“ aus.

  3. Öffnen Sie die Datei iaa\_config.toml.

  4. Kopieren Sie die folgenden Informationen aus dem Fenster „Connect a tool to Snowflake“, und fügen Sie sie in die Datei iaa\_config.toml\ ein.

    1. Kontobezeichner

    2. User Name (Benutzername)

Teil 2: Bereitstellen von zusätzlichen Details

In der Datei `iaa_config.toml` sind außerdem die folgenden Informationen enthalten:

  1. Kennwort: Geben Sie Ihr Snowflake-Kennwort ein.

  2. Datenbankname: Geben Sie den Namen der Datenbank ein, die Sie für die IAA verwenden möchten.

  3. Schemaname: Geben Sie den Namen des Schemas ein, das Sie für die IAA verwenden möchten.

  4. Name des Warehouses: Geben Sie den Namen des Warehouses ein, das in Ihrem Snowflake-Konto ausgeführt wird.

Speichern Sie die Änderungen in der Datei `iaa_config.toml`.

Warnung

Warnung: Die Zelle, die die Verbindungseinträge validiert, kann fehlschlagen, wenn die .toml-Informationen falsch sind. Überprüfen Sie in diesem Fall die Eingabeinformationen.

Kernel

Damit die Datei „.ipynb“ ausgeführt wird, müssen Sie die Python- und Jupyter-Erweiterungen in VS Code installieren.

  1. Wählen Sie die Python-Umgebung aus, die der für die Ausführung des Notebooks erforderlichen Version entspricht. (3.11 oder höher).

Ausführen des Notebooks

Um die App in Ihrem Snowflake-Konto bereitzustellen, wählen Sie „Run all the cells“ aus.

Diese Zellen konfigurieren automatisch die lokale Umgebung und stellen die Verbindung zu Ihrem Snowflake-Konto her, um die Bereitstellung der Streamlit-App vorzubereiten. Insbesondere wird für diese Zellen Folgendes ausgeführt:

  1. Überprüfung der Python 3.11-Anforderung

  2. Überprüfung der Snowflake CLI-Anforderung

  3. Ausführung der Datei „iaa_config.toml“, um eine Verbindung mit der Snowflake-Kontokonfiguration herzustellen:

    1. Lesen der lokalen Datei „.toml“

    2. Validieren der Verbindungseinträge

    3. Herstellen einer Verbindung mit Snowflake

  4. Vorbereitung der Umgebung, um die Streamlit-App in Snowflake bereitzustellen

    1. Konfigurieren der lokalen Umgebung

    2. Abrufen von Verbindungseinträgen

  5. Bereitstellung der Streamlit-App in Snowflake mithilfe der Snowflake CLI:

    1. Bereitstellen des App-Schemas in SiS

    2. Bereitstellen des Stagingbereichs der Zuordnung in SiS

    3. Bereitstellen der APP in SiS

    4. Aktualisieren der Bereitstellung

    5. Abrufen der App-Informationen und Bereitstellen einer Zugriffsschaltfläche

    \ Das ist alles! Es ist an der Zeit, Ihre Ausgabe hochzuladen.

Es ist an der Zeit, Ihre SMA-Ausgabe hochzuladen.

Suchen Sie die ZIP-Datei für die SMA-Ausgabe, benannt im Format „AssessmentFiles_*.zip“ im Ausgabeordner.

  1. Wechseln Sie zu Ihrem Snowflake-Konto.

Data > Databases > [Your IAA Database] > Stages > SMA_EXECUTIONS
Copy

SMA_EXECUTIONS-Stagingbereich in Ihrem Snowflake-Konto.

  1. Laden Sie die Datei „AssessmentFiles.zip“ hoch.

Hochladen der SMA-Ausgabe in den SMA_EXECUTIONS-Stagingbereich

  1. Öffnen Sie die IAA, um Ihre Ausführungsinformationen zu überprüfen. Dieser Schritt kann etwa 30 Sekunden dauern.

IAA

  1. Sobald Sie die IAA geöffnet haben, sieht die Landing Page wie folgt aus:

IAA Landing Page

Jetzt können Sie Ihre Ausführung mithilfe der IAA überprüfen.

Erkunden der IAA

Die Interactive Assessment Application (IAA) ist jetzt in Ihrem Snowflake-Konto installiert. Sie haben Ihre SMA-Ausgabeausführungen erfolgreich hochgeladen und sind bereit, die Kompatibilität Ihres Spark-Codes mit Snowpark zu überprüfen.

Bemerkung

Denken Sie daran, wie Sie auf die IAA in Ihrem Snowflake-Konto zugreifen können:

Projekte > Streamlit > Interactive Assessment Application

Mit der IAA können Sie feststellen, welche Teile Ihres Codes direkt kompatibel sind und welche Teile ein manuelles Eingreifen oder eine weitere Optimierung erfordern. Es wird empfohlen, die neueste SMA-Version zu verwenden. Wenn Sie jedoch ältere Ausführungen haben, vergleicht die IAA sie mit den neuesten API-Zuordnungsversionen.