Snowpark Migration Accelerator: Anleitung zur Einrichtung¶
Dieser Leitfaden beschreibt praktische Erfahrungen mit dem Snowpark Migration Accelerator (SMA). Anhand von Beispielen aus der Praxis lernen Sie, wie man Code auswertet und Bewertungsergebnisse interpretiert, so dass Sie ein klares Verständnis für die Möglichkeiten des Tools erhalten.
Materialien¶
Um dieses Tutorial durchzuführen, benötigen Sie Folgendes:
Einen Computer, auf dem die Software Snowpark Migration Accelerator (SMA) installiert ist
Zugriff auf die Beispielcodedateien auf demselben Computer
Um zu beginnen, benötigen Sie zwei Dinge auf Ihrem Computer:
Das Tool Snowpark Migration Accelerator (SMA)
Codebeispiele
Wir zeigen Ihnen, wie Sie diese wichtigen Ressourcen erhalten.
SMA-Anwendung¶
Der Snowpark Migration Accelerator (SMA) hilft Entwicklern bei der Konvertierung ihrer PySpark und Spark Scala-Anwendungen für die Ausführung auf Snowflake. Es erkennt automatisch die Aufrufe von Spark API in Ihrem Python- oder Scala-Code und wandelt sie in entsprechende Snowpark API-Aufrufe um. Dieser Leitfaden demonstriert die grundlegenden Funktionen von SMA, indem er Beispielcode von Spark analysiert und zeigt, wie er bei Migrationsprojekten hilft.
In der ersten Bewertungsphase untersucht Snowpark Migration Accelerator (SMA) Ihren Quellcode und erstellt ein detailliertes Modell, das alle Funktionen in Ihrem Code erfasst. Auf der Grundlage dieser Analyse erstellt SMA mehrere Berichte, einschließlich eines detaillierten Bewertungsberichts, den wir in dieser Anleitung besprechen werden. Diese Berichte helfen Ihnen zu verstehen, wie bereit Ihr Code für die Migration zu Snowpark ist und wie viel Aufwand für den Übergang erforderlich ist. Wir werden uns diese Ergebnisse im weiteren Verlauf dieser praktischen Übungen genauer ansehen.
Download und Installation¶
To begin an assessment with the Snowpark Migration Accelerator (SMA), you only need to complete the installation process. While Snowflake provides optional helpful training on using the SMA, you can proceed without it. No special access codes are needed. Simply:
Visit our Download and Access section
Follow our Installation instructions to set up the application on your computer
Beispielcodebasis¶
Dieser Leitfaden verwendet Python-Codebeispiele, um den Migrationsprozess zu demonstrieren. Wir haben zwei öffentlich verfügbare Beispielcodebasen aus Git-Repositorys von Drittanbietern als unverzerrte, praxisnahe Beispiele ausgewählt. Sie können auf diese Codebasen zugreifen unter:
PySpark Data Engineering Examples: https://github.com/spark-examples/pyspark-examples
Apache Spark Machine Learning Examples: https://github.com/apache/spark/tree/master/examples/src/main/python
Um Codebasen mit dem Snowpark Migration Accelerator (SMA) zu analysieren, gehen Sie wie folgt vor:
Download the codebases as zip files from GitHub. You can find instructions on how to do this in the GitHub documentation.
Legen Sie für jede Codebasis einen eigenen Ordner auf Ihrem Computer an.
Entpacken Sie jede Zip-Datei in den entsprechenden Ordner, wie in der Abbildung unten gezeigt:
These sample codebases demonstrate how SMA evaluates Spark API references to calculate the Spark API Readiness Score. Let’s look at two scenarios:
Eine Codebasis, die eine hohe Bewertung erhalten hat, was bedeutet, dass sie in hohem Maße mit Snowpark kompatibel und bereit für die Migration ist
Eine Codebasis, die eine niedrige Bewertung erhalten hat, was bedeutet, dass sie vor der Migration zusätzlich überprüft und möglicherweise geändert werden muss
Die Bereitschaftsbewertung bietet zwar wertvolle Einblicke, sollte aber nicht der einzige Faktor sein, der bei der Planung einer Migration berücksichtigt wird. Eine umfassende Beurteilung aller Aspekte ist sowohl hinsiichtlich einer hohen als auch niedrigen Bewertung erforderlich, um eine erfolgreiche Migration zu gewährleisten.
After unzipping the directories, SMA will analyze only files that use supported code formats and notebook formats. These files are checked for references to Spark API and other Third Party APIs. To see which file types are supported, please check the list here.
Im weiteren Verlauf dieser Anleitung werden wir analysieren, wie diese beiden Codebasen ausgeführt werden.
Unterstützung¶
For help with installation or to get access to the code, please email sma-support@snowflake.com.
Nachdem Sie die Codebasen heruntergeladen und in separate Verzeichnisse entpackt haben, können Sie entweder:
Move on to running the tool
Review the code preparation notes