Snowpark Migration Accelerator: Validierung

Um mit dem Validierungsprozess fortzufahren, führen Sie die folgenden Schritte aus:

  1. Kopieren Sie den Ordner snowpark-checkpoints-output, der während des Erfassungsprozesses generiert wurde, in den Validierungs-Workload.

    Kopieren der Ausgabe des Erfassungsprozesses in den Validierungs-Workload

  2. Öffnen Sie den Workload für die Validierung in VS Code, um den Validierungsprozess zu starten.

    Validierungs-Workload

  3. Generieren Sie Checkpoints mit der Datei checkpoints.json.

Um Checkpoints zu generieren, können Sie eine der folgenden Aktionen durchführen:

  • Generieren Sie diese, indem Sie die vorgeschlagene Meldung akzeptieren:

Meldung „Gefundene Checkpoints laden“

  • Ausführung des Befehls „Snowflake: Alle Checkpoints laden“

Befehl „Alle Checkpoints laden“

Sobald alle Checkpoints geladen sind, sollten Ihre Dateien wie folgt aussehen:

Datei mit Checkpoints

  1. Führen Sie die Python-Datei aus, um den Checkpoints-Validierungsprozess auszuführen.

Wenn Sie eine Python-Datei ausführen, die Validierungs-Checkpoints enthält, werden die Validierungsergebnisse im kopierten Ordner „snowpark-checkpoints-output“ als „checkpoints_validation_results.json“ angezeigt:

Ergebnisse

Die Datei „checkpoints_validation_results.json“ enthält die vereinheitlichten Ergebnisse des Sammlungsprozesses

{
    "results": [
        {
            "checkpoint_name": "sample$BBVOC7$df1$1",
            "file": "sample.py",
            "line_of_code": 10,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:29.248917"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df2$1",
            "file": "sample.py",
            "line_of_code": 12,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:31.137536"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df3$1",
            "file": "sample.py",
            "line_of_code": 17,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:33.133002"
        }
    ]
}
Copy

Die Validierungsergebnisse, wie oben gezeigt, enthalten das Vergleichsergebnis zwischen den PySpark- und Snowpark-DataFrames.