Snowpark Migration Accelerator: Validierung

Um mit dem Validierungsprozess fortzufahren, führen Sie die folgenden Schritte aus:

  1. Copy the snowpark-checkpoints-output folder, generated during the collection process, into the validation workload.

    Kopieren der Ausgabe des Erfassungsprozesses in den Validierungs-Workload
  2. Öffnen Sie den Workload für die Validierung in VS Code, um den Validierungsprozess zu starten.

    Validierungs-Workload
  3. Generate checkpoints using the checkpoints.json file.

Um Checkpoints zu generieren, können Sie eine der folgenden Aktionen durchführen:

  • Generieren Sie diese, indem Sie die vorgeschlagene Meldung akzeptieren:

Meldung „Gefundene Checkpoints laden“
  • Ausführung des Befehls „Snowflake: Alle Checkpoints laden“

Befehl „Alle Checkpoints laden“

Sobald alle Checkpoints geladen sind, sollten Ihre Dateien wie folgt aussehen:

Datei mit Checkpoints
  1. Führen Sie die Python-Datei aus, um den Checkpoints-Validierungsprozess auszuführen.

When running a python file that contains validation checkpoints, the validation results are going to be shown in the copied „snowpark-checkpoints-output“ folder as „checkpoints_validation_results.json“:

Ergebnisse

The „checkpoints_validation_results.json“ contains the unified results of the collection process

{
    "results": [
        {
            "checkpoint_name": "sample$BBVOC7$df1$1",
            "file": "sample.py",
            "line_of_code": 10,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:29.248917"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df2$1",
            "file": "sample.py",
            "line_of_code": 12,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:31.137536"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df3$1",
            "file": "sample.py",
            "line_of_code": 17,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:33.133002"
        }
    ]
}

Die Validierungsergebnisse, wie oben gezeigt, enthalten das Vergleichsergebnis zwischen den PySpark- und Snowpark-DataFrames.