Snowpark Migration Accelerator: Validierung¶
Um mit dem Validierungsprozess fortzufahren, führen Sie die folgenden Schritte aus:
Kopieren Sie den Ordner
snowpark-checkpoints-output, der während des Erfassungsprozesses generiert wurde, in den Validierungs-Workload.
Öffnen Sie den Workload für die Validierung in VS Code, um den Validierungsprozess zu starten.

Generieren Sie Checkpoints mit der Datei
checkpoints.json.
Um Checkpoints zu generieren, können Sie eine der folgenden Aktionen durchführen:
Generieren Sie diese, indem Sie die vorgeschlagene Meldung akzeptieren:

Ausführung des Befehls „Snowflake: Alle Checkpoints laden“

Sobald alle Checkpoints geladen sind, sollten Ihre Dateien wie folgt aussehen:

Führen Sie die Python-Datei aus, um den Checkpoints-Validierungsprozess auszuführen.
Wenn Sie eine Python-Datei ausführen, die Validierungs-Checkpoints enthält, werden die Validierungsergebnisse im kopierten Ordner „snowpark-checkpoints-output“ als „checkpoints_validation_results.json“ angezeigt:

Die Datei „checkpoints_validation_results.json“ enthält die vereinheitlichten Ergebnisse des Sammlungsprozesses
{
"results": [
{
"checkpoint_name": "sample$BBVOC7$df1$1",
"file": "sample.py",
"line_of_code": 10,
"result": "PASS",
"timestamp": "2025-05-05T15:32:29.248917"
},
{
"checkpoint_name": "sample$BBVOC7$df2$1",
"file": "sample.py",
"line_of_code": 12,
"result": "PASS",
"timestamp": "2025-05-05T15:32:31.137536"
},
{
"checkpoint_name": "sample$BBVOC7$df3$1",
"file": "sample.py",
"line_of_code": 17,
"result": "PASS",
"timestamp": "2025-05-05T15:32:33.133002"
}
]
}
Die Validierungsergebnisse, wie oben gezeigt, enthalten das Vergleichsergebnis zwischen den PySpark- und Snowpark-DataFrames.