Snowpark Migration Accelerator: Validação

Para prosseguir com o processo de validação, siga os passos descritos abaixo:

  1. Copy the snowpark-checkpoints-output folder, generated during the collection process, into the validation workload.

    Cópia da saída do processo de coleção para a carga de trabalho de validação
  2. Abra a carga de trabalho de validação no VS Code para iniciar o processo de validação.

    Carga de trabalho de validação
  3. Generate checkpoints using the checkpoints.json file.

Para gerar pontos de verificação, realize uma das seguintes ações:

  • Gere-os aceitando a mensagem sugerida:

Mensagem Carregar pontos de verificação encontrados
  • Execute o comando “Snowflake: Load All Checkpoints»:

Comando Load All Checkpoints

Após o carregamento de todos os pontos de verificação, seus arquivos devem aparecer da seguinte forma:

Arquivo com pontos de verificação
  1. Execute o arquivo Python para executar o processo de validação dos pontos de verificação.

When running a python file that contains validation checkpoints, the validation results are going to be shown in the copied «snowpark-checkpoints-output» folder as «checkpoints_validation_results.json»:

Resultados

The «checkpoints_validation_results.json» contains the unified results of the collection process

{
    "results": [
        {
            "checkpoint_name": "sample$BBVOC7$df1$1",
            "file": "sample.py",
            "line_of_code": 10,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:29.248917"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df2$1",
            "file": "sample.py",
            "line_of_code": 12,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:31.137536"
        },
        {
            "checkpoint_name": "sample$BBVOC7$df3$1",
            "file": "sample.py",
            "line_of_code": 17,
            "result": "PASS",
            "timestamp": "2025-05-05T15:32:33.133002"
        }
    ]
}

Os resultados da validação, como visto acima, conterão o resultado da comparação entre o PySpark e o Snowpark DataFrames.