Snowpark Migration Accelerator: Inventários genéricos

Quando o Snowpark Migration Accelerator (SMA) analisa seu código, ele executa dois tipos de varreduras:

  1. Uma varredura específica da linguagem que analisa o código em sua linguagem de programação de origem

  2. Uma varredura de uso geral que coleta informações básicas sobre arquivos e palavras-chave em sua base de código

É possível encontrar detalhes sobre os resultados da verificação específica do idioma na seção de Inventários do SMA. Esta página descreve as informações coletadas pela varredura de uso geral.

Observe que, embora alguns arquivos tenham a extensão .pam, eles são, na verdade, arquivos separados por vírgulas, semelhantes aos arquivos .csv. Você pode notar entradas duplicadas nesses arquivos porque os dados foram organizados de maneiras diferentes para facilitar vários tipos de análise.

Resumo do arquivo

O files.pam contém um inventário que lista todos os arquivos processados durante a execução de uma ferramenta. Para cada arquivo, ele registra o tipo e o tamanho do arquivo. Esse arquivo contém as mesmas informações que o files.csv descrito na seção de Inventários do SMA.

Inventário genérico de arquivos

O arquivo FilesInventory.csv contém detalhes de categorização e contagens de linhas para cada arquivo de origem.

  • Filename: O caminho completo e o nome do arquivo do diretório de entrada raiz

  • Extension: A extensão do tipo de arquivo (por exemplo, .java, .py, .sql)

  • Technology: A linguagem de programação ou tecnologia identificada com base na extensão do arquivo

  • Status: Sempre mostra «OK» para arquivos identificados (arquivos não identificados não são listados)

  • isBinary: Indica se o arquivo é binário (TRUE), texto (FALSE) ou não reconhecido (UNKNOWN)

  • Bytes: Tamanho do arquivo em bytes

  • ContentType: Categoriza cada linha como:

    • Código: Instruções de programação

    • Comentários: Documentação ou notas

    • Em branco: Linhas vazias

    • Outros: Conteúdo não reconhecido

  • ContentLines: Número total de linhas de código no arquivo

  • CommentLines: Número total de linhas de comentário no arquivo

  • BlankLines: Número total de linhas vazias no arquivo

Contagens de palavras-chave

O arquivo KeywordCounts.csv fornece uma lista abrangente de todas as palavras-chave detectadas em cada arquivo, organizadas por tipo de tecnologia. Essa análise inclui palavras-chave de qualquer linguagem de programação que nosso scanner genérico possa processar, não apenas as linguagens de origem oficialmente compatíveis com o Snowpark Migration Accelerator (SMA).

  • FileId: O caminho do arquivo onde a palavra-chave estava localizada

  • Technology: A tecnologia original usada no arquivo de origem

  • Keyword: A palavra-chave específica encontrada (exemplos: from, import, DataFrame)

  • Contagem: O número de ocorrências da palavra-chave em cada linha

Inventário de linhas

O arquivo line_counts.pam analisa cada linha em um arquivo verificado e as categoriza como código, comentários ou linhas em branco. Ele também fornece uma contagem total para cada categoria.

  • FileId: O nome do arquivo que está sendo analisado

  • LineKind: A categoria de cada linha do arquivo (pode ser código, comentário ou espaço em branco)

  • Contagem: Número total de linhas para cada combinação de FileId e LineKind

Inventário de execução de ferramentas

O arquivo tool_execution.pam contém informações essenciais sobre a execução atual da ferramenta SMA. Esse arquivo é idêntico ao arquivo tool_execution.csv descrito na seção de Inventários do SMA desta documentação.

Contagens de palavras

O arquivo word_counts.pam exibe quantas vezes cada palavra-chave aparece em todos os arquivos da base de código verificada.

  • FileId: O local do arquivo e o caminho relativo onde a palavra-chave foi encontrada

  • Palavra-chave: O texto específico identificado como uma palavra-chave (exemplos: from, import, DataFrame)

  • Contagem: O número de ocorrências da palavra-chave em uma única linha de código