Snowpark Migration Accelerator : Inventaires génériques

Lorsque l’outil Snowpark Migration Accelerator (SMA) analyse votre code, il effectue deux types d’analyses :

  1. Une analyse spécifique à la langue qui analyse le code dans votre langue de programmation source

  2. Une analyse générale qui recueille des informations de base sur les fichiers et les mots-clés de votre base de code

Vous trouverez des détails sur les résultats des analyses spécifiques aux langues dans la section Inventaires SMA. Cette page décrit les informations collectées par l’analyse à des fins générales.

Veuillez noter que bien que certains fichiers aient une extension .pam, il s’agit en fait de fichiers séparés par des virgules, similaires aux fichiers .csv. Il se peut que vous remarquiez des doublons dans ces fichiers, car les données ont été organisées de différentes manières pour faciliter divers types d’analyse.

Résumé du fichier

Le fichier files.pam contient un inventaire qui dresse la liste de tous les fichiers traités au cours de l’exécution d’un outil. Pour chaque fichier, il enregistre le type et la taille du fichier. Ce fichier contient les mêmes informations que le fichier files.csv décrit dans la section Inventaires SMA.

Inventaire générique des fichiers

Le fichier FilesInventory. csv contient les détails de la catégorisation et le nombre de lignes pour chaque fichier source.

  • Nom de fichier : Chemin complet et le nom du fichier à partir du répertoire d’entrée racine

  • Extension : Extension du type de fichier (par exemple, .java, .py, .sql)

  • Technologie : Langue de programmation ou technologie identifiée sur la base de l’extension du fichier

  • Statut : Indique toujours « OK » pour les fichiers identifiés (les fichiers non identifiés ne sont pas répertoriés)

  • isBinary : Indique si le fichier est binaire (TRUE), texte (FALSE) ou non reconnu (UNKNOWN)

  • Octets : Taille du fichier en octets

  • ContentType : Classe chaque ligne dans l’une ou l’autre des catégories suivantes :

    • Code : Instructions de programmation

    • Commentaire : Documentation ou notes

    • Vide : Lignes vides

    • Autre : Contenu non reconnu

  • ContentLines : Nombre total de lignes de code dans le fichier

  • CommentLines : Nombre total de lignes de commentaires dans le fichier

  • BlankLines : Nombre total de lignes vides dans le fichier

Nombre de mots-clé

Le fichier KeywordCounts. csv fournit une liste complète de tous les mots-clés détectés dans chaque fichier, organisés par type de technologie. Cette analyse inclut les mots-clés de toutes les langues de programmation que notre scanner générique peut traiter, et pas seulement les langues sources officiellement prises en charge par Snowpark Migration Accelerator (SMA).

  • FileId : Chemin d’accès au fichier où se trouve le mot-clé

  • Technologie : Technologie originale utilisée dans le fichier source

  • Mot-clé : Mot-clé spécifique trouvé (exemples : from, import, DataFrame)

  • Nombre : Nombre d’occurrences du mot-clé dans chaque ligne

Inventaire des lignes

Le fichier line_counts.pam analyse chaque ligne d’un fichier analysé et les classe en code, commentaires ou lignes vierges. Il fournit également un décompte total pour chaque catégorie.

  • FileId : Nom du fichier en cours d’analyse

  • LineKind : Catégorie de chaque ligne du fichier (peut être un code, un commentaire ou un espace blanc)

  • Nombre : Nombre total de lignes pour chaque combinaison de FileId et de LineKind

Inventaire de l’exécution de l’outil

Le fichier tool_execution.pam contient des informations essentielles sur l’exécution de l’outil SMA en cours. Ce fichier est identique au fichier tool_execution.csv décrit dans la section Inventaires SMA de cette documentation.

Nombre de mots

Le fichier word_counts.pam affiche le nombre de fois que chaque mot-clé apparaît dans tous les fichiers de la base de code analysée.

  • FileId : Emplacement du fichier et le chemin relatif où le mot-clé a été trouvé

  • Mot-clé : Texte spécifique identifié comme mot-clé (exemples : from, import, DataFrame)

  • Nombre : Nombre d’occurrences du mot-clé dans une seule ligne de code