Snowpark Migration Accelerator : Types de fichiers pris en charge

Le Snowpark Migration Accelerator (SMA) analyse les fichiers dans le répertoire source que vous avez sélectionné lors de la création du projet. Bien que certains fichiers soient exclus en fonction de leur type, SMA génère un rapport récapitulatif indiquant le nombre de fichiers par extension.

L’outil SMA recherche des extensions de fichiers spécifiques lorsqu’il analyse les références aux API Spark, aux instructions SQL et à d’autres éléments qui contribuent aux scores de préparation . L’outil peut analyser à la fois les fichiers de code et les notebooks situés dans n’importe quel répertoire ou sous-répertoire de votre projet.

Fichiers de code

L’outil Snowpark Migration Accelerator analyse les types de fichiers suivants pour identifier les références aux API Spark et à d’autres APIs tierces :

  • Fichiers avec l’extension .scala

  • Fichiers avec l’extension .py

  • Fichiers avec l’extension .python

Les instructions SQL écrites dans Spark SQL ou HiveQL peuvent être détectées dans les types de fichiers suivants :

  • Fichiers SQL portant l’extension .sql

  • Fichiers de langage de requête Hive portant l’extension .hql

Carnets

Les analyseurs Spark Scala et PySpark de l’outil Snowpark Migration Accelerator (SMA) analysent et traitent automatiquement les fichiers Jupyter Notebook et les fichiers Databricks exportés lorsqu’ils sont présents dans le répertoire du code source.

  • Fichiers Jupyter Notebook (*.ipynb)

  • Fichiers Databricks Notebooks (*.dbc)

L’outil SMA analysera les fichiers notebook afin d’identifier les éléments suivants :

  • Références aux API Spark

  • Références à des APIs tierces

  • Instructions SQL

L’analyse est effectuée en fonction du type de cellule dans chaque notebook. Les notebooks peuvent contenir un mélange de cellules SQL, Python et Scala. L’outil SMA créera un inventaire de tous les types de cellules dans son rapport de sortie.

Fichiers et dossiers exclus

Par défaut, certains fichiers et dossiers sont exclus de l’analyse. Ces exclusions concernent principalement les fichiers de configuration du projet et leurs répertoires associés.

Type de dossier exclu de l’analyse :

  • Programme d’installation de pack Python (pip) - Outil pour l’installation de paquets Python

  • Packs de distribution (dist) - Répertoire contenant les paquets Python prêts à être distribués

  • Environnement virtuel (venv) - Environnement Python isolé pour la gestion des dépendances du projet

  • Site-packages - Répertoire dans lequel sont installés les paquets Python à utiliser dans le système

Type de fichier exclu de l’analyse :

  • input.wsp - Fichier d’entrée de l’espace de travail

  • .DS_Store - Fichier système macOS qui stocke les attributs des dossiers personnalisés

  • build.gradle - Fichier de configuration de construction Gradle

  • build.sbt - Fichier de configuration de l’outil de construction Scala

  • pom.xml - Fichier de configuration du modèle d’objet du projet Maven

  • storage.lck - Fichier de verrouillage du stockage