Snowpark Migration Accelerator : Types de fichiers pris en charge¶
Le Snowpark Migration Accelerator (SMA) analyse les fichiers dans le répertoire source que vous avez sélectionné lors de la création du projet. Bien que certains fichiers soient exclus en fonction de leur type, SMA génère un rapport récapitulatif indiquant le nombre de fichiers par extension.
L’outil SMA recherche des extensions de fichiers spécifiques lorsqu’il analyse les références aux API Spark, aux instructions SQL et à d’autres éléments qui contribuent aux scores de préparation . L’outil peut analyser à la fois les fichiers de code et les notebooks situés dans n’importe quel répertoire ou sous-répertoire de votre projet.
Fichiers de code¶
L’outil Snowpark Migration Accelerator analyse les types de fichiers suivants pour identifier les références aux API Spark et à d’autres APIs tierces :
Fichiers avec l’extension .scala
Fichiers avec l’extension .py
Fichiers avec l’extension .python
Les instructions SQL écrites dans Spark SQL ou HiveQL peuvent être détectées dans les types de fichiers suivants :
Fichiers SQL portant l’extension .sql
Fichiers de langage de requête Hive portant l’extension .hql
Carnets¶
Les analyseurs Spark Scala et PySpark de l’outil Snowpark Migration Accelerator (SMA) analysent et traitent automatiquement les fichiers Jupyter Notebook et les fichiers Databricks exportés lorsqu’ils sont présents dans le répertoire du code source.
Fichiers Jupyter Notebook (*.ipynb)
Fichiers Databricks Notebooks (*.dbc)
L’outil SMA analysera les fichiers notebook afin d’identifier les éléments suivants :
Références aux API Spark
Références à des APIs tierces
Instructions SQL
L’analyse est effectuée en fonction du type de cellule dans chaque notebook. Les notebooks peuvent contenir un mélange de cellules SQL, Python et Scala. L’outil SMA créera un inventaire de tous les types de cellules dans son rapport de sortie.
Fichiers et dossiers exclus¶
Par défaut, certains fichiers et dossiers sont exclus de l’analyse. Ces exclusions concernent principalement les fichiers de configuration du projet et leurs répertoires associés.
Type de dossier exclu de l’analyse :¶
Programme d’installation de pack Python (pip) - Outil pour l’installation de paquets Python
Packs de distribution (dist) - Répertoire contenant les paquets Python prêts à être distribués
Environnement virtuel (venv) - Environnement Python isolé pour la gestion des dépendances du projet
Site-packages - Répertoire dans lequel sont installés les paquets Python à utiliser dans le système
Type de fichier exclu de l’analyse :¶
input.wsp - Fichier d’entrée de l’espace de travail
.DS_Store - Fichier système macOS qui stocke les attributs des dossiers personnalisés
build.gradle - Fichier de configuration de construction Gradle
build.sbt - Fichier de configuration de l’outil de construction Scala
pom.xml - Fichier de configuration du modèle d’objet du projet Maven
storage.lck - Fichier de verrouillage du stockage