Snowpark Migration Accelerator: コード抽出¶
Snowpark Migration Accelerator(SMA)は、指定したディレクトリ内のすべてのファイルを処理します。すべてのファイルのインベントリを作成しますが、特に特定の拡張子を持つファイルを分析し、Spark API の参照を特定します。
このディレクトリにファイルを追加するにはいくつかの方法があります。
移行を進める前に、関連するコードファイルをすべて1つのディレクトリに配置します。
既存の環境(Databricksなど)からノートブックを抽出するには、抽出スクリプトを使用して移行プロセスを支援できます。
抽出スクリプト¶
Snowflake provides publicly available extraction scripts that you can find on the Snowflake Labs GitHub page. For Spark migrations, these scripts support various platforms.
Databricks¶
For Jupyter (.ipynb) or Databricks (.dbc) notebooks that run in Databricks, you can directly place them in a directory for SMA analysis without any extraction. To learn how to export your Databricks notebook files, visit the Databricks documentation here: https://docs.databricks.com/en/notebooks/notebook-export-import.html#export-notebooks.
For an alternative approach, you can follow the instructions and use the scripts available in the Databricks folder of the SC.DDLExportScripts repository: https://github.com/Snowflake-Labs/SC.DDLExportScripts/tree/main/Databricks
データ抽出に関する追加情報は近日中に提供される予定です。