Snowpark Migration Accelerator: コード抽出

Snowpark Migration Accelerator(SMA)は、指定したディレクトリ内のすべてのファイルを処理します。すべてのファイルのインベントリを作成しますが、特に特定の拡張子を持つファイルを分析し、Spark API の参照を特定します。

このディレクトリにファイルを追加するにはいくつかの方法があります。

移行を進める前に、関連するコードファイルをすべて1つのディレクトリに配置します。

既存の環境(Databricksなど)からノートブックを抽出するには、抽出スクリプトを使用して移行プロセスを支援できます。

抽出スクリプト

Snowflakeでは、 Snowflake Labs GitHub ページ で公開されている抽出スクリプトを提供しています。Spark移行では、これらのスクリプトがさまざまなプラットフォームをサポートします。

Databricks

Databricksで実行されるJupyter(.ipynb)またはDatabricks(.dbc)ノートブックでは、 SMA のためにそれらを抽出せずに直接ディレクトリに配置できます。Databricksノートブックファイルをエクスポートする方法については、Databricksのドキュメント https://docs.databricks.com/en/notebooks/notebook-export-import.html#export-notebooks をご参照ください。

別の方法として、 SC.DDLExportScripts リポジトリのDatabricksフォルダーにあるスクリプトを使用することもできます。 https://github.com/Snowflake-Labs/SC.DDLExportScripts/tree/main/Databricks

データ抽出に関する追加情報は近日中に提供される予定です。