Snowpark Migration Accelerator: DBC ファイルの展開

Databricksワークロードを移行する前に、2つのステップを完了する必要があります。

  1. 展開プロセスを使って.dbcファイルからソースコードを抽出します。

  2. SnowConvert を使用して、抽出したソースコードを移行します。

展開プロセスを実行するには、Pythonがコンピューターにインストールされている必要があります。Python 3.7 の使用を推奨します。

展開スクリプトを実行する

dbcexplode.py を実行し、.dbcファイルへのパスをコマンドライン引数として与えます。

python dbcexplode.py <dbc_file_path>
Copy

スクリプト実行を展開する

このスクリプトは dbcexplode.py スクリプトと同じディレクトリにフォルダーを作成します。新しいフォルダーの名前は、 DBC ファイルの名前の後に、 .dbc-exploded を付けたものになります。

このフォルダーには、.dbcファイルで見つかったノートブックごとに別々のフォルダーが含まれます。この例では、.dbcファイルには SanFranciscoFireCallsAnalysis (1).python という1つのノートブックが含まれています。

image (259).png

このフォルダーの中には、処理されたノートブックのコマンドごとに別々のファイルがあります。各ファイルは、 <notebook_name>-<sequence_number> という命名パターンに従っています。 <sequence_number> は、コマンドがノートブックに出現する順番を表します。たとえば、 SanFranciscoFireCallsAnalysis (1)-001.md はノートブックで最初に見つかったコマンドを表します。

メモ: ノートブックコードのセルにmagic文字列が含まれている場合、スクリプトは拡張子.magicのファイルを生成します。

抽出された SanFranciscoFireCallsAnalysis (1)-001.md (Markdown)

抽出された SanFranciscoFireCallsAnalysis (1)-005.py (Python)

抽出された SanFranciscoFireCallsAnalysis (1)-050.sql (Sql)