Snowpark Migration Accelerator: SMA CLI ウォークスルー

Snowpark Migration Accelerator(SMA) は、開発者がPythonまたはScala SparkコードをSnowparkに移行するのを支援します。ご使用のコードを分析し、

  1. Snowparkとの互換性を評価します

  2. 互換性のあるSpark API 呼び出しを自動的にSnowpark API に変換します

  3. 自動変換できないコードを識別します

  4. スクリプトやノートブックからサードパーティライブラリインポートのインベントリを作成します。

  5. SparkとSnowparkのコードを比較した編集可能な互換性レポートを生成します

Snowflakeは、Snowpark Migration Accelerator(SMA)用のコマンドラインインターフェイス(CLI)をリリースしています。このガイドでは、 CLI をスタンドアロンのツールとして使用する方法と、スクリプト内で使用する方法の両方を説明します。

CLI の使用

コマンドラインインターフェイス(CLI)は、 ダウンロードとアクセスセクション からダウンロードできます。ご使用のオペレーティングシステムに合ったバージョンを選択します。CLI は、マシンやコンテナーのアクセスしやすい任意の場所に保管できます。

注釈

NOTE: このウォークスルーでは、Macコンピューターのスクリーンショットを使用していますが、WindowsやLinuxユーザーでのプロセスも同様です。

パッケージファイル(.zipまたは.tar形式)をダウンロードしたら、中身を解凍します。コマンドラインインターフェイス(CLI)ツールは、解凍したファイル内の「orchestrator」フォルダーにあります。

Orchestratorディレクトリ内の SMA CLI

インストールフォルダーでターミナルまたはコマンドプロンプトを開き、以下のコマンドを実行して CLI のインストールを検証し、バージョンを検証します。

./sma --version

このような結果が表示されます。

SMA バージョン情報

SMA コマンドラインインターフェイス(CLI)は、 SMA デスクトップアプリケーションと同様に、コンピューター上で動作するローカルアプリケーションです。SMA CLI を使ってコードファイルを分析するには、これらのファイルを CLI がアクセスできるローカルマシンに保存する必要があります。CLI は、通常の SMA アプリケーションと同じファイルタイプをサポートしています。サポートされているファイルタイプの包括的なリストについては、 SMA ドキュメント内のサポートされているファイルタイプ をご参照ください。

注釈

NOTE: CLI の関数をテストするには、 評価 セクションで提供されているサンプルコードベースを使用するか、 SMA ドキュメントの「変換ウォークスルー」をご参照ください。

SMA ドキュメントには、 CLI 引数の包括的なリストがあります。このセクションでは、最も重要なものを探ってみましょう。

SMA CLI は、 評価モード ではなく、デフォルトで 変換モード で実行されます。評価モードで CLI を実行するには、 -a引数 を使用します。変換操作には有効なアクセスコードが必要です。有効なアクセスコードがあるかどうかを検証するには、次のコマンドを使用します。

./sma show-ac
Copy

ライセンス情報

アクセスコードが必要な場合は、 SMA ドキュメント内の手順 に従ってリクエストします。メールでコードを受け取った後、 CLI の インストールアクセスコード パラメーターを使用してインストールを完了します。

変換を実行するには、以下が必要です。

  1. 入力ディレクトリ(必須)

  2. 出力ディレクトリ(必須)

プロジェクトファイルを作成したことがない場合は、以下も必要です。

  • ユーザーメールアドレス

  • 組織名

  • プロジェクト名

一度これらのパラメーターをセットアップしてしまえば、次回以降は入力と出力のディレクトリを指定するだけで変換できます。

./sma -i '/your/INput/directory/path/here' -o '/your/OUTput/directory/path/here' -e your@email.com -c Your-Organization -p Your-Project-Name
Copy

この画面では実行設定の概要が表示され、続行するかどうかの確認が求められます。

プロジェクト情報セクション

確認プロンプトをスキップするには、--yesまたは-yパラメーターを追加します。これは、自動化スクリプトから CLI を実行する場合に特に重要です。

ツールは実行中に詳細な進捗情報を提供します。

出力されたプロジェクト情報

ツールの実行中は、画面に継続的に出力されます。プロセスが完了すると、再びプロンプトが表示されます。このツールは、すべてのプロセス、問題、完了または失敗したステップを含む詳細な出力を生成します。後で ログ出力フォルダー で確認することができるため、実行中にこの情報のすべてに目を通す必要はありません。

出力の表示

SMA CLI は SMA アプリケーションと同じ出力を生成します。ツールを実行すると、指定した出力ディレクトリに3つのフォルダーが作成されます。

SMA からの出力ディレクトリ

Snowpark Migration Accelerator(SMA)によって変換されたコードを扱う際の詳細なガイダンスについては、 変換ウォークスルー をご参照ください。

プログラムによる CLI の実行

近日公開予定です。SMA チームは、 SMA コマンドラインインターフェイス(CLI)を複数のディレクトリで自動的に実行できるスクリプトを提供します。


コマンドラインインターフェイス(CLI)を今すぐお試しください。サポートが必要な場合やご質問のある場合は、Snowpark Migration Acceleratorチーム sma-support@snowflake.com にお問い合わせください。