Snowpark Migration Accelerator: 用語集

Snowpark Migration Accelerator(SMA)には、聞き慣れない専門用語が使われています。これらの用語については、用語集のページをご参照ください。

Snowpark Migration Accelerator(SMA)

このソフトウェアドキュメントでは、ScalaまたはPythonで書かれたSpark API コードを同等のSnowflake Snowparkコードに自動的に変換する方法を説明します。変換プロセスはセキュリティで保護され、元のコードの機能を維持します。

Snowpark Migration Accelerator(SMA)は、以前は SnowConvert と SnowConvert for Sparkとして知られていました。なお、 SnowConvert (SC)は、 SQL の変換ツールとして引き続きご利用いただけます。

レディネススコア

レディネススコアは、Snowparkに移行するためのコードのレディネススコアを把握するのに役立ちます。Snowpark API に変換できるSpark API 参照のパーセントを計算します。たとえば、3748件のSpark API 参照のうち3413件が変換可能な場合、レディネススコアは91%となります。

しかし、このスコアには注意が必要です。

  • Spark API 参照のみを考慮します

  • サードパーティライブラリを評価しません

  • 最終的な決定要因ではなく、最初の評価として使用する必要があります

スコアが高いほどSnowparkとの互換性が高いことを示しますが、移行を進める前に、サードパーティライブラリの依存関係など、他の要因も評価する必要があります。

Sparkリファレンスカテゴリ

Snowpark Migration Accelerator(SMA)は、SparkコンポーネントをSnowpark関数へのマッピング方法に従って分類します。各Spark参照について、 SMA は以下を提供します。

  • Snowparkへの翻訳方法のカテゴリ分類

  • 詳しい説明

  • コード例

  • 自動変換機能に関する情報

  • Snowparkサポートの詳細

包括的な参照ガイドについては、 このページ でご覧いただけます。

SnowConvert 適格性ツール

SnowConvert for Sparkの評価モードは、コードベースを分析し、Apache Spark Pythonコードのすべてのインスタンスを自動的に検出して識別します。

ファイルインベントリ

ファイルのタイプに関係なく、ツールの入力ディレクトリで見つかったすべてのファイルの包括的なリスト。インベントリは、ファイルのタイプ別に整理された詳細な内訳を提供します。

  • オリジナルのテクノロジまたはプラットフォーム

  • コード行数

  • コメント行数

  • ソースファイルのファイルサイズ

キーワード数

キーワードの出現をテクノロジタイプ別にまとめた概要。たとえば、 PySpark コードを含む.pyファイルを分析するとき、システムはそれぞれの PySpark キーワードを追跡してカウントします。レポートには、各ファイル拡張子で見つかったキーワードの合計数が表示されます。

Spark参照インベントリ

コードを分析した後、Pythonコードで見つかったすべてのSpark API 参照の包括的なリストを受け取ります。

レディネススコア

Sparkのコード参照は、コードベースのどの程度を自動的に変換できるかを判断するのに役立ちます。

変換スコア

変換スコアは、自動的に変換されたSpark操作の数を、コード内で検出されたSpark参照の合計数で割って計算されます。

変換/変換ルール

SnowConvert は、ソースコードを目的のターゲットコード形式に変換する方法を定義するルール。

解析

解析フェーズは、 SnowConvert がソースコードを分析し、内部データ構造を作成する最初のステップです。この構造は、移行プロセス中に変換ルールを適用するために使用されます。