Snowpark Migration Accelerator: 厳選レポート

Snowpark Migration Accelerator(SMA)は、詳細なデータを分析して、包括的な評価レポートを作成します。以下のセクションでは、これらの利用可能なレポートをリストアップしています。

全要素の詳細なインベントリを含む評価結果は、 次ページのスプレッドシート でご覧いただけます。

詳細レポート

危険

DetailedReport.html レポートは廃止され、Spark Conversion Core V2.43.0 ではサポートされなくなりました

注釈

このページでは、ドキュメントファイルに記載されている詳細レポートの各セクションについて説明します。

SMA 詳細レポートは、複数のセクションにわたる包括的な情報を提供するメインの分析レポートです。

評価レポートには、以下のセクションとその説明が含まれています。

詳細レポートの最初のページには、Snowpark Migration Accelerator(SMA)ツールの概要が簡潔に記載されています。

SMA (1).png

このページには以下のサブセクションがあります。

実行概要セクションには、次が表示されます。

  • プロジェクト作成 で設定した組織名とメールアドレス

  • SMA 実行ごとに一意の識別番号(この ID は、インベントリセクション全体で参照されます)

  • 実行のタイムスタンプ

  • SMA とSnowpark API 両方のバージョン詳細

レディネススコア概要

次のページには、レディネススコアの概要が表示されます。Spark APIサードパーティライブラリ のスコアと、その解釈方法についてのガイダンスが含まれています。これらのスコアは、コードベースがSnowflakeへの移行に対してどの程度準備されているかを理解するのに役立ちます。

ReadinessScore (1).png

このセクションでは、各レディネススコアに関する詳細情報を提供します。

SparkApi (1).png

  • Spark API 分析: Spark API の参照の総数と変換可能な数を表示します。レディネススコアは、変換可能な参照の数を特定された参照の総数で割って算出します。

  • サードパーティライブラリの互換性: インポートされた外部ライブラリの何パーセントがSnowflakeと互換性があるかを示します。レディネススコアは、Snowflakeがサポートするライブラリの数をサードパーティライブラリのインポート総数で割って算出します。

ファイルの概要

ファイル概要セクションは次のページから始まります。このセクションは、このツールの実行中に処理されたファイルタイプの数に応じて、複数のページにまたがる場合があります。

この情報は アプリケーションで提示される評価の概要 でも入手可能です。

ファイルの概要(パート1)

  • ファイルタイプ概要: 各テクノロジタイプのファイル数、総コード行数、全分析ファイルに占める割合など、認識されたテクノロジの内訳が表示されます。

  • ファイル拡張子概要: 認識されたファイル拡張子ごとに、その拡張子を持つファイルの数、コードの総行数、全分析ファイルに占める割合などの統計情報を表示します。

CodeFileSizing (1).png

  • コードファイルサイズ分析: サイズカテゴリ別にコードファイルの分布を表示します(「Tシャツ」サイズ)。各サイズカテゴリには、ファイル数とコードベース全体に占める割合が表示されます。

  • ノートブック言語統計: スキャンされたすべてのノートブックのプログラミング言語別のコード行とセルの内訳を提供します。

  • 言語ごとのノートブックサイズ分類: 各ノートブックファイルを、コードの総行数に基づいてサイズ別に分類します。ノートブックタイプ(Python、Scala、または SQL)は、主に使用される言語によって決まります。サイズカテゴリは以下のとおりです。

    • XS: 50行以下

    • S: 50~200行

    • M: 200~500行

    • L: 500~1,000行

    • XL: 1,000行超

Spark API 概要

Spark API 概要では、レディネススコアセクションに表示されているレディネススコアの詳細な分析が提供されます。このセクションには4つのコンテナーがあります。

  1. Spark API の参照を含むファイルのリスト

  2. サポートされる機能とサポートされない機能の内訳

  3. Spark API のカテゴリ別に整理されたレディネススコア

  4. マッピングステータス別のレディネススコア

どのSpark API 参照がサポートされ、サポートされていないかを説明します。これらの用語の意味は以下のとおりです。

  • サポートあり: Snowpark Migration Accelerator(SMA)は、この API 要素を自動的にSnowpark API に変換するか、既知の回避策を提供することができます。

  • サポートなし: Snowpark Migration Accelerator(SMA)は、この API 要素を自動的にSnowpark API に変換することができません。変換が不可能ということではありませんが、手作業が必要になります。

Spark API 使用概要

  • Spark参照のあるファイル: このテーブルは、ワークロード全体のSparkテクノロジ使用の内訳を、テクノロジタイプ別に分類して表示します。

  • Sparkサポートステータスのあるファイル: このテーブルは、ソースコード内でサポートありとサポートなしのSpark機能の数をテクノロジタイプ別に表示します。

SparkApiUsagesSummaries (1).png

SparkApiUsagesBySupportCategory (1).png

  • Spark API 使用状況概要: PythonとScalaでサポートされているSpark API 関数とサポートされていない関数の数を示したテーブル。このテーブルは、 API カテゴリ別に構成され、レディネススコアセクションに表示されているスコアと一致するSpark API レディネススコアが含まれています。

  • Spark API 使用状況サポートカテゴリ: Spark API 関数がコード内で何回使用されたかをサポートステータス別に分類しています。各サポートカテゴリの詳細については、 Spark参照カテゴリページ をご参照ください。

Pandas API 使用状況概要

注釈

Pandas API 使用状況概要はPythonファイルを含む実行でのみ利用可能です。

Pandas API 概要は、先に示したSpark API 概要と同様に、Pandas API への参照のリストを提供します。

Pandas API 使用概要

  • Pandas使用状況のあるファイル: ワークロード全体にわたって各テクノロジで見つかったPandasの参照数を示す内訳。

  • Pandas API 使用状況概要: ソースコードで使用されているPandasライブラリ関数を使用頻度順に並べた詳細リスト。

インポート参照概要

インポート分析セクションには、コードベースにインポートされたすべての外部依存関係が表示されます。これには、すべてのファイルで使用されるサードパーティのライブラリやその他の外部コンポーネントが含まれます。自分のコードベース内のファイルからのインポートは、このテーブルには表示されないことに注意してください。

コードインポート呼び出し

このテーブルには、Pythonパッケージ情報が以下の詳細とともに表示されます。

  • インポートされたパッケージ名

  • 各パッケージがSnowparkのAnaconda配布でサポートされているかどうか

  • 各パッケージがインポートに登場する回数

  • 各インポートを含むファイルの割合

「Percent」列の合計は100%ですが、ファイルには複数のパッケージがインポートされていることが多いため、個々のパーセントの合計は100%を超えることがあります。

SQL 参照概要

SqlReferenceSummary (1).png

  • SQL ファイルタイプ別の使用状況: このテーブルは、 SQL の使用量をさまざまなテクノロジに基づいて分類し、ワークロードで検出された SQL ファイルと SQL セルの総数を示します。

  • SQL サポートステータス別の使用状況: このテーブルは、Snowflakeに同等の機能があるかどうかに基づいて SQL 要素を整理します。

Snowpark Migration Accelerator(SMA)問題の概要

Snowpark Migration Accelerator(SMA)は、コード内の警告、変換エラー、解析エラーを検出すると、問題レポートを作成します。これらの問題を解決することは、 SMA を使ったコード移行を成功させるために不可欠です。

問題を理解し分析するための詳細なガイドについては、ドキュメントの 問題分析セクション をご参照ください。

Screenshot 2024-09-27 at 8.11.55 AM.png

Screenshot 2024-09-27 at 8.12.36 AM.png

概要には、各問題が以下の情報とともに表示されます。

  • 問題コード(詳細ドキュメントへのリンク付き)

  • ワークロード内での発生回数

  • 重大度レベル

レポートには3つの重大度レベル(警告、変換エラー、解析エラー)が表示され、各レベルごとに概要が整理されます。

移行ツールを使用する際は、さまざまなタイプの問題に対処するための優先順位に従います。

  1. 解析エラーは早急な対応が必要なため、最初に対処します

  2. プログラマティックソリューションを介して変換エラーを解決します

  3. 移行プロセス全体を通して警告をモニターし追跡します

付録

付録Aは、すべてのマッピングステータスカテゴリの詳細な説明です。

AppendixA (1).png


この包括的なレポートには、Snowpark Migration Accelerator(SMA)が生成する インベントリファイル から収集した詳細情報が含まれています。

レポートの詳細情報については、Snowpark Migration Accelerator(SMA)チーム sma-support@snowflake.com にお問い合わせください。

危険

概要レポート 機能は削除され、Spark Conversion Core V2.43.0 以降利用できなくなりました。


SMA は、結果の詳細なスプレッドシートを含むいくつかの出力レポートを生成します。