Snowpark Migration Accelerator: 汎用インベントリ

Snowpark Migration Accelerator(SMA)は、コードを分析するときに2つのタイプのスキャンを実行します。

  1. ソースプログラミング言語のコードを分析する言語別スキャン

  2. コードベース内のファイルやキーワードに関する基本情報を収集する汎用スキャン

言語別のスキャン結果の詳細は、 SMA インベントリ セクションにあります。このページでは、汎用スキャンで収集される情報について説明します。

拡張子が.pamのファイルもありますが、実際は.csvファイルに似たコンマ区切りのファイルであることにご注意ください。様々なタイプの分析を容易にするために、データは様々な方法で整理されているため、これらのファイル間でエントリが重複していることに気づく場合があります。

ファイルの概要

files.pamには、ツールの実行中に処理されたすべてのファイルをリストするインベントリが含まれています。各ファイルについて、ファイルのタイプとサイズが記録されます。このファイルには、 SMA インベントリセクションで説明されているfiles.csv と同じ情報が含まれています。

汎用ファイルインベントリ

FilesInventory.csv ファイルには、各ソースファイルのカテゴリ分類の詳細と行数が含まれています。

  • ファイル名: 入力ディレクトリのルートからの完全なパスとファイル名

  • 拡張子: ファイルタイプの拡張子(例: .java、.py、.sql)

  • テクノロジ: ファイルの拡張子から識別されるプログラミング言語またはテクノロジ

  • ステータス: 識別されたファイルは常に「OK」を表示します(未識別ファイルはリストされません)

  • isBinary: ファイルがバイナリ(TRUE)、テキスト(FALSE)、または未認識(UNKNOWN)であるかを表します

  • バイト: バイト単位のファイルサイズ

  • ContentType: 各行を次のいずれかに分類します。

    • コード: プログラミング指示

    • コメント: ドキュメントまたはメモ

    • 空白: 空の行

    • その他: 未認識コンテンツ

  • ContentLines: ファイル内のコード行合計数

  • CommentLines: ファイル内のコメント行合計数

  • BlankLines: ファイル内の空の行合計数

キーワード数

KeywordCounts.csv ファイルは、各ファイルで検出されたすべてのキーワードの包括的なリストをテクノロジタイプ別に整理して提供します。この分析には、Snowpark Migration Accelerator(SMA)で公式にサポートされているソース言語だけでなく、汎用スキャナーが処理できるあらゆるプログラミング言語のキーワードが含まれます。

  • FileId: キーワードが置かれたファイルパス

  • テクノロジ: ソースファイルで使用されている元のテクノロジ

  • キーワード: 見つかった特定のキーワード(例: from、import、 DataFrame)。

  • 回数: 各行のキーワードの出現回数

行インベントリ

line_counts.pam ファイルは、スキャンされたファイルの各行を分析し、コード、コメント、空白行に分類します。また、各カテゴリの合計数も提供されます。

  • FileId: 分析対象のファイル名

  • LineKind: ファイル内の各行のカテゴリ(コード、コメント、空白のいずれでも可)

  • 回数: FileId と LineKind の各組み合わせの行数合計。

ツール実行インベントリ

tool_execution.pamファイルには、現在の SMA ツール実行に関する重要な情報が含まれています。このファイルは、このドキュメントの SMA インベントリのセクションで説明されているtool_execution.csvファイル とIDが同じです。

ワード数

word_counts.pam ファイルは、スキャンされたコードベース内のすべてのファイルに各キーワードが何回出現したかを表示します。

  • FileId: キーワードが見つかったファイルの場所と相対パス

  • キーワード: キーワードとして特定されるテキスト(例: from、import、 DataFrame)

  • 回数: 1行のコード内でキーワードが出現する回数