ExtractAvroMetadata 2025.5.31.15

バンドル

org.apache.nifi | nifi-avro-nar

説明

Avro データファイルのヘッダーからメタデータを抽出します。

タグ

avro, metadata, schema

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

カウント項目

trueの場合、データファイルの項目数がカウントされ、 FlowFile 属性 'item.count' に保存されます。カウントはブロックを読み込み、各ブロックのアイテム数を取得することで行われるため、デシリアライズを避けることができます。カウントされる項目は、データファイルのトップレベルの項目になります。例えば、記録タイプのスキーマの場合、項目は記録となり、Arrayタイプのスキーマの場合、項目は配列となります(各 配列 のエントリ数ではありません)。

指紋アルゴリズム

スキーマ指紋の生成に使われるアルゴリズム。利用可能な選択肢は、指紋生成のための Avro 推奨慣行に基づいています。

メタデータキー

Avro ファイルヘッダーから抽出するキー/値ペアを示すキーのカンマ区切りリスト。キー 'avro.schema' を使ってスキーマ全体を JSON 形式で取り出すことができ、 'avro.codec' を使ってコーデック名があればそれを取り出すことができます。

リレーションシップ

名前

説明

failure

FlowFile は、Avroとして解析できない場合、または何らかの理由でメタデータを抽出できない場合は、このリレーションシップにルーティングされます。

success

FlowFile は、メタデータが抽出された後、このリレーションシップにルーティングされます。

属性の書き込み

名前

説明

schema.type

スキーマのタイプ(記録、列挙タイプなど)。

schema.name

タイプがrecord、enum、fixedの場合はその名前をコンテナーで表し、それ以外の場合はプリミティブタイプの名前をコンテナーで表します。

schema.fingerprint

16進文字列としてのフィンガープリントアルゴリズムの結果。

item.count

データファイル内の全アイテム数。Count Itemsがtrueにセットされている場合のみ書き込まれます。