SplitAvro 2025.5.31.15

バンドル

org.apache.nifi | nifi-avro-nar

説明

バイナリ符号化された Avro データファイルを、構成された出力サイズに基づいて小さなファイルに分割します。出力ストラテジーは、小さいファイルをAvroデータファイルにするか、 FlowFile 属性にメタデータを持つ素のAvro記録にするかを決定します。出力は常にバイナリ・エンコードされます。

タグ

avro, split

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

出力サイズ

分割ファイルに含めるAvro記録の数。受信ファイルの記録数が出力サイズより少ない場合、または記録数の合計が出力サイズで均等に割り切れない場合、記録数の少ない分割ファイルを取得することができます。

出力ストラテジー

出力の形式を決定します。Avro Datafile、またはベア記録のいずれか。ベア記録出力は、それをすでに必要としているシステムでの使用を意図しているだけであり、通常の使用では必要ないはずです。

スプリット戦略

受信データファイルの分割ストラテジー。Recordストラテジーは、各記録をデシリアライズして、入力されたデータファイルを読み込みます。

メタデータの転送

親データファイルから子データファイルへメタデータを転送するかどうか。出力ストラテジーがBare Recordの場合、メタデータは FlowFile 属性として保存され、そうでない場合はDatafileヘッダーに保存されます。

リレーションシップ

名前

説明

failure

FlowFile が何らかの理由で処理に失敗した場合(例えば、 FlowFile が有効な Avro でない場合)、このリレーションシップにルーティングされます。

original

分割された元の FlowFile。FlowFile が処理に失敗した場合、このリレーションシップには何も送られません。

split

元の FlowFile から分割された新しいファイルはすべて、このリレーションにルーティングされます。

属性の書き込み

名前

説明

フラグメント識別子

同じ親 FlowFile から生成されるすべての分割 FlowFiles は、この属性に対して同じランダム生成 UUID が追加されます。

フラグメント.インデックス

1つの親 FlowFile から作成されたスプリット FlowFiles の順序を示すワンアップ番号。

フラグメント.数

親 FlowFile から生成されたスプリット FlowFiles の数。

セグメント.オリジナル.ファイル名

親のファイル名 FlowFile