SplitText 2025.5.31.15

バンドル

org.apache.nifi | nifi-standard-nar

説明

最大行数またはフラグメントの合計サイズによって制限された行バウンダリで、テキストファイルを複数の小さなテキストファイルに分割します。各出力スプリットファイルには、構成された行数またはバイト数以上は含まれません。Line Split CountとMaximum Fragment Sizeの両方が指定された場合、どちらか先に達した方でスプリットが行われます。フラグメントの最初の行が最大フラグメントサイズを超える場合、その行は構成された最大サイズを超える1つのスプリットファイルに出力されます。このコンポーネントでは、各スプリットがヘッダー行を含むように指定することもできます。ヘッダー行は、ヘッダーを構成する行数を指定するか、ヘッダーマーカーを使用して読み取り行と照合することで計算できます。このような照合が起こった場合、対応する行はヘッダーとして扱われます。ヘッダーマーカーの照合が最初に失敗すると、それ以降の照合は実行されず、残りのデータは指定されたスプリットの通常の行として解析されることに注意してください。ヘッダーを計算した後にそれ以上のデータがない場合、結果のスプリットはヘッダー行のみで構成されます。

タグ

分割、テキスト

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

ヘッダー行数

ヘッダーの一部とみなされる行数。ヘッダー行はすべてのスプリットファイルに複製されます。

ヘッダー行マーカー文字

ヘッダー行を意味するデータファイルの行頭文字。Header Line Countが0以外の場合、この値は無視されます。ヘッダー行マーカー文字を含まない最初の行と、それ以降のすべての行は非ヘッダー行とみなされます。

行スプリット数

各スプリットファイルに追加される行数(ヘッダー行を除く)。ゼロの値は、最大フラグメントサイズをセットする必要があり、行数はスプリットを決定する際に考慮されません。

最大フラグメントサイズ

ヘッダー行を含む各スプリットファイルの最大サイズ。NOTE: 1行がこのプロパティ(アプリケーションの場合はヘッダーも含む)を超える場合、その行はこの最大フラグメントサイズの設定を超えるスプリットで出力されます。

後続改行の削除

各スプリットファイルの末尾の改行を削除するかどうか。スプリットされたファイルを後でマージするつもりなら、これは偽であるべきです。これを'true'にセットして、'空行'だけを含む(すなわち、˶rと˶n文字だけで構成される) FlowFile が生成された場合、 FlowFile は出力されません。ただし、ヘッダー行が指定された場合、 FlowFile はヘッダー行で構成されるため、結果として空になることはありません。そのため、 FlowFile はヘッダー行だけを含み生成されます。

リレーションシップ

名前

説明

failure

何らかの理由でファイルをスプリットできない場合、元のファイルはこの宛先にルーティングされ、他の宛先には何もルーティングされません。

original

元の入力ファイルが1つ以上のファイルにスプリットされると、この宛先にルーティングされます。

splits

入力ファイルが1つ以上のスプリットファイルにスプリットされた場合、スプリットファイルはこの宛先にルーティングされます。

属性の書き込み

名前

説明

text.line.count

元の FlowFile から、この FlowFile にコピーされたテキストの行数。

フラグメントサイズ

元の FlowFile から、この FlowFile にコピーされたバイト数(アプリケーションの場合はヘッダーも含み、ある場合は、各スプリット FlowFile に複製されるもの。)

フラグメント識別子

同じ親 FlowFile から生成されるすべての分割 FlowFiles は、この属性に対して同じランダム生成 UUID が追加されます。

フラグメント.インデックス

1つの親 FlowFile から作成されたスプリット FlowFiles の順序を示すワンアップ番号。

フラグメント.数

親 FlowFile から生成されたスプリット FlowFiles の数。

セグメント.オリジナル.ファイル名

親のファイル名 FlowFile

こちらもご覧ください