ValidateCsv 2025.5.31.15

バンドル

org.apache.nifi | nifi-standard-nar

説明

FlowFiles のコンテンツまたは FlowFile 属性値を、ユーザー指定の CSV スキーマに対して検証します。スキーマの例については、このプロセッサの追加ドキュメントをご覧ください。

タグ

csv, schema, validation

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

CSV ソース属性

検証される CSV データを含む属性の名前。このプロパティが空白の場合、 FlowFile の内容が検証されます。

validate-csv-delimiter

受信データの「区切り文字」として使用される文字。例: ,

validate-csv-eol

受信データの「行末」として使用される記号。例: n

validate-csv-header

受信するフローファイルに無視するヘッダが含まれていればtrue、そうでなければfalse。

validate-csv-quote

受信データの「引用符」として使用される文字。例: "

validate-csv-schema

検証に使用するスキーマ。カンマ区切りの文字列で、適用するセルプロセッサーを表します。スキーマ定義では以下のセル・プロセッサーが使用できます: [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Optional, DMinMax, Equals, ForbidSubStr, LMinMax, NotNull, Null, RequireHashCode, RequireSubStr, Strlen, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn].注意:セル・プロセッサーは Optional 以外では入れ子にできません。Header が false の場合はスキーマが必要です。

validate-csv-strategy

入力ファイルを出力関係にルーティングする際に適用するストラテジー。

validate-csv-violations

trueの場合、validation.error.message属性は、最初の無効な行のすべての違反のリストを含みます。このプロパティをtrueにセットすると、すべての列が検証されるため、パフォーマンスが若干低下することに注意してください。falseの場合、指定された制約に違反する列が見つかった時点でその行は無効となり、最初の無効な行の違反のみがvalidation.error.message属性に含まれます。

リレーションシップ

名前

説明

invalid

指定されたスキーマに従って有効でない FlowFiles、あるいはスキーマや CSV ヘッダーが識別できないものは、このリレーションシップにルーティングされます。

valid

FlowFiles スキーマに対するバリデーションに成功すると、このリレーションシップにルーティングされます。

属性の書き込み

名前

説明

count.valid.lines

行ごとの検証の場合、ソースデータから抽出された有効行数

count.invalid.lines

行ごとの検証の場合、ソースデータから抽出された無効な行の数

count.total.lines

行単位で検証する場合は、ソースデータの総行数

validation.error.message

無効にルーティングされたフローファイルの場合、最初の検証エラーのメッセージ