ValidateCsv 2025.5.31.15

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Überprüft den Inhalt von FlowFiles oder einen FlowFile Attributwert anhand eines vom Benutzer angegebenen CSV-Schemas. Weitere Schema-Beispiele finden Sie in der zusätzlichen Dokumentation zu diesem Prozessor.

Tags

csv, schema, validation

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

CSV Source Attribute

Der Name des Attributs, das die zu überprüfenden CSV-Daten enthält. Wenn diese Eigenschaft leer ist, wird der IFlowFile-Inhalt validiert.

validate-csv-delimiter

Zeichen, das als „Delimiter“ in den eingehenden Daten verwendet wird. Beispiel: ,

validate-csv-eol

Symbole, die als „Zeilenende“ in den eingehenden Daten verwendet werden. Beispiel: n

validate-csv-header

„True“, wenn das eingehende FlowFile einen zu ignorierenden Header enthält, andernfalls „false“.

validate-csv-quote

Zeichen, das als „quote“ in den eingehenden Daten verwendet wird. Beispiel: „

validate-csv-schema

Das Schema, das für die Validierung verwendet werden soll. Wird als durch Kommas getrennte Zeichenkette erwartet, die die anzuwendenden Zellprozessoren angibt. Die folgenden Zellprozessoren sind in der Schemadefinition erlaubt: [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Optional, DMinMax, Equals, ForbidSubStr, LMinMax, NotNull, Null, RequireHashCode, RequireSubStr, Strlen, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn]. Hinweis: Zellprozessoren können nur mit „Optional“ verschachtelt werden. Schema ist erforderlich, wenn Header falsch ist.

validate-csv-strategy

Strategie, die bei der Weiterleitung von Eingabedateien an Ausgabebeziehungen angewendet werden soll.

validate-csv-violations

Bei „true“ würde das Attribut validation.error.message die Liste aller Verstöße für die erste ungültige Zeile enthalten. Beachten Sie, dass die Einstellung dieser Eigenschaft auf „true“ die Leistung leicht verringern würde, da alle Spalten überprüft werden würden. Bei „false“ ist eine Zeile ungültig, sobald eine Spalte gefunden wird, die gegen die angegebene Einschränkung verstößt, und nur dieser Verstoß für die erste ungültige Zeile wird in das Attribut „validation.error.message“ aufgenommen.

Beziehungen

Name

Beschreibung

invalid

FlowFiles, die nach dem angegebenen Schema nicht gültig sind, oder für die kein Schema oder CSV Header identifiziert werden kann, werden an diese Beziehung weitergeleitet

gültig

FlowFiles, die erfolgreich anhand des Schemas validiert wurden, werden an diese Beziehung weitergeleitet.

Schreibt Attribute

Name

Beschreibung

count.valid.lines

Bei einer zeilenweisen Validierung wird die Anzahl der gültigen Zeilen aus den Quelldaten extrahiert.

count.invalid.lines

Bei einer zeilenweisen Validierung wird die Anzahl der aus den Quelldaten extrahierten ungültigen Zeilen angegeben.

count.total.lines

Bei zeilenweiser Validierung, Gesamtzahl der Zeilen in den Quelldaten

validation.error.message

Für FlowFiles die als ungültig weitergeleitet wurden, Meldung des ersten Validierungsfehlers