ValidateCsv 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-standard-nar
Beschreibung¶
Überprüft den Inhalt von FlowFiles oder einen FlowFile Attributwert anhand eines vom Benutzer angegebenen CSV-Schemas. Weitere Schema-Beispiele finden Sie in der zusätzlichen Dokumentation zu diesem Prozessor.
Eingabeanforderung¶
REQUIRED
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
CSV Source Attribute |
Der Name des Attributs, das die zu überprüfenden CSV-Daten enthält. Wenn diese Eigenschaft leer ist, wird der IFlowFile-Inhalt validiert. |
validate-csv-delimiter |
Zeichen, das als „Delimiter“ in den eingehenden Daten verwendet wird. Beispiel: , |
validate-csv-eol |
Symbole, die als „Zeilenende“ in den eingehenden Daten verwendet werden. Beispiel: n |
validate-csv-header |
„True“, wenn das eingehende FlowFile einen zu ignorierenden Header enthält, andernfalls „false“. |
validate-csv-quote |
Zeichen, das als „quote“ in den eingehenden Daten verwendet wird. Beispiel: „ |
validate-csv-schema |
Das Schema, das für die Validierung verwendet werden soll. Wird als durch Kommas getrennte Zeichenkette erwartet, die die anzuwendenden Zellprozessoren angibt. Die folgenden Zellprozessoren sind in der Schemadefinition erlaubt: [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Optional, DMinMax, Equals, ForbidSubStr, LMinMax, NotNull, Null, RequireHashCode, RequireSubStr, Strlen, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn]. Hinweis: Zellprozessoren können nur mit „Optional“ verschachtelt werden. Schema ist erforderlich, wenn Header falsch ist. |
validate-csv-strategy |
Strategie, die bei der Weiterleitung von Eingabedateien an Ausgabebeziehungen angewendet werden soll. |
validate-csv-violations |
Bei „true“ würde das Attribut validation.error.message die Liste aller Verstöße für die erste ungültige Zeile enthalten. Beachten Sie, dass die Einstellung dieser Eigenschaft auf „true“ die Leistung leicht verringern würde, da alle Spalten überprüft werden würden. Bei „false“ ist eine Zeile ungültig, sobald eine Spalte gefunden wird, die gegen die angegebene Einschränkung verstößt, und nur dieser Verstoß für die erste ungültige Zeile wird in das Attribut „validation.error.message“ aufgenommen. |
Beziehungen¶
Name |
Beschreibung |
---|---|
invalid |
FlowFiles, die nach dem angegebenen Schema nicht gültig sind, oder für die kein Schema oder CSV Header identifiziert werden kann, werden an diese Beziehung weitergeleitet |
gültig |
FlowFiles, die erfolgreich anhand des Schemas validiert wurden, werden an diese Beziehung weitergeleitet. |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
count.valid.lines |
Bei einer zeilenweisen Validierung wird die Anzahl der gültigen Zeilen aus den Quelldaten extrahiert. |
count.invalid.lines |
Bei einer zeilenweisen Validierung wird die Anzahl der aus den Quelldaten extrahierten ungültigen Zeilen angegeben. |
count.total.lines |
Bei zeilenweiser Validierung, Gesamtzahl der Zeilen in den Quelldaten |
validation.error.message |
Für FlowFiles die als ungültig weitergeleitet wurden, Meldung des ersten Validierungsfehlers |