ValidateRecord 2025.10.2.19

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Validates the Records of an incoming FlowFile against a given schema. All records that adhere to the schema are routed to the „valid“ relationship while records that do not adhere to the schema are routed to the „invalid“ relationship. It is therefore possible for a single incoming FlowFile to be split into two individual FlowFiles if some records are valid according to the schema and others are not. Any FlowFile that is routed to the „invalid“ relationship will emit a ROUTE Provenance Event with the Details field populated to explain why records were invalid. In addition, to gain further explanation of why records were invalid, DEBUG-level logging can be enabled for the „org.apache.nifi.processors.standard. ValidateRecord“ logger.

Tags

record, schema, validate

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

allow-extra-fields

Wenn die eingehenden Daten Felder enthalten, die nicht im Schema vorhanden sind, bestimmt diese Eigenschaft, ob der Datensatz gültig ist oder nicht. Wenn ja, ist der Datensatz noch gültig. Bei „false“ ist der Datensatz aufgrund der zusätzlichen Felder ungültig.

coerce-types

If enabled, the processor will coerce every field to the type specified in the Reader ‚s schema. If the value of a field cannot be coerced to the type, the field will be skipped (will not be read from the input data), thus will not appear in the output. If not enabled, then every field will appear in the output but their types may differ from what is specified in the schema. For details please see the Additional Details page of the processor’s Help. This property controls how the data is read by the specified Record Reader.

invalid-record-writer

Falls angegeben, wird dieser Controller Service verwendet, um alle ungültigen Datensätze zu löschen. Wenn nicht angegeben, wird der Writer, der in der Eigenschaft „Record Writer“ angegeben ist, mit dem Schema verwendet, das zum Lesen der Eingabedatensätze verwendet wird. Dies ist beispielsweise nützlich, wenn der konfigurierte Record Writer keine Daten schreiben kann, die nicht seinem Schema entsprechen (wie bei Avro), oder wenn es wünschenswert ist, ungültige Datensätze in ihrem ursprünglichen Format beizubehalten, während gültige Datensätze in ein anderes Format konvertiert werden.

maximum-validation-details-length

Gibt die maximale Anzahl von Zeichen an, die der Wert für die Validierungsdetails enthalten darf. Alle Zeichen, die über das Maximum hinausgehen, werden abgeschnitten. Diese Eigenschaft wird nur verwendet, wenn „Validation Details Attribute Name“ festgelegt ist.

record-reader

Gibt den Controller Service an, der zum Lesen eingehender Daten verwendet werden soll

record-writer

Gibt den Controller Service an, der für das Schreiben der Datensätze verwendet werden soll. Unabhängig von der Schemazugriffskonfiguration des Controller Service wird das Schema, das zur Validierung von Datensätzen verwendet wird, auch zum Schreiben der gültigen Ergebnisse verwendet.

schema-access-strategy

Gibt an, wie Sie das Schema abrufen, das für die Überprüfung von Datensätzen verwendet werden soll.

schema-branch

Gibt den Namen des Zweigs an, der beim Suchen des Schemas in der Eigenschaft „Schema Registry“ verwendet werden soll. Wenn die gewählte „Schema Registry“ keine Verzweigungen unterstützt, wird dieser Wert ignoriert.

schema-name

Gibt den Namen des Schemas an, das in der Eigenschaft Schema Registry gesucht werden soll.

schema-registry

Gibt den Controller Service an, der für die Schema Registry verwendet werden soll

schema-text

Der Text eines Avro-formatierten Schemas

schema-version

Gibt die Version des Schemas an, die in der Schema Registry gesucht werden soll. Wenn nicht angegeben, wird die neueste Version des Schemas abgerufen.

strict-type-checking

Wenn die eingehenden Daten einen Datensatz enthalten, bei dem ein Feld nicht vom richtigen Typ ist, bestimmt diese Eigenschaft, wie der Datensatz behandelt werden soll. Bei „true“ wird der Datensatz als ungültig betrachtet. Bei „false“ wird der Datensatz als gültig betrachtet und das Feld wird in den richtigen Typ umgewandelt (wenn möglich, gemäß der vom Record Writer unterstützten Typumwandlung). Diese Eigenschaft steuert, wie die Daten anhand des Validierungsschemas validiert werden.

validierung-details-attribut-name

Wenn angegeben, wird dieser Attributname verwendet, um die Details zu hinterlassen, wenn ein Validierungsfehler auftritt. Die Anzahl der Zeichen wird durch die Eigenschaft „Maximum Validation Details Length“ begrenzt.

Beziehungen

Name

Beschreibung

failure

Wenn die Datensätze aus irgendeinem Grund nicht gelesen, validiert oder geschrieben werden können, wird das OriginalFlowFile an diese Beziehung weitergeleitet.

invalid

Datensätze, die nach dem Schema nicht gültig sind, werden an diese Beziehung weitergeleitet.

gültig

Datensätze, die gemäß dem Schema gültig sind, werden an diese Beziehung weitergeleitet.

Schreibt Attribute

Name

Beschreibung

mime.type

Setzt das Attribut „mime.type“ auf den vom Record Writer angegebenen MIME-Typ

record.count

Die Anzahl der Datensätze im FlowFile, die an eine Beziehung weitergeleitet wurden