ValidateCsv 2025.5.31.15

Bundle

org.apache.nifi | nifi-standard-nar

Description

Valide le contenu des FlowFiles ou une valeur d’attribut de FlowFile par rapport à un schéma CSV spécifié par l’utilisateur. Consultez la documentation complémentaire de ce processeur pour obtenir des exemples de schémas.

Balises

csv, schema, validation

Exigences en matière d’entrées

REQUIRED

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

Attribut de la source CSV

Le nom de l’attribut contenant les données CSV à valider. Si cette propriété est vide, le contenu de FlowFile sera validé.

validate-csv-delimiter

Caractère utilisé comme “delimiter” dans les données entrantes. Exemple : ,

validate-csv-eol

Symboles utilisés comme “end of line” dans les données entrantes. Exemple : n

validate-csv-header

True si le FlowFile entrant contient un en-tête à ignorer, false sinon.

validate-csv-quote

Caractère utilisé comme “quote” dans les données entrantes. Exemple :

validate-csv-schema

Le schéma à utiliser pour la validation. Est attendue une chaîne délimitée par des virgules représentant les processeurs de cellules à appliquer. Les processeurs de cellules suivants sont autorisés dans la définition du schéma : [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Facultatif, DMinMax, Égal, ForbidSubStr, LMinMax, NotNull, Nul, RequireHashCode, RequireSubStr, Étranglé, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn]. Remarque : les processeurs cellulaires ne peuvent pas être imbriqués, sauf avec Optional. Le schéma est une exigence si l’en-tête est faux.

validate-csv-strategy

Stratégie à appliquer lors du routage des fichiers d’entrée vers les relations de sortie.

validate-csv-violations

Si c’est le cas, l’attribut validation.error.message inclura la liste de toutes les violations pour la première ligne invalide. Notez que le fait de paramétrer cette propriété à true diminuerait légèrement les performances car toutes les colonnes seraient validées. Si false, une ligne est invalide dès qu’une colonne viole la contrainte spécifiée et seule cette violation pour la première ligne invalide sera incluse dans l’attribut validation.error.message.

Relations

Nom

Description

invalid

Les FlowFiles non valides selon le schéma spécifié, ou lorsqu’aucun schéma ou CSV en-tête ne peut être identifié, sont routés vers cette relation.

valid

Les FlowFiles validés avec succès par rapport au schéma sont routés vers cette relation.

Écrit les attributs

Nom

Description

count.valid.lines

Si validation ligne par ligne, nombre de lignes valides extraites des données sources

count.invalid.lines

Si validation ligne par ligne, nombre de lignes non valides extraites des données sources

count.total.lines

Si validation ligne par ligne, nombre total de lignes dans les données source

validation.error.message

Pour les fichiers de flux routés vers l’invalidité, message de la première erreur de validation