SplitAvro 2025.5.31.15

Bundle

org.apache.nifi | nifi-avro-nar

Description

Divise un fichier de données Avro codé en binaire en plusieurs fichiers plus petits en fonction de la taille de sortie configurée. La stratégie de sortie détermine si les fichiers plus petits seront des fichiers de données Avro ou d’enregistrements Avro bruts avec les métadonnées dans les attributs du FlowFile. La sortie sera toujours codée en binaire.

Balises

avro, split

Exigences en matière d’entrées

REQUIRED

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

Output Size

Nombre d’enregistrements Avro à inclure par fichier fractionné. Dans les cas où le fichier entrant contient moins d’enregistrements que la taille de sortie, ou lorsque le nombre total d’enregistrements n’est pas fractionné de manière égale par la taille de sortie, il est possible d’obtenir un fichier fractionné contenant moins d’enregistrements.

Output Strategy

Détermine le format de la sortie. Soit le fichier de données Avro, soit l’enregistrement brut. La sortie des enregistrements bruts n’est destinée qu’aux systèmes qui l’exigent déjà et ne devrait pas être nécessaire dans le cadre d’une utilisation normale.

Split Strategy

Stratégie de fractionnement du fichier de données entrant. La stratégie Record lit le fichier de données entrant en désérialisant chaque enregistrement.

Transfer Metadata

Transfert ou non des métadonnées du fichier de données parent vers les enfants. Si la stratégie de sortie est enregistrement brut, les métadonnées seront stockées en tant qu’attributs FlowFile, sinon elles seront stockées dans l’en-tête du fichier de données.

Relations

Nom

Description

failure

Si le traitement d’un FlowFile échoue pour une raison quelconque (par exemple, le FlowFile n’est pas un Avro valide), il sera routé vers cette relation

original

Le FlowFile d’origine qui a été fractionné. Si le traitement du FlowFile échoue, rien ne sera envoyé à cette relation

split

Tous les nouveaux fichiers fractionnés du FlowFile d’origine seront routés vers cette relation

Écrit les attributs

Nom

Description

fragment.identifier

Tous les FlowFiles produits à partir du même FlowFile parent auront le même UUID généré aléatoirement et ajouté pour cet attribut

fragment.index

Un numéro d’ordre qui indique l’ordre des FlowFiles fractionnés qui ont été créés à partir d’un seul FlowFile parent

fragment.count

Le nombre de FlowFiles fractionnés générés à partir du FlowFile parent

segment.original.filename

Le nom du FlowFile parent