ExtractAvroMetadata 2025.5.31.15

Bundle

org.apache.nifi | nifi-avro-nar

Description

Extrait les métadonnées de l’en-tête d’un fichier de données Avro.

Balises

avro, metadata, schema

Exigences en matière d’entrées

REQUIRED

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

Compter les éléments

Si c’est le cas, le nombre d’éléments du fichier de données sera compté et stocké dans l’attribut FlowFile item.count. Le comptage est effectué en lisant les blocs et en obtenant le nombre d’éléments pour chaque bloc, ce qui permet d’éviter la désérialisation. Les éléments pris en compte seront les éléments de premier niveau du fichier de données. Par exemple, pour un schéma de type enregistrement, les éléments seront les enregistrements, et pour un schéma de type Array, les éléments seront les tableaux (pas le nombre d’entrées dans chaque tableau).

Algorithme d’empreinte

L’algorithme utilisé pour générer l’empreinte du schéma. Les choix disponibles sont basés sur les pratiques recommandées par Avro pour la génération d’empreintes.

Clés de métadonnées

Une liste de clés séparées par des virgules indiquant les paires clé/valeur à extraire de l’en-tête du fichier Avro. La clé avro.schema peut être utilisée pour extraire le schéma complet au format JSON, et avro.codec peut être utilisée pour extraire le nom du codec s’il existe.

Relations

Nom

Description

failure

Un FlowFile est routé vers cette relation s’il ne peut pas être analysé comme Avro ou si les métadonnées ne peuvent pas être extraites pour quelque raison que ce soit

success

Un FlowFile est routé vers cette relation après l’extraction des métadonnées.

Écrit les attributs

Nom

Description

schema.type

Le type du schéma (c’est-à-dire enregistrement, enum, etc.).

schema.name

Contient le nom lorsque le type est un enregistrement, une énumération ou une correction, sinon contient le nom du type primitif.

schema.fingerprint

Le résultat de l’algorithme d’empreinte digitale sous la forme d’une chaîne hexadécimale.

item.count

Le nombre total d’éléments dans le fichier de données, qui n’est écrit que si l’option Compter les éléments est réglée sur true.