ExtractAvroMetadata 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-avro-nar
Description¶
Extrait les métadonnées de l’en-tête d’un fichier de données Avro.
Exigences en matière d’entrées¶
REQUIRED
Prend en charge les propriétés dynamiques sensibles¶
false
Propriétés¶
Propriété |
Description |
---|---|
Compter les éléments |
Si c’est le cas, le nombre d’éléments du fichier de données sera compté et stocké dans l’attribut FlowFile item.count. Le comptage est effectué en lisant les blocs et en obtenant le nombre d’éléments pour chaque bloc, ce qui permet d’éviter la désérialisation. Les éléments pris en compte seront les éléments de premier niveau du fichier de données. Par exemple, pour un schéma de type enregistrement, les éléments seront les enregistrements, et pour un schéma de type Array, les éléments seront les tableaux (pas le nombre d’entrées dans chaque tableau). |
Algorithme d’empreinte |
L’algorithme utilisé pour générer l’empreinte du schéma. Les choix disponibles sont basés sur les pratiques recommandées par Avro pour la génération d’empreintes. |
Clés de métadonnées |
Une liste de clés séparées par des virgules indiquant les paires clé/valeur à extraire de l’en-tête du fichier Avro. La clé avro.schema peut être utilisée pour extraire le schéma complet au format JSON, et avro.codec peut être utilisée pour extraire le nom du codec s’il existe. |
Relations¶
Nom |
Description |
---|---|
failure |
Un FlowFile est routé vers cette relation s’il ne peut pas être analysé comme Avro ou si les métadonnées ne peuvent pas être extraites pour quelque raison que ce soit |
success |
Un FlowFile est routé vers cette relation après l’extraction des métadonnées. |
Écrit les attributs¶
Nom |
Description |
---|---|
schema.type |
Le type du schéma (c’est-à-dire enregistrement, enum, etc.). |
schema.name |
Contient le nom lorsque le type est un enregistrement, une énumération ou une correction, sinon contient le nom du type primitif. |
schema.fingerprint |
Le résultat de l’algorithme d’empreinte digitale sous la forme d’une chaîne hexadécimale. |
item.count |
Le nombre total d’éléments dans le fichier de données, qui n’est écrit que si l’option Compter les éléments est réglée sur true. |