ExtractAvroMetadata 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-avro-nar
Beschreibung¶
Extrahiert Metadaten aus dem Header einer Avro-Datendatei.
Eingabeanforderung¶
REQUIRED
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
Count Items |
Bei „true“ wird die Anzahl der Elemente in der Datendatei gezählt und in einem FlowFile-Attribut „item.count“ gespeichert. Die Zählung erfolgt durch Lesen von Blöcken und Ermitteln der Anzahl der Elemente pro Block, wodurch eine Deserialisierung vermieden wird. Die zu zählenden Elemente sind die Elemente der obersten Ebene in der Datendatei. Bei einem Schema vom Typ „Datensatz“ sind die Elemente beispielsweise die Datensätze, bei einem Schema vom Typ „Array“ sind die Elemente die Arrays (nicht die Anzahl der Einträge in jedem Array). |
Fingerprint Algorithm |
Der Algorithmus, der zur Erzeugung des Schema-Fingerabdrucks verwendet wird. Die Auswahlmöglichkeiten basieren auf den von Avro empfohlenen Verfahren zur Erstellung von Fingerabdrücken. |
Metadata Keys |
Eine durch Kommas getrennte Liste von Schlüsseln, die Schlüssel-Wert-Paare angeben, die aus dem Avro-Datei-Header extrahiert werden sollen. Der Schlüssel „avro.schema“ kann verwendet werden, um das vollständige Schema im JSON-Format zu extrahieren, und „avro.codec“ kann verwendet werden, um den Codec-Namen zu extrahieren, falls vorhanden. |
Beziehungen¶
Name |
Beschreibung |
---|---|
failure |
Ein FlowFile wird an diese Beziehung weitergeleitet, wenn es nicht als Avro geparst werden kann oder Metadaten aus irgendeinem Grund nicht extrahiert werden können. |
success |
Ein FlowFile wird an diese Beziehung weitergeleitet, nachdem die Metadaten extrahiert wurden. |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
schema.type |
Der Typ des Schemas (d. h. Datensatz, Enum usw.). |
schema.name |
Enthält den Namen, wenn der Typ ein Datensatz, eine Aufzählung oder ein fester Wert ist, andernfalls enthält er den Namen des primitiven Typs. |
schema.fingerprint |
Das Ergebnis des Fingerabdruck-Algorithmus als Hexadezimalzeichenfolge. |
item.count |
Die Gesamtzahl der Elemente in der Datendatei, wird nur geschrieben, wenn Count Items auf „true“ gesetzt ist. |