ExtractAvroMetadata 2025.5.31.15

Bundle

org.apache.nifi | nifi-avro-nar

Beschreibung

Extrahiert Metadaten aus dem Header einer Avro-Datendatei.

Tags

avro, metadata, schema

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

Count Items

Bei „true“ wird die Anzahl der Elemente in der Datendatei gezählt und in einem FlowFile-Attribut „item.count“ gespeichert. Die Zählung erfolgt durch Lesen von Blöcken und Ermitteln der Anzahl der Elemente pro Block, wodurch eine Deserialisierung vermieden wird. Die zu zählenden Elemente sind die Elemente der obersten Ebene in der Datendatei. Bei einem Schema vom Typ „Datensatz“ sind die Elemente beispielsweise die Datensätze, bei einem Schema vom Typ „Array“ sind die Elemente die Arrays (nicht die Anzahl der Einträge in jedem Array).

Fingerprint Algorithm

Der Algorithmus, der zur Erzeugung des Schema-Fingerabdrucks verwendet wird. Die Auswahlmöglichkeiten basieren auf den von Avro empfohlenen Verfahren zur Erstellung von Fingerabdrücken.

Metadata Keys

Eine durch Kommas getrennte Liste von Schlüsseln, die Schlüssel-Wert-Paare angeben, die aus dem Avro-Datei-Header extrahiert werden sollen. Der Schlüssel „avro.schema“ kann verwendet werden, um das vollständige Schema im JSON-Format zu extrahieren, und „avro.codec“ kann verwendet werden, um den Codec-Namen zu extrahieren, falls vorhanden.

Beziehungen

Name

Beschreibung

failure

Ein FlowFile wird an diese Beziehung weitergeleitet, wenn es nicht als Avro geparst werden kann oder Metadaten aus irgendeinem Grund nicht extrahiert werden können.

success

Ein FlowFile wird an diese Beziehung weitergeleitet, nachdem die Metadaten extrahiert wurden.

Schreibt Attribute

Name

Beschreibung

schema.type

Der Typ des Schemas (d. h. Datensatz, Enum usw.).

schema.name

Enthält den Namen, wenn der Typ ein Datensatz, eine Aufzählung oder ein fester Wert ist, andernfalls enthält er den Namen des primitiven Typs.

schema.fingerprint

Das Ergebnis des Fingerabdruck-Algorithmus als Hexadezimalzeichenfolge.

item.count

Die Gesamtzahl der Elemente in der Datendatei, wird nur geschrieben, wenn Count Items auf „true“ gesetzt ist.