ExtractAvroMetadata 2025.5.31.15

Pacote

org.apache.nifi | nifi-avro-nar

Descrição

Extrai metadados do cabeçalho de um arquivo de dados Avro.

Tags

avro, metadata, schema

Requisito de entrada

REQUIRED

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Itens de contagem

Se verdadeiro, o número de itens no arquivo de dados será contado e armazenado em um atributo FlowFile “item.count”. A contagem é feita por meio da leitura de blocos e da obtenção do número de itens de cada bloco, evitando assim a desserialização. Os itens que estão sendo contados serão os itens de nível superior no arquivo de dados. Por exemplo, com um esquema do tipo registro, os itens serão os registros, e para um esquema do tipo matriz, os itens serão as matrizes (não o número de entradas em cada matriz).

Algoritmo de impressão digital

O algoritmo usado para gerar a impressão digital do esquema. As opções disponíveis são baseadas nas práticas recomendadas pela Avro para a geração de impressões digitais.

Chaves de metadados

Uma lista de chaves separada por vírgulas que indica os pares chave-valor a serem extraídos do cabeçalho do arquivo Avro. A chave “avro.schema” pode ser usada para extrair o esquema completo no formato JSON, e “avro.codec” pode ser usada para extrair o nome do codec, se houver.

Relações

Nome

Descrição

failure

Um FlowFile é encaminhado para essa relação se não puder ser analisado como Avro ou se os metadados não puderem ser extraídos por qualquer motivo

success

Um FlowFile é encaminhado para essa relação depois que os metadados são extraídos.

Grava atributos

Nome

Descrição

schema.type

O tipo do esquema (ou seja, registro, enumeração etc.).

schema.name

Contém o nome quando o tipo é um registro, enumeração ou fixo; caso contrário, contém o nome do tipo primitivo.

schema.fingerprint

O resultado do algoritmo de impressão digital como uma cadeia de caracteres hexadecimal.

item.count

O número total de itens no arquivo de dados, gravado somente se Contar itens estiver definido como verdadeiro.