ExtractAvroMetadata 2025.5.31.15

번들

org.apache.nifi | nifi-avro-nar

설명

Avro 데이터 파일의 헤더에서 메타데이터를 추출합니다.

태그

avro, metadata, schema

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

Count Items

true이면 데이터 파일의 항목 수가 카운트되어 FlowFile 특성 ‘item.count’에 저장됩니다. 카운팅은 블록을 읽고 각 블록의 항목 수를 가져오는 방식으로 이루어지므로 직렬화 해제를 피할 수 있습니다. 카운트되는 항목은 데이터 파일의 최상위 항목이 됩니다. 예를 들어, 레코드 유형의 스키마에서 항목은 레코드가 되고 배열 유형의 스키마에서 항목은 배열(각 배열의 항목 수 아님)이 됩니다.

Fingerprint Algorithm

스키마 지문을 생성하는 데 사용되는 알고리즘입니다. 사용 가능한 선택 항목은 지문 생성에 대한 Avro 권장 사례를 기반으로 합니다.

Metadata Keys

Avro 파일 헤더에서 추출할 키-값 페어를 나타내는 쉼표로 구분된 키 목록입니다. ‘avro.schema’ 키는 JSON 형식의 전체 스키마를 추출하는 데 사용할 수 있으며, ‘avro.codec’ 키는 코덱 이름이 있는 경우 코덱 이름을 추출하는 데 사용할 수 있습니다.

관계

이름

설명

실패

Avro로 구문 분석할 수 없거나 어떤 이유로든 메타데이터를 추출할 수 없는 경우 FlowFile 는 관계로 라우팅됩니다

성공

메타데이터가 추출된 후 FlowFile 은 이 관계로 라우팅됩니다.

Writes 특성

이름

설명

schema.type

스키마의 유형(예: 레코드, 열거형 등)입니다.

schema.name

타입이 레코드, 열거형 또는 수정됨인 경우 이름을 포함하며, 그렇지 않으면 기본 타입의 이름을 포함합니다.

schema.fingerprint

지문 알고리즘의 결과를 16진수 문자열로 표시합니다.

item.count

데이터 파일의 총 항목 수로, Count Items가 true로 설정된 경우에만 기록됩니다.