ValidateCsv 2025.5.31.15

번들

org.apache.nifi | nifi-standard-nar

설명

FlowFiles 또는 FlowFile 특성 값의 내용을 사용자가 지정한CSV스키마와 비교하여 유효성을 검사합니다. 스키마 예시는 이 프로세서의 추가 설명서를 참조하십시오.

태그

csv, schema, validation

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

CSV 소스 특성

유효성을 검사할 CSV 데이터가 포함된 특성의 이름입니다. 이 속성이 비어 있으면 FlowFile 내용의 유효성이 검사됩니다.

validate-csv-delimiter

수신 데이터에서 ‘구분 기호’로 사용되는 문자입니다. 예: ,

validate-csv-eol

수신 데이터에서 ‘라인의 끝’으로 사용되는 기호입니다. 예: n

validate-csv-header

수신 플로우 파일에 무시할 헤더가 포함되어 있으면 true이고, 그렇지 않으면 false입니다.

validate-csv-quote

수신 데이터에서 ‘따옴표’로 사용되는 문자입니다. 예: “

validate-csv-schema

유효성 검사에 사용할 스키마입니다. 적용할 셀 프로세서를 나타내는 쉼표로 구분된 문자열로 예상됩니다. 스키마 정의에서 허용되는 셀 프로세서는 [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Optional, DMinMax, Equals, ForbidSubStr, LMinMax, NotNull, Null, RequireHashCode, RequireSubStr, Strlen, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn]입니다. 참고: 셀 프로세서는 선택 사항을 제외하고는 중첩할 수 없습니다. 헤더가 false인 경우 스키마가 필수입니다.

validate-csv-strategy

입력 파일을 출력 관계로 라우팅할 때 적용할 전략입니다.

validate-csv-violations

true이면 validation.error.message 특성에 첫 번째 유효하지 않은 라인에 대한 모든 위반 목록이 포함됩니다. 이 속성을 true로 설정하면 모든 열의 유효성이 검사되므로 성능이 약간 저하될 수 있습니다. false면 지정된 제약 조건을 위반하는 열이 발견되는 즉시 해당 행이 유효하지 않으며 첫 번째 유효하지 않은 행에 대한 이 위반 사항만 validation.error.message 특성에 포함됩니다.

관계

이름

설명

invalid

지정된 스키마에 따라 유효하지 않거나 스키마 또는 CSV 헤더를 식별할 수 없는 FlowFiles 은 이 관계로 라우팅됩니다

유효

스키마에 대해 성공적으로 유효성이 검사된 FlowFiles 은 이 관계로 라우팅됩니다

Writes 특성

이름

설명

count.valid.lines

라인 단위 유효성 검사인 경우 소스 데이터에서 추출된 유효한 라인 수

count.invalid.lines

라인 단위 유효성 검사의 경우, 소스 데이터에서 추출된 유효하지 않은 라인 수

count.total.lines

라인 단위 유효성 검사인 경우 소스 데이터의 총 라인 수

validation.error.message

유효하지 않은 것으로 라우팅된 플로우 파일의 경우 첫 번째 유효성 검사 오류 메시지