CountText 2025.5.31.15

번들

org.apache.nifi | nifi-standard-nar

설명

수신 텍스트에 대한 다양한 메트릭을 계산합니다. 요청된 결과는 특성으로 기록됩니다. 결과 flowfile의 내용은 수정되지 않습니다.

태그

character, count, line, text, word

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

ajust-immediately

true이면, 카운터는 ProcessSession 이 커밋되었는지 또는 롤백되었는지와 관계없이 즉시 업데이트됩니다. 그렇지 않으면, 카운터는 ProcessSession 이 커밋되었을 때만 증가됩니다.

character-encoding

사용할 문자 인코딩을 지정합니다.

split-words-on-symbols

단어 수를 활성화하면 일반적인 논리 구분 기호[ _ - . ]로 구분된 문자열을 독립된 단어로 식별합니다(예: split-words-on-symbols = 4단어).

text-character-count

활성화하면 수신 텍스트에 있는 문자 수(공백 및 기호 포함, 개행 및 캐리지 리턴 제외)를 계산합니다.

text-line-count

활성화하면 수신 텍스트에 있는 줄 수를 계산합니다.

text-line-nonempty-count

활성화하면 수신 텍스트에 공백이 아닌 문자가 포함된 줄 수를 계산합니다.

text-word-count

활성화하면 수신 텍스트에 있는 단어(공백으로 묶인 영숫자 문자 그룹)의 개수를 계산합니다. ‘Split Words on Symbols’이 true로 설정되어 있지 않으면 일반적인 논리 구분 기호 [_-.]는 단어를 구분하지 않습니다.

관계

이름

설명

실패

어떤 이유로 flowfile 텍스트를 계산할 수 없는 경우 원본 파일은 이 대상으로 라우팅되고 다른 곳으로 라우팅되지 않습니다

성공

flowfile에는 원본 내용에 각 카운트가 포함된 1개 이상의 특성이 추가된 원본 내용이 포함됩니다

Writes 특성

이름

설명

text.line.count

FlowFile 내용에 있는 텍스트 줄 수입니다

text.line.nonempty.count

원본 FlowFile 에 있는 텍스트 줄 수(공백이 아닌 문자가 1개 이상 포함됨)입니다.

text.word.count

원본 FlowFile 에 존재하는 단어 수

text.character.count

원본 FlowFile 에 존재하는 문자 수(지정된 문자 인코딩이 주어짐)입니다.

참고 항목