RouteText 2025.5.31.15¶
번들¶
org.apache.nifi | nifi-standard-nar
설명¶
사용자가 정의한 규칙 세트를 기반으로 텍스트 데이터를 라우팅합니다. 수신 FlowFile 의 각 라인은 사용자 정의 속성에 지정된 값과 비교됩니다. 텍스트가 이러한 사용자 정의 속성과 비교되는 메커니즘은 ‘Matching Strategy’에 의해 정의됩니다. 그런 다음 데이터는 이러한 규칙에 따라 라우팅되어 텍스트의 각 라인을 개별적으로 라우팅합니다.
입력 요구 사항¶
REQUIRED
민감한 동적 속성 지원¶
false
속성¶
속성 |
설명 |
---|---|
문자 세트 |
수신 텍스트가 인코딩되는 문자 세트입니다 |
정규식 그룹화하기 |
각 라인에 대해 평가할 정규식을 지정하여 라인을 어느 그룹에 배치할지 결정합니다. 정규식에는 라인의 그룹을 정의하는 캡쳐 그룹이 1개 이상 있어야 합니다. 정규식에 여러 개의 캡처 그룹이 존재하는 경우 모든 캡처 그룹의 값이 함께 연결됩니다. 두 라인이 모두 그룹에 대해 동일한 값을 갖지 않는 한(또는 두 라인이 모두 정규식과 일치하지 않는 한) 동일한 FlowFile 에 배치되지 않습니다. 예를 들어, CSV 파일의 모든 라인을 첫 번째 열로 그룹화하려면 이 값을 “(.*?),.*”로 설정하면 됩니다. 그룹은 같지만 관계가 다른 두 라인은 절대로 같은 FlowFile 에 배치되지 않습니다. |
대/소문자 무시 |
true이면 값을 비교할 때 대/소문자를 고려하지 않습니다. 예를 들어, ‘HELLO’ 또는 ‘hello’와 일치해도 결과는 동일합니다. ‘Matching Strategy’이 ‘Satisfies Expression’으로 설정된 경우 이 속성은 무시됩니다. |
선행/후행 공백 무시하기 |
라인을 평가할 때 라인의 시작과 끝의 공백을 무시할지 여부를 나타냅니다. |
Matching Strategy |
수신 텍스트의 각 라인을 사용자 정의 속성에 대해 평가하는 방법을 지정합니다. |
Routing Strategy |
‘Matching Strategy’ 및 사용자 정의 속성에 대해 입력 텍스트 라인을 평가할 때 사용할 관계를 결정하는 방법을 지정합니다. |
관계¶
이름 |
설명 |
---|---|
원본 |
라인이 1개 이상의 관계로 성공적으로 라우팅된 경우 원본 입력 파일은 이 대상으로 라우팅됩니다 |
unmatched |
필수 사용자 정의 규칙을 충족하지 않는 데이터는 이 관계로 라우팅됩니다 |
Writes 특성¶
이름 |
설명 |
---|---|
RouteText.Route |
FlowFile 이 라우팅된 관계의 이름입니다. |
RouteText.Group |
‘Grouping Regular Expression’ 속성의 모든 캡처 그룹에서 수집한 값입니다. 이 속성이 설정되어 있지 않거나 캡처 그룹이 없는 경우 이 특성은 추가되지 않습니다. |
사용 사례¶
FlowFile 의 내용에서 공백 또는 빈 라인을 삭제합니다. |
특정 단어가 포함되어 있거나 라인 길이가 특정 임계값을 초과하는 등 파일에서 특정 텍스트 라인을 제거합니다. |