MergeContent 2025.5.31.15

번들

org.apache.nifi | nifi-standard-nar

설명

사용자 정의 전략에 따라 FlowFiles 그룹을 병합하여 단일 FlowFile 로 패키지화합니다. FlowFiles 그룹은 다른 연결의 FlowFiles 에서 생성되지 않으므로 수신 연결이 하나만 있는 프로세서를 구성하는 것이 좋습니다. 이 프로세서는 mime.type 특성을 적절히 업데이트합니다. 참고: 이 프로세서는 Scheduling Strategy에 대해 cron 구동으로 구성되지 않아야 합니다.

태그

archive, concatenation, content, correlation, flowfile-stream, flowfile-stream-v3, merge, stream, tar, zip

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

Attribute Strategy

번들에 추가할 FlowFile 특성을 결정합니다. ‘Keep All Unique Attributes’를 선택하면 번들로 제공되는 FlowFile 의 모든 특성은 해당 값이 다른 FlowFile 의 값과 충돌하지 않는 한 유지됩니다. ‘Keep Only Common Attributes’를 선택하면 번들의 모든 FlowFiles 에 동일한 값으로 존재하는 특성만 보존됩니다.

빈 종료 확인

각 FlowFile 에 대해 평가될 식 언어를 지정합니다. 식의 결과가 ‘true’이면 해당 빈이 최소 항목 수 또는 최소 크기를 충족하지 않더라도 FlowFile 에 해당하는 빈이 종료되며, 빈의 종료를 트리거하는 FlowFile 자체가 최대 빈 크기보다 큰 경우 다른 빈의 종료를 트리거하지 않고 자체 빈에 배치됩니다. 이 속성을 사용할 때는 플로우의 연결에서 우선순위 지정자를 사용하여 원하는 대로 순서를 지정하는 것이 좋습니다.

압축 수준

우편 병합 형식을 사용할 때 사용할 압축 수준을 지정합니다. 우편 병합 형식을 사용하지 않는 경우 이 값은 무시됩니다

상관관계 특성 이름

지정한 경우 ‘like FlowFiles’는 함께 묶이며, 여기서 ‘like FlowFiles’는 이 특성의 값이 동일한 FlowFiles 을 의미합니다. 지정하지 않으면 FlowFiles 이 큐에서 가져온 순서대로 번들링됩니다.

Delimiter Strategy

헤더, 푸터, 구분 기호가 각 내용이 포함된 파일을 가리킬지, 아니면 속성의 값을 내용으로 사용할지 결정합니다.

구분 기호 파일

파일 이름 또는 사용할 구분선을 지정하는 텍스트입니다. 지정하지 않으면 구분 기호가 제공되지 않습니다.

FlowFile Insertion Strategy

지정된 <Bin Termination Check> 속성에 따라 FlowFile 이 빈을 종료하는 경우 FlowFile 이 빈에 포함될 위치를 지정합니다.

푸터 파일

사용할 푸터를 지정하는 파일 이름 또는 텍스트입니다. 지정하지 않으면 푸터가 제공되지 않습니다.

헤더 파일

파일 이름 또는 사용할 헤더를 지정하는 텍스트입니다. 지정하지 않으면 헤더가 제공되지 않습니다.

경로 유지

Zip 또는 Tar 병합 형식을 사용하는 경우 항목 이름에 FlowFiles 의 경로를 포함할지 여부를 지정합니다.

최대 빈 수명

빈이 완료되도록 트리거하는 빈의 최대 보관 기간입니다. 예상 형식은 <기간> <시간 단위>이며, 여기서 <기간> 은 양의 정수이고 시간 단위는 초, 분, 시간 중 하나입니다

최대 그룹 크기

번들의 최대 크기입니다. 지정하지 않으면 최대값이 없습니다.

최대 항목 수

번들에 포함할 수 있는 최대 파일 수

최대 보관함 수

한 번에 메모리에 보관할 수 있는 최대 빈 수를 지정합니다

병합 형식

내용을 병합하는 데 사용할 형식을 결정합니다.

Merge Strategy

내용 병합에 사용되는 알고리즘을 지정합니다. ‘Defragment’ 알고리즘은 특성별로 연관된 조각을 다시 1개의 응집력 있는 FlowFile 로 결합합니다. ‘빈 패킹 알고리즘’은 임의로 선택한 FlowFile 로 채워진 FlowFiles

최소 그룹 크기

번들의 최소 크기

최소 항목 수

번들에 포함할 최소 파일 수

Tar 수정 시간

Tar 병합 형식을 사용하는 경우, Tar 항목에 수정된 타임스탬프를 식(예: ${file.lastModifiedTime} 또는 정적 값)으로 저장할지 여부를 지정합니다(둘 다 ISO8601 형식 ‘yyyy-MM-dd’T’HH:mm:ssZ’와 일치해야 함).

mergecontent-metadata-strategy

입력 형식이 메타데이터를 지원하는 FlowFiles (예: Avro)의 경우 이 속성에 따라 번들에 추가할 메타데이터가 결정됩니다. ‘첫 번째 메타데이터 사용’을 선택하면 번들링할 첫 번째 FlowFile 의 메타데이터 키/값이 사용됩니다. ‘공통 메타데이터만 유지’를 선택하면 번들에 있는 모든 FlowFiles 에 동일한 값으로 존재하는 메타데이터만 보존됩니다. ‘메타데이터 무시’를 선택하면 발신 번들 FlowFile 로 메타데이터가 전송되지 않습니다. ‘공통되지 않은 메타데이터 병합 안 함’을 선택하면 메타데이터 값이 처음 번들된 FlowFile 의 메타데이터 값과 일치하지 않는 FlowFile 은 병합되지 않습니다.

관계

이름

설명

실패

번들을 생성할 수 없는 경우 번들을 생성하는 데 사용되었던 모든 FlowFiles 은 이 실패로 변환됩니다

병합

병합된 내용을 포함하는 FlowFile

원본

번들 생성에 사용되는 FlowFiles

Writes 특성

이름

설명

파일 이름

2개 이상의 파일이 병합될 경우, 파일 이름은 segment.original.filename 특성에서 가져옵니다. 해당 특성이 소스 FlowFiles 에 존재하지 않으면 파일 이름이 시스템 시간과 일치하는 나노초 수로 설정됩니다. 병합 형식이 TAR 인 경우 파일 이름에 .tar가 추가되고, 병합 형식이 ZIP 인 경우 파일 이름에 .zip이 추가되며, 병합 형식이 FlowFileStream 인 경우 파일 이름에 .pkg가 추가됩니다

merge.count

이 번들에 병합된 FlowFiles 의 수입니다

merge.bin.age

병합되어 출력된 빈의 수명(밀리초 단위)입니다. 실제로 이것은 이 번들의 FlowFile 이 출력되기 전에 이 프로세서에서 대기한 가장 긴 시간입니다

merge.uuid

UUID 를 병합된 플로우 파일의 원래 플로우 파일 특성에 추가할 수 있습니다.

merge.reason

이 프로세서를 사용하면 FlowFiles 병합을 위해 여러 임계값을 구성할 수 있습니다. 이 특성은 임계값 중 어떤 임계값으로 인해 FlowFiles 이 병합되었는지를 나타냅니다. 사용 가능한 각 값과 그 의미에 대한 설명은 프로세서의 사용법/설명서를 참조하고 ‘추가 세부 정보’ 페이지를 참조하십시오.

사용 사례

FlowFiles 을 텍스트 내용와 함께 연결하여 더 작고 큰 FlowFiles 을 생성할 수 있습니다.

FlowFiles 과 이진 내용을 함께 연결하여 더 적은 수의 크기가 큰 FlowFiles 을 생성합니다.

이전에 SplitText, UnpackContext, SplitRecord 등과 같은 프로세서에 의해 분할된 FlowFile 을 더 작은 FlowFiles 로 재조립합니다.

참고 항목