ListBoxFile 2025.5.31.15

번들

org.apache.nifi | nifi-box-nar

설명

Box 폴더에 있는 파일을 목록으로 표시합니다. 목록에 있는 각 파일은 FlowFile, 메타데이터는 FlowFile 특성으로 작성될 수 있습니다. 또는 ‘Record Writer’ 속성이 설정된 경우 전체 결과가 단일 FlowFile 에 레코드로 기록됩니다. 이 프로세서는 클러스터의 기본 노드에서만 실행되도록 설계되었습니다. 기본 노드가 변경되면 새 기본 노드는 모든 데이터를 복제하지 않고 이전 노드가 중단한 부분을 이어받습니다.

태그

box, storage

입력 요구 사항

FORBIDDEN

민감한 동적 속성 지원

false

속성

속성

설명

box-client-service

Box API 연결을 얻는 데 사용되는 컨트롤러 서비스입니다.

box-folder-id

파일 목록을 가져올 폴더의 ID 입니다.

et-initial-listing-target

초기 목록 처리 방법을 지정합니다. ‘Tracking Entities’ 전략에서 사용됩니다.

et-state-cache

이 프로세서가 NiFi 재시작 또는 기본 노드 변경 시 목록을 재개할 수 있도록 지정된 캐시 저장소에 목록 엔터티가 저장됩니다. ‘Tracking Entities’ 전략은 마지막 ‘Tracking Time Window’ 내에 나열된 모든 엔터티의 추적 정보를 필요로 합니다. 많은 수의 엔터티를 지원하기 위해 이 전략에서는 관리 상태 대신 DistributedMapCache 를 사용합니다. 캐시 키 형식은 ‘ListedEntities::{processorId}(::{nodeId})’입니다. 노드 목록 엔터티별로 추적하는 경우 선택 사항인 ‘::{nodeId}’ 부분이 추가되어 상태를 별도로 관리합니다. 예: 클러스터 차원 캐시 키 = ‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b’, 노드별 캐시 키 = ‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3’저장된 캐시 콘텐츠는 Gzip으로 압축된 JSON 문자열입니다. 캐시 키는 대상 목록 구성이 변경되면 삭제됩니다. ‘Tracking Entities’ 전략에서 사용됩니다.

et-time-window

이 프로세서가 이미 목록에 있는 엔터티를 추적할 기간을 지정합니다. ‘Tracking Entities’ 전략은 타임스탬프가 지정된 시간 윈도우 내에 있는 엔터티를 선택할 수 있습니다. 예를 들어, ‘30분’으로 설정하면 이 프로세서가 실행될 때 최근 30분 내에 타임스탬프가 있는 모든 엔터티가 목록 대상이 됩니다. 목록에 있는 엔터티는 1. 이미 목록에 있는 엔터티에 존재하지 않거나, 2. 캐시된 엔터티보다 타임스탬프가 더 새롭거나, 3. 캐시된 엔터티와 크기가 다른 경우의 조건 중 하나를 충족하면 ‘신규/업데이트’로 간주되며 FlowFile 이 전송됩니다. 캐시된 엔터티의 타임스탬프가 지정된 시간 윈도우보다 오래되면 해당 엔터티는 캐시된 이미 목록에 있는 엔터티에서 제거됩니다. ‘Tracking Entities’ 전략에서 사용됩니다.

listing-strategy

신규/업데이트된 엔터티를 확인하는 방법을 지정합니다. 자세한 내용은 각 전략 설명을 참조하십시오.

최소 수명

파일이 고려되려면 최소 수명이 있어야 하며, 이 기간 미만의 파일은 무시됩니다.

record-writer

목록 작성에 사용할 Record Writer를 지정합니다. 지정하지 않으면 목록에 있는 각 엔터티에 대해 FlowFile 이 1개씩 생성됩니다. Record Writer를 지정하면 모든 엔터티는 개별 FlowFiles 에 특성을 추가하는 대신 단일 FlowFile 에 기록됩니다.

재귀 검색

‘true’인 경우 하위 폴더의 파일 목록을 포함합니다. 그렇지 않으면 ‘Folder ID’ 속성에 정의된 폴더 내에 있는 파일만 반환합니다.

상태 관리

범위

설명

CLUSTER

프로세서는 어떤 파일이 이미 목록에 있는지 추적할 수 있도록 필요한 데이터를 저장합니다. 정확히 무엇을 저장해야 하는지는 ‘Listing Strategy’에 따라 다릅니다.

관계

이름

설명

성공

수신된 모든 FlowFiles 은 성공으로 라우팅됩니다

Writes 특성

이름

설명

box.id

파일의 ID

파일 이름

파일 이름

경로

파일이 위치한 폴더 경로입니다

box.size

파일 크기

box.timestamp

파일의 마지막 수정 시간

참고 항목