ListDropbox 2025.10.2.19¶
번들¶
org.apache.nifi | nifi-dropbox-processors-nar
설명¶
Dropbox에서 파일 목록을 검색합니다(바로 가기는 무시됨). 목록에 있는 각 파일은 FlowFile, 메타데이터는 FlowFile 특성으로 작성될 수 있습니다. ‘Record Writer’ 속성이 설정되면 전체 결과 세트가 단일 FlowFile 에 레코드로 기록됩니다. 이 프로세서는 클러스터의 기본 노드에서만 실행되도록 설계되었습니다. 기본 노드가 변경되면 새 기본 노드는 모든 데이터를 복제하지 않고 이전 노드가 중단한 부분을 이어받습니다.
입력 요구 사항¶
FORBIDDEN
민감한 동적 속성 지원¶
false
속성¶
속성 |
설명 |
|---|---|
Dropbox Credential Service |
Dropbox 자격 증명(앱 키, 앱 시크릿, 액세스 토큰, 새로 고침 토큰)을 얻는 데 사용되는 컨트롤러 서비스입니다. 자세한 내용은 컨트롤러 서비스의 추가 세부 정보를 참조하십시오. |
Folder |
The Dropbox identifier or path of the folder from which to pull list of files. ‘Folder’should match the following regular expression pattern: /.*|id:.* . Example for folder identifier: id:odTlUvbpIEAAAAAAAAAGGQ. Example for folder path: /Team1/Task1. |
Minimum File Age |
파일이 고려되려면 최소 수명이 있어야 하며, 이보다 오래된 파일은 무시됩니다. |
Search Recursively |
Dropbox 폴더의 하위 폴더에 있는 파일을 목록에 표시할지 여부를 나타냅니다. |
et-initial-listing-target |
Specify how initial listing should be handled. Used by ‘Tracking Entities’strategy. |
et-state-cache |
Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. ‘Tracking Entities’strategy require tracking information of all listed entities within the last ‘Tracking Time Window’. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is ‘ListedEntities::{processorId}(::{nodeId})’. If it tracks per node listed entities, then the optional ‘::{nodeId}’ part is added to manage state separately. E.g. cluster wide cache key =’ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b’, per node cache key =’ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3’ The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by ‘Tracking Entities’strategy. |
et-time-window |
Specify how long this processor should track already-listed entities. ‘Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to ‘30 minutes’, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered ‘new/updated’ and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity ‘s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy. |
listing-strategy |
신규/업데이트된 엔터티를 확인하는 방법을 지정합니다. 자세한 내용은 각 전략 설명을 참조하십시오. |
프록시 구성 서비스 |
네트워크 요청을 프록시할 프록시 구성 컨트롤러 서비스를 지정합니다. |
record-writer |
목록 작성에 사용할 Record Writer를 지정합니다. 지정하지 않으면 목록에 있는 각 엔터티에 대해 FlowFile 이 1개씩 생성됩니다. Record Writer를 지정하면 모든 엔터티는 개별 FlowFiles 에 특성을 추가하는 대신 단일 FlowFile 에 기록됩니다. |
상태 관리¶
범위 |
설명 |
|---|---|
CLUSTER |
프로세서는 어떤 파일이 이미 목록에 있는지 추적할 수 있도록 필요한 데이터를 저장합니다. 정확히 무엇을 저장해야 하는지는 ‘Listing Strategy’에 따라 다릅니다. |
관계¶
이름 |
설명 |
|---|---|
성공 |
수신된 모든 FlowFiles 은 성공으로 라우팅됩니다 |
Writes 특성¶
이름 |
설명 |
|---|---|
dropbox.id |
파일의 Dropbox 식별자 |
경로 |
파일이 위치한 폴더 경로입니다 |
파일 이름 |
파일 이름 |
dropbox.size |
파일 크기 |
dropbox.timestamp |
서버가 파일을 수정한 시간 |
dropbox.revision |
파일 수정 |