ListDropbox 2025.5.31.15

번들

org.apache.nifi | nifi-dropbox-processors-nar

설명

Dropbox에서 파일 목록을 검색합니다(바로 가기는 무시됨). 목록에 있는 각 파일은 FlowFile, 메타데이터는 FlowFile 특성으로 작성될 수 있습니다. ‘Record Writer’ 속성이 설정되면 전체 결과 세트가 단일 FlowFile 에 레코드로 기록됩니다. 이 프로세서는 클러스터의 기본 노드에서만 실행되도록 설계되었습니다. 기본 노드가 변경되면 새 기본 노드는 모든 데이터를 복제하지 않고 이전 노드가 중단한 부분을 이어받습니다.

태그

dropbox, storage

입력 요구 사항

FORBIDDEN

민감한 동적 속성 지원

false

속성

속성

설명

dropbox-credential-service

Dropbox 자격 증명(앱 키, 앱 시크릿, 액세스 토큰, 새로 고침 토큰)을 얻는 데 사용되는 컨트롤러 서비스입니다. 자세한 내용은 컨트롤러 서비스의 추가 세부 정보를 참조하십시오.

et-initial-listing-target

초기 목록 처리 방법을 지정합니다. ‘Tracking Entities’ 전략에서 사용됩니다.

et-state-cache

이 프로세서가 NiFi 재시작 또는 기본 노드 변경 시 목록을 재개할 수 있도록 지정된 캐시 저장소에 목록 엔터티가 저장됩니다. ‘Tracking Entities’ 전략은 마지막 ‘Tracking Time Window’ 내에 나열된 모든 엔터티의 추적 정보를 필요로 합니다. 많은 수의 엔터티를 지원하기 위해 이 전략에서는 관리 상태 대신 DistributedMapCache 를 사용합니다. 캐시 키 형식은 ‘ListedEntities::{processorId}(::{nodeId})’입니다. 노드 목록 엔터티별로 추적하는 경우 선택 사항인 ‘::{nodeId}’ 부분이 추가되어 상태를 별도로 관리합니다. 예: 클러스터 차원 캐시 키 = ‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b’, 노드별 캐시 키 = ‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3’저장된 캐시 콘텐츠는 Gzip으로 압축된 JSON 문자열입니다. 캐시 키는 대상 목록 구성이 변경되면 삭제됩니다. ‘Tracking Entities’ 전략에서 사용됩니다.

et-time-window

이 프로세서가 이미 목록에 있는 엔터티를 추적할 기간을 지정합니다. ‘Tracking Entities’ 전략은 타임스탬프가 지정된 시간 윈도우 내에 있는 엔터티를 선택할 수 있습니다. 예를 들어, ‘30분’으로 설정하면 이 프로세서가 실행될 때 최근 30분 내에 타임스탬프가 있는 모든 엔터티가 목록 대상이 됩니다. 목록에 있는 엔터티는 1. 이미 목록에 있는 엔터티에 존재하지 않거나, 2. 캐시된 엔터티보다 타임스탬프가 더 새롭거나, 3. 캐시된 엔터티와 크기가 다른 경우의 조건 중 하나를 충족하면 ‘신규/업데이트’로 간주되며 FlowFile 이 전송됩니다. 캐시된 엔터티의 타임스탬프가 지정된 시간 윈도우보다 오래되면 해당 엔터티는 캐시된 이미 목록에 있는 엔터티에서 제거됩니다. ‘Tracking Entities’ 전략에서 사용됩니다.

folder

파일 목록을 가져올 폴더의 Dropbox 식별자 또는 경로입니다. ‘폴더’는 /.*|id:.* 정규식 패턴과 일치해야 합니다. 폴더 식별자의 예: id:odTlUvbpIEAAAAAAAAAGGQ. 폴더 경로의 예: /Team1/Task1.

listing-strategy

신규/업데이트된 엔터티를 확인하는 방법을 지정합니다. 자세한 내용은 각 전략 설명을 참조하십시오.

최소 수명

파일이 고려되려면 최소 수명이 있어야 하며, 이보다 오래된 파일은 무시됩니다.

프록시 구성 서비스

네트워크 요청을 프록시할 프록시 구성 컨트롤러 서비스를 지정합니다.

record-writer

목록 작성에 사용할 Record Writer를 지정합니다. 지정하지 않으면 목록에 있는 각 엔터티에 대해 FlowFile 이 1개씩 생성됩니다. Record Writer를 지정하면 모든 엔터티는 개별 FlowFiles 에 특성을 추가하는 대신 단일 FlowFile 에 기록됩니다.

재귀 검색

Dropbox 폴더의 하위 폴더에 있는 파일을 목록에 표시할지 여부를 나타냅니다.

상태 관리

범위

설명

CLUSTER

프로세서는 어떤 파일이 이미 목록에 있는지 추적할 수 있도록 필요한 데이터를 저장합니다. 정확히 무엇을 저장해야 하는지는 ‘Listing Strategy’에 따라 다릅니다.

관계

이름

설명

성공

수신된 모든 FlowFiles 은 성공으로 라우팅됩니다

Writes 특성

이름

설명

dropbox.id

파일의 Dropbox 식별자

경로

파일이 위치한 폴더 경로입니다

파일 이름

파일 이름

dropbox.size

파일 크기

dropbox.timestamp

서버가 파일을 수정한 시간

dropbox.revision

파일 수정

참고 항목