ListAzureDataLakeStorage 2025.10.2.19

번들

org.apache.nifi | nifi-azure-nar

설명

Azure Data Lake Storage Gen 2 파일 시스템의 디렉터리 목록 표시

태그

adlsgen2, azure, cloud, datalake, microsoft, storage

입력 요구 사항

FORBIDDEN

민감한 동적 속성 지원

false

속성

속성

설명

ADLS Credentials

Azure 자격 증명을 얻는 데 사용되는 컨트롤러 서비스.

Directory Name

Azure Storage Directory 이름입니다. 디렉터리 이름에는 선행 ‘/’를 포함할 수 없습니다. 루트 디렉터리는 빈 문자열 값으로 지정할 수 있습니다. PutAzureDataLakeStorage 프로세서의 경우 디렉터리가 없는 경우 디렉터리가 생성됩니다.

File Filter

이름이 지정된 정규식과 일치하는 파일만 목록에 표시됩니다

Filesystem Name

Azure Storage 파일 시스템의 이름(컨테이너라고도 함)입니다. 이미 존재하는 것으로 가정합니다.

Include Temporary Files

구성된 디렉터리 경로의 내용을 나열할 때 임시 파일을 포함할지 여부입니다.

최대 파일 수명

파일을 가져올 수 있는 최대 기간으로, 이 기간보다 오래된 파일(마지막 수정 날짜 기준)은 무시됩니다

최대 파일 크기

파일을 가져올 수 있는 최대 크기입니다

최소 파일 보관 기간

파일을 가져오기 위해 필요한 최소 수명; 이보다 오래된 파일(마지막 수정 날짜 기준)은 무시됩니다

최소 파일 크기

파일을 가져오기 위해 필요한 최소 크기입니다

Path Filter

‘하위 디렉터리 재귀’가 true이면 경로가 지정된 정규식과 일치하는 하위 디렉터리만 검사합니다

Recurse Subdirectories

디렉터리의 하위 디렉터리에서 파일을 나열할지 여부를 나타냅니다

et-initial-listing-target

Specify how initial listing should be handled. Used by ‘Tracking Entities’strategy.

et-state-cache

Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. ‘Tracking Entities’strategy require tracking information of all listed entities within the last ‘Tracking Time Window’. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is ‘ListedEntities::{processorId}(::{nodeId})’. If it tracks per node listed entities, then the optional ‘::{nodeId}’ part is added to manage state separately. E.g. cluster wide cache key =’ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b’, per node cache key =’ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3’ The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by ‘Tracking Entities’strategy.

et-time-window

Specify how long this processor should track already-listed entities. ‘Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to ‘30 minutes’, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered ‘new/updated’ and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity ‘s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy.

listing-strategy

신규/업데이트된 엔터티를 확인하는 방법을 지정합니다. 자세한 내용은 각 전략 설명을 참조하십시오.

프록시 구성 서비스

네트워크 요청을 프록시할 프록시 구성 컨트롤러 서비스를 지정합니다. SOCKS 의 경우 선택한 SOCKS 버전이 프로세서에서 사용된다는 보장은 없습니다.

record-writer

목록 작성에 사용할 Record Writer를 지정합니다. 지정하지 않으면 목록에 있는 각 엔터티에 대해 FlowFile 이 1개씩 생성됩니다. Record Writer를 지정하면 모든 엔터티는 개별 FlowFiles 에 특성을 추가하는 대신 단일 FlowFile 에 기록됩니다.

상태 관리

범위

설명

CLUSTER

파일 목록 성능을 수행한 후 최신 파일의 타임스탬프가 저장됩니다. 이렇게 하면 프로세서가 다음에 프로세서를 실행할 때 이 날짜 이후에 추가되거나 수정된 파일만 목록에 표시할 수 있습니다. 상태는 클러스터 전체에 저장되므로 이 프로세서는 기본 노드에서만 실행될 수 있으며, 새로운 기본 노드가 선택되면 새 노드는 데이터를 복제하지 않고 이전 노드가 중단한 부분을 이어받을 수 있습니다.

관계

이름

설명

성공

수신된 모든 FlowFiles 은 성공으로 라우팅됩니다

Writes 특성

이름

설명

azure.filesystem

Azure 파일 시스템의 이름

azure.filePath

Azure 파일의 전체 경로

azure.directory

Azure 디렉터리 이름

azure.filename

Azure 파일 이름

azure.length

Azure 파일의 길이

azure.lastModified

Azure 파일의 마지막 수정 시간

azure.etag

Azure 파일의 ETag

참고 항목