ExcelReader¶
설명¶
Microsoft Excel 문서를 구문 분석하여 각 시트의 각 행을 별도의 레코드로 반환합니다. 이 리더를 사용하면 모든 필수 시트에서 스키마를 추론하거나 값을 해석하기 위한 명시적 스키마를 제공할 수 있으며, 자세한 설명서는 컨트롤러 서비스 사용법을 참조하십시오. 이 리더는 비밀번호 및 비밀번호로 보호되지 않는 .xlsx(XSSF 2007 OOXML 파일 형식) 및 이전 .xls(HSSF ‘97(-2007) 파일 형식) Excel 문서를 모두 처리할 수 있습니다.
속성¶
아래 목록에서 필수 속성에는 별표(*)가 표시되어 있습니다. 다른 속성은 선택 사항으로 간주됩니다. 이 테이블에는 기본값과 속성이 NiFi 식 언어를 지원하는지 여부도 표시됩니다.
표시 이름 |
API 이름 |
기본값 |
허용되는 값 |
설명 |
---|---|---|---|---|
Date Format |
Date Format |
날짜 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 날짜 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정한 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 01/01/2017과 같이 두 자릿수의 월을 MM/d d/yyyy로 표시한 후, 두 자릿수의 일을 이어서 표시하고, 네 자릿수의 연도를 추가하며, 모든 숫자는 ‘/’ 기호로 구분됨)입니다. |
||
Input File Type * |
입력 파일 유형 |
XLSX |
|
Excel 입력 파일의 유형을 지정합니다. |
Password * |
비밀번호 |
비밀번호로 보호된 Excel 스프레드시트의 비밀번호 |
||
Protection Type * |
보호 유형 |
UNPROTECTED |
|
Excel 스프레드시트를 비밀번호로 보호할지 여부를 지정합니다. |
필수 시트 |
필수 시트 |
excel 문서에서 행을 추출해야 하는 excel 문서 시트 이름의 쉼표로 구분된 목록입니다. 이 속성을 비워두면 모든 시트의 모든 행이 Excel 문서에서 추출됩니다. 이름 목록은 대/소문자를 구분합니다. 이 값에 지정되지 않은 시트는 모두 무시됩니다. 지정된 시트를 찾을 수 없는 경우 예외가 throw됩니다. |
||
Starting Row * |
시작 행 |
1 |
처리를 시작할 첫 번째 행의 행 번호입니다(1 기준). 데이터 세트의 일부가 아닌 워크시트 상단의 데이터 행을 건너뛰려면 이 기능을 사용하십시오. ‘Use Starting Row’ 전략을 사용하는 경우 이 행이 열 헤더 행이 되어야 합니다. |
|
시간 형식 |
시간 형식 |
시간 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 시간 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정하는 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 18:04:15와 같이 24시간 형식의 두 자리 시, 두 자리 분, 두 자리 초를 모두 ‘:’ 문자로 구분한 HH:mm:ss)입니다. |
||
타임스탬프 형식 |
타임스탬프 형식 |
타임스탬프 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 타임스탬프 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후 밀리초 수로 간주됩니다. 지정된 경우, 값은 Java java.time.format.DateTimeFormatter 형식입니다(예: MM/dd/yyyy HH:mm:ss는 두 자리의 월, 그 다음에 두 자리의 일, 그 다음에 네 자리의 연도이며, 모두 ‘/’ 문자로 구분됩니다. 01/01/2017 18:04:15와 같이 그 다음에는 24시간 형식의 두 자리의 시간이, 그 다음에 두 자리의 분, 그 다음에 두 자리의 초가 ‘:’ 문자로 구분되어 이어집니다). |
||
Schema Access Strategy * |
schema-access-strategy |
시작 행 사용 |
|
데이터 해석에 사용할 스키마를 가져오는 방법을 지정합니다. |
Schema Branch |
schema-branch |
Schema Registry 속성에서 스키마를 조회할 때 사용할 분기의 이름을 지정합니다. 선택한 Schema Registry가 분기를 지원하지 않는 경우 이 값은 무시됩니다. |
||
Schema Name |
schema-name |
${schema.name} |
Schema Registry 속성에서 조회할 스키마의 이름을 지정합니다 |
|
Schema Reference Reader * |
schema-reference-reader |
스키마 참조 식별자를 결정하기 위해 FlowFile 특성 또는 내용을 읽는 역할을 담당하는 서비스 구현 |
||
Schema Registry |
schema-registry |
Schema Registry에 사용할 컨트롤러 서비스를 지정합니다 |
||
Schema Text |
schema-text |
${avro.schema} |
Avro 형식의 스키마 텍스트 |
|
Schema Version |
schema-version |
Schema Registry에서 조회할 스키마 버전을 지정합니다. 지정하지 않으면 최신 버전의 스키마가 검색됩니다. |
상태 관리¶
이 구성 요소는 상태를 저장하지 않습니다.
제한됨¶
이 구성 요소는 제한되지 않습니다.
시스템 리소스 고려 사항¶
이 구성 요소는 시스템 리소스 고려 사항을 지정하지 않습니다.