ExcelReader¶
설명¶
Parses a Microsoft Excel document returning each row in each sheet as a separate record. This reader allows for inferring a schema from all the required sheets or providing an explicit schema for interpreting the values. See Controller Service ‘s Usage for further documentation. This reader is capable of processing both password and non password protected .xlsx (XSSF 2007 OOXML file format) and older .xls (HSSF’97(-2007) file format) Excel documents.
속성¶
아래 목록에서 필수 속성에는 별표(*)가 표시되어 있습니다. 다른 속성은 선택 사항으로 간주됩니다. 이 테이블에는 기본값과 속성이 NiFi 식 언어를 지원하는지 여부도 표시됩니다.
표시 이름 |
API 이름 |
기본값 |
허용되는 값 |
설명 |
|---|---|---|---|---|
Date Format |
Date Format |
날짜 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 날짜 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정한 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 01/01/2017과 같이 두 자릿수의 월을 MM/d d/yyyy로 표시한 후, 두 자릿수의 일을 이어서 표시하고, 네 자릿수의 연도를 추가하며, 모든 숫자는 ‘/’ 기호로 구분됨)입니다. |
||
Input File Type * |
입력 파일 유형 |
XLSX |
|
Excel 입력 파일의 유형을 지정합니다. |
Password * |
비밀번호 |
비밀번호로 보호된 Excel 스프레드시트의 비밀번호 |
||
Protection Type * |
보호 유형 |
UNPROTECTED |
|
Excel 스프레드시트를 비밀번호로 보호할지 여부를 지정합니다. |
필수 시트 |
필수 시트 |
excel 문서에서 행을 추출해야 하는 excel 문서 시트 이름의 쉼표로 구분된 목록입니다. 이 속성을 비워두면 모든 시트의 모든 행이 Excel 문서에서 추출됩니다. 이름 목록은 대/소문자를 구분합니다. 이 값에 지정되지 않은 시트는 모두 무시됩니다. 지정된 시트를 찾을 수 없는 경우 예외가 throw됩니다. |
||
행 평가 전략 * |
행 평가 전략 |
STANDARD |
|
스키마를 결정하는 데 사용할 시작 행 이후의 행 수를 선택하는 전략입니다. |
Starting Row * |
시작 행 |
1 |
처리를 시작할 첫 번째 행의 행 번호입니다(1 기준). 데이터 세트의 일부가 아닌 워크시트 상단의 데이터 행을 건너뛰려면 이 기능을 사용하십시오. ‘Use Starting Row’ 전략을 사용하는 경우 이 행이 열 헤더 행이 되어야 합니다. |
|
시간 형식 |
시간 형식 |
시간 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 시간 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정하는 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 18:04:15와 같이 24시간 형식의 두 자리 시, 두 자리 분, 두 자리 초를 모두 ‘:’ 문자로 구분한 HH:mm:ss)입니다. |
||
타임스탬프 형식 |
타임스탬프 형식 |
타임스탬프 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 타임스탬프 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후 밀리초 수로 간주됩니다. 지정된 경우, 값은 Java java.time.format.DateTimeFormatter 형식입니다(예: MM/dd/yyyy HH:mm:ss는 두 자리의 월, 그 다음에 두 자리의 일, 그 다음에 네 자리의 연도이며, 모두 ‘/’ 문자로 구분됩니다. 01/01/2017 18:04:15와 같이 그 다음에는 24시간 형식의 두 자리의 시간이, 그 다음에 두 자리의 분, 그 다음에 두 자리의 초가 ‘:’ 문자로 구분되어 이어집니다). |
||
Schema Access Strategy * |
schema-access-strategy |
시작 행 사용 |
|
데이터 해석에 사용할 스키마를 가져오는 방법을 지정합니다. |
Schema Branch |
schema-branch |
Schema Registry 속성에서 스키마를 조회할 때 사용할 분기의 이름을 지정합니다. 선택한 Schema Registry가 분기를 지원하지 않는 경우 이 값은 무시됩니다. |
||
Schema Name |
schema-name |
${schema.name} |
Schema Registry 속성에서 조회할 스키마의 이름을 지정합니다 |
|
Schema Reference Reader * |
schema-reference-reader |
스키마 참조 식별자를 결정하기 위해 FlowFile 특성 또는 내용을 읽는 역할을 담당하는 서비스 구현 |
||
Schema Registry |
schema-registry |
Schema Registry에 사용할 컨트롤러 서비스를 지정합니다 |
||
Schema Text |
schema-text |
${avro.schema} |
Avro 형식의 스키마 텍스트 |
|
Schema Version |
schema-version |
Schema Registry에서 조회할 스키마 버전을 지정합니다. 지정하지 않으면 최신 버전의 스키마가 검색됩니다. |
상태 관리¶
이 구성 요소는 상태를 저장하지 않습니다.
제한됨¶
이 구성 요소는 제한되지 않습니다.
시스템 리소스 고려 사항¶
이 구성 요소는 시스템 리소스 고려 사항을 지정하지 않습니다.