ExcelReader¶

설명¶

각 시트의 각 행을 별도의 레코드로 반환하는 Microsoft Excel 문서를 구문 분석합니다. 이 판독기를 사용하면 필요한 모든 시트에서 스키마를 추론하거나 값을 해석하기 위한 명시적 스키마를 제공할 수 있습니다. 자세한 설명서는 컨트롤러 서비스의 사용법을 참조하세요. 이 판독기는 비밀번호로 보호되거나 비밀번호로 보호되지 않은 .xlsx(XSSF 2007 OOXML파일 형식) 및 이전 .xls(HSSF 97(-2007) 파일 형식) Excel 문서를 모두 처리할 수 있습니다.

태그¶

cell, excel, parse, reader, record, row, spreadsheet, values, xls, xlsx

속성¶

아래 목록에서 필수 속성에는 별표(*)가 표시되어 있습니다. 다른 속성은 선택 사항으로 간주됩니다. 이 테이블에는 기본값과 속성이 NiFi 식 언어를 지원하는지 여부도 표시됩니다.


표시 이름	API 이름	기본값	허용되는 값	설명
Date Format	Date Format			날짜 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 날짜 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정한 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 01/01/2017과 같이 두 자릿수의 월을 MM/d d/yyyy로 표시한 후, 두 자릿수의 일을 이어서 표시하고, 네 자릿수의 연도를 추가하며, 모든 숫자는 ‘/’ 기호로 구분됨)입니다.
Input File Type *	입력 파일 유형	XLSX	XLS XLSX	Excel 입력 파일의 유형을 지정합니다.
Password *	비밀번호			비밀번호로 보호된 Excel 스프레드시트의 비밀번호
Protection Type *	보호 유형	UNPROTECTED	Unprotected Password Protected	Excel 스프레드시트를 비밀번호로 보호할지 여부를 지정합니다.
필수 시트	필수 시트			excel 문서에서 행을 추출해야 하는 excel 문서 시트 이름의 쉼표로 구분된 목록입니다. 이 속성을 비워두면 모든 시트의 모든 행이 Excel 문서에서 추출됩니다. 이름 목록은 대/소문자를 구분합니다. 이 값에 지정되지 않은 시트는 모두 무시됩니다. 지정된 시트를 찾을 수 없는 경우 예외가 throw됩니다.
행 평가 전략 *	행 평가 전략	STANDARD	표준 모든 행	스키마를 결정하는 데 사용할 시작 행 이후의 행 수를 선택하는 전략입니다.
Schema Access Strategy *	Schema Access Strategy	시작 행 사용	‘Schema Name’ 속성 사용 ‘Schema Text’ 속성 사용 Schema Reference Reader 시작 행 사용 Infer Schema	데이터 해석에 사용할 스키마를 가져오는 방법을 지정합니다.
Schema Branch	Schema Branch			Schema Registry 속성에서 스키마를 조회할 때 사용할 분기의 이름을 지정합니다. 선택한 Schema Registry가 분기를 지원하지 않는 경우 이 값은 무시됩니다.
Schema Name	Schema Name	${schema.name}		Schema Registry 속성에서 조회할 스키마의 이름을 지정합니다
Schema Reference Reader *	Schema Reference Reader			스키마 참조 식별자를 결정하기 위해 FlowFile 특성 또는 내용을 읽는 역할을 담당하는 서비스 구현
Schema Registry	Schema Registry			Schema Registry에 사용할 컨트롤러 서비스를 지정합니다
Schema Text	Schema Text	${avro.schema}		Avro 형식의 스키마 텍스트
Schema Version	Schema Version			Schema Registry에서 조회할 스키마 버전을 지정합니다. 지정하지 않으면 최신 버전의 스키마가 검색됩니다.
Starting Row *	시작 행	1		처리를 시작할 첫 번째 행의 행 번호입니다(1 기준). 데이터 세트의 일부가 아닌 워크시트 상단의 데이터 행을 건너뛰려면 이 기능을 사용하십시오. ‘Use Starting Row’ 전략을 사용하는 경우 이 행이 열 헤더 행이 되어야 합니다.
시간 형식	시간 형식			시간 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 시간 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후의 밀리초 수로 간주됩니다. 지정하는 경우 값은 Java java.time.format과 일치해야 합니다. DateTimeFormatter 형식(예: 18:04:15와 같이 24시간 형식의 두 자리 시, 두 자리 분, 두 자리 초를 모두 ‘:’ 문자로 구분한 HH:mm:ss)입니다.
타임스탬프 형식	타임스탬프 형식			타임스탬프 필드를 읽거나 쓸 때 사용할 형식을 지정합니다. 지정하지 않으면 타임스탬프 필드는 epoch(1970년 1월 1일 자정, GMT 시간) 이후 밀리초 수로 간주됩니다. 지정된 경우, 값은 Java java.time.format.DateTimeFormatter 형식입니다(예: MM/dd/yyyy HH:mm:ss는 두 자리의 월, 그 다음에 두 자리의 일, 그 다음에 네 자리의 연도이며, 모두 ‘/’ 문자로 구분됩니다. 01/01/2017 18:04:15와 같이 그 다음에는 24시간 형식의 두 자리의 시간이, 그 다음에 두 자리의 분, 그 다음에 두 자리의 초가 ‘:’ 문자로 구분되어 이어집니다).

상태 관리¶

이 구성 요소는 상태를 저장하지 않습니다.

제한됨¶

이 구성 요소는 제한되지 않습니다.

시스템 리소스 고려 사항¶

이 구성 요소는 시스템 리소스 고려 사항을 지정하지 않습니다.