ExcelReader¶

Beschreibung¶

Parses a Microsoft Excel document returning each row in each sheet as a separate record. This reader allows for inferring a schema from all the required sheets or providing an explicit schema for interpreting the values. See Controller Service ‚s Usage for further documentation. This reader is capable of processing both password and non password protected .xlsx (XSSF 2007 OOXML file format) and older .xls (HSSF’97(-2007) file format) Excel documents.

Tags¶

cell, excel, parse, reader, record, row, spreadsheet, values, xls, xlsx

Eigenschaften¶

In der folgenden Liste sind die erforderlichen Eigenschaften mit einem Sternchen (*) gekennzeichnet. Andere Eigenschaften werden als optional betrachtet. Die Tabelle zeigt auch alle Standardwerte und ob eine Eigenschaft die NiFi Expression Language unterstützt.

Display Name (Anzeigename)	API-Name	Standardwert	Zugelassene Werte	Beschreibung
Date Format	Date Format			Gibt das Format an, das beim Lesen/Schreiben von Datumsfeldern verwendet werden soll. Wenn nicht anders angegeben, werden Datumsfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. MM/dd/yyyy für einen zweistelligen Monat, gefolgt von einem zweistelligen Tag, gefolgt von einem vierstelligen Jahr, alle durch „/“ Zeichen getrennt, wie in 01/01/2017).
Input File Type *	Input File Type	XLSX	XLS XLSX	Gibt den Typ der Excel-Eingabedatei an.
Password *	Password			Das Kennwort für eine passwortgeschützte Excel-Tabelle
Protection Type *	Protection Type	UNPROTECTED	Unprotected Password Protected	Gibt an, ob eine Excel-Tabelle durch ein Kennwort geschützt ist oder nicht.
Required Sheets	Required Sheets			Durch Kommas getrennte Liste der Namen von Excel-Dokumentblättern, deren Zeilen aus dem Excel-Dokument extrahiert werden sollen. Wenn dieses Feld leer gelassen wird, werden alle Zeilen aus allen Tabellenblättern des Excel-Dokuments extrahiert. Bei der Liste der Namen wird zwischen Groß- und Kleinschreibung unterschieden. Alle Tabellenblätter, die nicht in diesem Wert angegeben sind, werden ignoriert. Es wird eine Ausnahmen ausgelöst, wenn ein angegebenes Tabellenblatt nicht gefunden wird.
Row Evaluation Strategy *	Row Evaluation Strategy	STANDARD	Standard All Rows	Eine Strategie zur Auswahl, wie viele Zeilen nach der Startzeile zur Bestimmung des Schemas verwendet werden sollen.
Starting Row *	Starting Row	1		Die Zeilennummer der ersten Zeile, mit der die Verarbeitung beginnen soll (beginnend mit 1). Verwenden Sie diese Option, um Datenzeilen am Anfang eines Arbeitsblatts zu überspringen, die nicht zum Dataset gehören. Bei Verwendung der Strategie „Use Starting Row“ verwenden, sollte dies die Spalten-Headerzeile sein.
Time Format	Time Format			Gibt das Format an, das beim Lesen/Schreiben von Zeitfeldern verwendet werden soll. Wenn nicht anders angegeben, werden Zeitfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. HH: mm:ss für eine zweistellige Stunde im 24-Stunden-Format, gefolgt von einer zweistelligen Minute, gefolgt von einer zweistelligen Sekunde, alle getrennt durch „:“-Zeichen, wie in 18:04:15).
Timestamp Format	Timestamp Format			Gibt das Format an, das beim Lesen/Schreiben von Zeitstempelfeldern verwendet werden soll. Wenn nicht anders angegeben wird, werden die Zeitstempelfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. MM/dd/yyyy HH: mm:ss für einen zweistelligen Monat, gefolgt von einem zweistelligen Tag, gefolgt von einem vierstelligen Jahr, alle getrennt durch „/“-Zeichen; und dann gefolgt von einer zweistelligen Stunde im 24-Stunden-Format, gefolgt von einer zweistelligen Minute, gefolgt von einer zweistelligen Sekunde, alle getrennt durch „:“-Zeichen, wie in 01/01/2017 18:04:15).
Schema Access Strategy *	schema-access-strategy	Use Starting Row	Eigenschaft „Schema Name“ verwenden Eigenschaft „Schema Text“ verwenden Schema Reference Reader Use Starting Row Infer Schema	Gibt an, wie das Schema abgerufen wird, das zur Interpretation der Daten verwendet werden soll.
Schema Branch	schema-branch			Gibt den Namen des Zweigs an, der beim Suchen des Schemas in der Eigenschaft „Schema Registry“ verwendet werden soll. Wenn die gewählte „Schema Registry“ keine Verzweigungen unterstützt, wird dieser Wert ignoriert.
Schema Name	schema-name	${schema.name}		Gibt den Namen des Schemas an, das in der Eigenschaft Schema Registry gesucht werden soll.
Schema Reference Reader *	schema-referenz-reader			Dienstimplementierung, die für das Lesen von FlowFile-Attributen oder -Inhalten verantwortlich ist, um den Schema Reference Identifier zu ermitteln
Schema Registry	schema-registry			Gibt den Controller Service an, der für die Schema Registry verwendet werden soll
Schema Text	schema-text	${avro.schema}		Der Text eines Avro-formatierten Schemas
Schema Version	schema-version			Gibt die Version des Schemas an, die in der Schema Registry gesucht werden soll. Wenn nicht angegeben, wird die neueste Version des Schemas abgerufen.

Statusmanagement¶

Diese Komponente speichert keinen Status.

Eingeschränkt¶

Diese Komponente ist nicht eingeschränkt.

Hinweise zu Systemressourcen¶

Diese Komponente enthält keine Angaben zu den Systemressourcen.