ExcelReader

Beschreibung

Parst ein Microsoft Excel-Dokument und gibt jede Zeile in jedem Tabellenblatt als separaten Datensatz zurück. Dieser Reader ermöglicht die Ableitung eines Schemas aus allen erforderlichen Tabellenblättern oder die Bereitstellung eines expliziten Schemas für die Interpretation der Werte. Weitere Informationen finden Sie unter „Verwendung des Controller-Dienstes“. Dieser Reader kann sowohl kennwortgeschützte als auch nicht kennwortgeschützte .xlsx (XSSF 2007 OOXML Dateiformat) und ältere .xls (HSSF ‚97(-2007) Dateiformat) Excel-Dokumente verarbeiten.

Tags

cell, excel, parse, reader, record, row, spreadsheet, values, xls, xlsx

Eigenschaften

In der folgenden Liste sind die erforderlichen Eigenschaften mit einem Sternchen (*) gekennzeichnet. Andere Eigenschaften werden als optional betrachtet. Die Tabelle zeigt auch alle Standardwerte und ob eine Eigenschaft die NiFi Expression Language unterstützt.

Display Name (Anzeigename)

API-Name

Standardwert

Zugelassene Werte

Beschreibung

Date Format

Date Format

Gibt das Format an, das beim Lesen/Schreiben von Datumsfeldern verwendet werden soll. Wenn nicht anders angegeben, werden Datumsfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. MM/dd/yyyy für einen zweistelligen Monat, gefolgt von einem zweistelligen Tag, gefolgt von einem vierstelligen Jahr, alle durch „/“ Zeichen getrennt, wie in 01/01/2017).

Input File Type *

Input File Type

XLSX

  • XLS

  • XLSX

Gibt den Typ der Excel-Eingabedatei an.

Password *

Password

Das Kennwort für eine passwortgeschützte Excel-Tabelle

Protection Type *

Protection Type

UNPROTECTED

  • Unprotected

  • Password Protected

Gibt an, ob eine Excel-Tabelle durch ein Kennwort geschützt ist oder nicht.

Required Sheets

Required Sheets

Durch Kommas getrennte Liste der Namen von Excel-Dokumentblättern, deren Zeilen aus dem Excel-Dokument extrahiert werden sollen. Wenn dieses Feld leer gelassen wird, werden alle Zeilen aus allen Tabellenblättern des Excel-Dokuments extrahiert. Bei der Liste der Namen wird zwischen Groß- und Kleinschreibung unterschieden. Alle Tabellenblätter, die nicht in diesem Wert angegeben sind, werden ignoriert. Es wird eine Ausnahmen ausgelöst, wenn ein angegebenes Tabellenblatt nicht gefunden wird.

Starting Row *

Starting Row

1

Die Zeilennummer der ersten Zeile, mit der die Verarbeitung beginnen soll (beginnend mit 1). Verwenden Sie diese Option, um Datenzeilen am Anfang eines Arbeitsblatts zu überspringen, die nicht zum Dataset gehören. Bei Verwendung der Strategie „Use Starting Row“ verwenden, sollte dies die Spalten-Headerzeile sein.

Time Format

Time Format

Gibt das Format an, das beim Lesen/Schreiben von Zeitfeldern verwendet werden soll. Wenn nicht anders angegeben, werden Zeitfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. HH: mm:ss für eine zweistellige Stunde im 24-Stunden-Format, gefolgt von einer zweistelligen Minute, gefolgt von einer zweistelligen Sekunde, alle getrennt durch „:“-Zeichen, wie in 18:04:15).

Timestamp Format

Timestamp Format

Gibt das Format an, das beim Lesen/Schreiben von Zeitstempelfeldern verwendet werden soll. Wenn nicht anders angegeben wird, werden die Zeitstempelfelder als Anzahl der Millisekunden seit Epoche (Mitternacht, 1. Januar 1970 GMT) angenommen. Falls angegeben, muss der Wert dem Java-Format „java.time.format.DateTimeFormatter“ entsprechen (z. B. MM/dd/yyyy HH: mm:ss für einen zweistelligen Monat, gefolgt von einem zweistelligen Tag, gefolgt von einem vierstelligen Jahr, alle getrennt durch „/“-Zeichen; und dann gefolgt von einer zweistelligen Stunde im 24-Stunden-Format, gefolgt von einer zweistelligen Minute, gefolgt von einer zweistelligen Sekunde, alle getrennt durch „:“-Zeichen, wie in 01/01/2017 18:04:15).

Schema Access Strategy *

schema-access-strategy

Use Starting Row

  • Eigenschaft „Schema Name“ verwenden

  • Eigenschaft „Schema Text“ verwenden

  • Schema Reference Reader

  • Use Starting Row

  • Infer Schema

Gibt an, wie das Schema abgerufen wird, das zur Interpretation der Daten verwendet werden soll.

Schema Branch

schema-branch

Gibt den Namen des Zweigs an, der beim Suchen des Schemas in der Eigenschaft „Schema Registry“ verwendet werden soll. Wenn die gewählte „Schema Registry“ keine Verzweigungen unterstützt, wird dieser Wert ignoriert.

Schema Name

schema-name

${schema.name}

Gibt den Namen des Schemas an, das in der Eigenschaft Schema Registry gesucht werden soll.

Schema Reference Reader *

schema-referenz-reader

Dienstimplementierung, die für das Lesen von FlowFile-Attributen oder -Inhalten verantwortlich ist, um den Schema Reference Identifier zu ermitteln

Schema Registry

schema-registry

Gibt den Controller Service an, der für die Schema Registry verwendet werden soll

Schema Text

schema-text

${avro.schema}

Der Text eines Avro-formatierten Schemas

Schema Version

schema-version

Gibt die Version des Schemas an, die in der Schema Registry gesucht werden soll. Wenn nicht angegeben, wird die neueste Version des Schemas abgerufen.

Statusmanagement

Diese Komponente speichert keinen Status.

Eingeschränkt

Diese Komponente ist nicht eingeschränkt.

Hinweise zu Systemressourcen

Diese Komponente enthält keine Angaben zu den Systemressourcen.