ExcelReader

説明

Parses a Microsoft Excel document returning each row in each sheet as a separate record. This reader allows for inferring a schema from all the required sheets or providing an explicit schema for interpreting the values. See Controller Service 's Usage for further documentation. This reader is capable of processing both password and non password protected .xlsx (XSSF 2007 OOXML file format) and older .xls (HSSF'97(-2007) file format) Excel documents.

タグ

セル、エクセル、パース、リーダー、記録、行、スプレッドシート、値、xls、xlsx

プロパティ

以下のリストでは、必要なプロパティをアスタリスク (*) で表示しています。その他のプロパティはオプションと見なされます。この表は、任意のデフォルト値と、そのプロパティが NiFi 式言語に対応しているかどうかも示します。

表示名

API 名前

デフォルト値

許容値

説明

日付形式

日付形式

Dateフィールドの読み書きに使用する形式を指定します。指定しない場合、Dateフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJava java.time.format.DateTimeFormatter 形式と一致する必要があります(例えば、 MM/dd/yyyyは、2桁の月、2桁の日、4桁の年が続き、2017/01/01のようにすべて'/'文字で区切られます)。

入力ファイルタイプ *

入力ファイルタイプ

XLSX

  • XLS

  • XLSX

Excel入力ファイルのタイプを指定します。

パスワード *

パスワード

パスワードで保護されたExcelスプレッドシートのパスワード

プロテクションタイプ *

プロテクションタイプ

UNPROTECTED

  • 無防備

  • パスワードで保護

Excelスプレッドシートをパスワードで保護するかどうかを指定します。

必要なシート

必要なシート

Excelドキュメントから行を抽出するExcelドキュメントのシート名のカンマ区切りリスト。このプロパティが空白のままだと、すべてのシートのすべての行がExcelドキュメントから抽出されます。名前のリストは大文字と小文字を区別します。この値で指定されていないシートは無視されます。指定したシートが見つからない場合は例外がスローされます。

列の評価戦略 *

列の評価戦略

STANDARD

  • 標準

  • すべての列

スキーマを決定するために、開始行の何行後を使用するかを選択する戦略。

スタート行 *

スタート行

1

処理を開始する最初の行の行番号(Oneベース)。ワークシートの上部にある、データセットの一部ではないデータの行をスキップする場合に使用します。「Use Starting Row」ストラテジーを使用する場合、これは列のヘッダー行でなければなりません。

時刻形式

時刻形式

Timeフィールドの読み書き時に使用する形式を指定します。指定しない場合、Timeフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJavaのjava.time.format.DateTimeFormatter 形式と一致しなければなりません(例えば、 HH:mm:ssは、24時間形式の2桁の時、2桁の分、2桁の秒の順に続き、18:04:15のようにすべて':'文字で区切られます)。

タイムスタンプ形式

タイムスタンプ形式

Timestamp フィールドの読み書き時に使用する形式を指定します。指定しない場合、タイムスタンプフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJavaのjava.time.format.DateTimeFormatter 形式と一致しなければなりません(例えば、MM/dd/yyyy HH: mm:ssは、2桁の月、2桁の日、4桁の年が続き、すべて'/'文字で区切られ、その後に24時間形式の2桁の時間、2桁の分、2桁の秒が続き、2017/01/01 18:04:15のようにすべて':'文字で区切られます)。

スキーマアクセス戦略 *

schema-access-strategy

スターティング行を使用

  • 'スキーマ名' プロパティの使用

  • 'スキーマテキスト' プロパティの使用

  • スキーマ リファレンス リーダー

  • スターティング行を使用

  • スキーマの推測

データの解釈に使用するスキーマの取得方法を指定します。

スキーマ支店

schema-branch

スキーマ・レジストリのプロパティでスキーマを検索する際に使用するブランチの名前を指定します。選択したスキーマ・レジストリが分岐をサポートしていない場合、この値は無視されます。

スキーマ名

schema-name

${schema.name}

スキーマ・レジストリのプロパティで検索するスキーマの名前を指定します。

スキーマ リファレンス リーダー *

schema-reference-reader

FlowFile 属性またはコンテンツを読み取ってスキーマ参照識別子を決定する責任を負うサービス実装。

スキーマレジストリ

schema-registry

スキーマレジストリで使用するController Serviceを指定します。

スキーマテキスト

schema-text

${avro.schema}

Avro形式のスキーマのテキスト

スキーマバージョン

schema-version

スキーマ・レジストリで検索するスキーマのバージョンを指定します。指定しない場合は、スキーマの最新バージョンが取得されます。

状態管理

このコンポーネントは状態を保存しません。

制限あり

このコンポーネントには制限はありません。

システムリソースに関する考察

このコンポーネントは、システムリソースを考慮したものではありません。