ExcelReader

説明

Microsoft Excelドキュメントを解析し、各シートの各行を個別の記録として返します。このプロバイダーは、すべての必要なシートからスキーマを推測したり、値を解釈するための明示的なスキーマを提供することができます。詳細なドキュメントについては、Controller Serviceの使用を参照してください。このリーダーは、パスワードで保護された.xlsx (XSSF 2007 OOXML ファイル形式) と古い.xls (HSSF '97(-2007)ファイル形式) のExcelドキュメントの両方を処理することができます。

タグ

セル、エクセル、パース、リーダー、記録、行、スプレッドシート、値、xls、xlsx

プロパティ

以下のリストでは、必要なプロパティをアスタリスク (*) で表示しています。その他のプロパティはオプションと見なされます。この表は、任意のデフォルト値と、そのプロパティが NiFi 式言語に対応しているかどうかも示します。

表示名

API 名前

デフォルト値

許容値

説明

日付形式

日付形式

Dateフィールドの読み書きに使用する形式を指定します。指定しない場合、Dateフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJava java.time.format.DateTimeFormatter 形式と一致する必要があります(例えば、 MM/dd/yyyyは、2桁の月、2桁の日、4桁の年が続き、2017/01/01のようにすべて'/'文字で区切られます)。

入力ファイルタイプ *

入力ファイルタイプ

XLSX

  • XLS

  • XLSX

Excel入力ファイルのタイプを指定します。

パスワード *

パスワード

パスワードで保護されたExcelスプレッドシートのパスワード

プロテクションタイプ *

プロテクションタイプ

UNPROTECTED

  • 無防備

  • パスワードで保護

Excelスプレッドシートをパスワードで保護するかどうかを指定します。

必要なシート

必要なシート

Excelドキュメントから行を抽出するExcelドキュメントのシート名のカンマ区切りリスト。このプロパティが空白のままだと、すべてのシートのすべての行がExcelドキュメントから抽出されます。名前のリストは大文字と小文字を区別します。この値で指定されていないシートは無視されます。指定したシートが見つからない場合は例外がスローされます。

スタート行 *

スタート行

1

処理を開始する最初の行の行番号(Oneベース)。ワークシートの上部にある、データセットの一部ではないデータの行をスキップする場合に使用します。「Use Starting Row」ストラテジーを使用する場合、これは列のヘッダー行でなければなりません。

時刻形式

時刻形式

Timeフィールドの読み書き時に使用する形式を指定します。指定しない場合、Timeフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJavaのjava.time.format.DateTimeFormatter 形式と一致しなければなりません(例えば、 HH:mm:ssは、24時間形式の2桁の時、2桁の分、2桁の秒の順に続き、18:04:15のようにすべて':'文字で区切られます)。

タイムスタンプ形式

タイムスタンプ形式

Timestamp フィールドの読み書き時に使用する形式を指定します。指定しない場合、タイムスタンプフィールドはエポック(1970年1月1日午前0時 GMT) からのミリ秒数とみなされます。指定された場合、値はJavaのjava.time.format.DateTimeFormatter 形式と一致しなければなりません(例えば、MM/dd/yyyy HH: mm:ssは、2桁の月、2桁の日、4桁の年が続き、すべて'/'文字で区切られ、その後に24時間形式の2桁の時間、2桁の分、2桁の秒が続き、2017/01/01 18:04:15のようにすべて':'文字で区切られます)。

スキーマアクセス戦略 *

schema-access-strategy

スターティング行を使用

  • 'スキーマ名' プロパティの使用

  • 'スキーマテキスト' プロパティの使用

  • スキーマ リファレンス リーダー

  • スターティング行を使用

  • スキーマの推測

データの解釈に使用するスキーマの取得方法を指定します。

スキーマ支店

schema-branch

スキーマ・レジストリのプロパティでスキーマを検索する際に使用するブランチの名前を指定します。選択したスキーマ・レジストリが分岐をサポートしていない場合、この値は無視されます。

スキーマ名

schema-name

${schema.name}

スキーマ・レジストリのプロパティで検索するスキーマの名前を指定します。

スキーマ リファレンス リーダー *

schema-reference-reader

FlowFile 属性またはコンテンツを読み取ってスキーマ参照識別子を決定する責任を負うサービス実装。

スキーマレジストリ

schema-registry

スキーマレジストリで使用するController Serviceを指定します。

スキーマテキスト

schema-text

${avro.schema}

Avro形式のスキーマのテキスト

スキーマバージョン

schema-version

スキーマ・レジストリで検索するスキーマのバージョンを指定します。指定しない場合は、スキーマの最新バージョンが取得されます。

状態管理

このコンポーネントは状態を保存しません。

制限あり

このコンポーネントには制限はありません。

システムリソースに関する考察

このコンポーネントは、システムリソースを考慮したものではありません。