ListSmb 2025.10.2.19¶
バンドル¶
org.apache.nifi | nifi-smb-nar
説明¶
SMB プロトコルで共有される具体的なファイルをリストします。リストされた各ファイルは、1つの FlowFile になり、メタデータは FlowFile 属性として書き込まれます。あるいは - 'Record Writer' プロパティがセットされている場合 - 全結果が一つの FlowFile に記録として書き込まれます。このプロセッサーは、クラスタ内のプライマリノードのみで動作するように設計されています。プライマリ・ノードが変更された場合、新しいプライマリ・ノードは、すべてのデータを複製することなく、前のノードが去った場所を引き継ぎます。
入力要件¶
FORBIDDEN
機密動的プロパティをサポート¶
false
プロパティ¶
プロパティ |
説明 |
|---|---|
directory |
ファイルをリストするネットワークフォルダ。これは、共有後の残りの相対パスです: smb://HOSTNAME:PORT/SHARE/[DIRECTORY]/sub/directories.サブディレクトリを追加することも可能です。リモートファイル共有上に指定されたパスが存在する必要があります。これは検証で確認できます。WindowsスタイルとLinuxスタイルのディレクトリセパレータを混在させてもかまいません。 |
et-initial-listing-target |
初期リストの処理方法を指定します。「エンティティの追跡」戦略で使用されます。 |
et-state-cache |
リストされたエンティティは指定されたキャッシュストレージに保存されるため、このプロセッサーは、NiFi 再起動時またはプライマリノードが変更された場合に、リストを再開できます。「エンティティの追跡」戦略では、直近の「追跡時間ウィンドウ」内にリストされているすべてのエンティティの追跡情報が必要です。多数のエンティティをサポートするために、この戦略では管理状態の代わりに DistributedMapCache を使用します。キャッシュキーの形式は「ListedEntities::{processorId}(::{nodeId})」です。ノードごとに列挙されたエンティティを追跡する場合は、状態を個別に管理するためにオプションの「::{nodeId}」部分が追加されます。例:クラスター全体のキャッシュキー =「ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b」、ノードごとのキャッシュキー =「ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3」保存されるキャッシュの内容はGzip圧縮された JSON 文字列です。キャッシュキーは、ターゲットリスティングの構成が変更されると削除されます。「エンティティの追跡」戦略で使用されます。 |
et-time-window |
このプロセッサーが、すでにリストされているエンティティを追跡する期間を指定します。「エンティティの追跡」戦略は、タイムスタンプが指定された時間枠内にあるエンティティを選ぶことができます。例えば、「30 minutes」に設定すると、このプロセッサーが実行されたときに、最近30分のタイムスタンプを持つすべてのエンティティがリスティングの対象となります。リストされたエンティティは「新規/更新」とみなされ、以下の条件のいずれかが満たされた場合にFlowFile が発行されます。1. 既にリストされているエンティティに存在しない、2. キャッシュされたエンティティよりもタイムスタンプが新しい、3. キャッシュされたエンティティとはサイズが異なる。キャッシュされたエンティティのタイムスタンプが指定された時間枠より古くなった場合、そのエンティティはキャッシュされた既にリストされているエンティティから削除されます。「エンティティの追跡」戦略で使用されます。 |
file-filter |
指定された正規表現に一致する名前のファイルだけがリストされます。 |
file-name-suffix-filter |
与えられた接尾辞で終わるファイルは省略されます。アップロード中のファイルに接尾辞を付け、アップロードが終了したら接尾辞を削除することで、アップロード中のファイルが複数回リストされないようにすることができます。「トラッキングエンティティ」または「トラッキングタイムスタンプ」のリスト戦略を使用する場合は、この方法を強くお勧めします。 |
initial-listing-strategy |
プロセッサーの初回起動時 (または状態クリア時) に、 SMB 共有上の既存ファイルをどのように処理するかを指定します。 |
initial-listing-timestamp |
プロセッサーが初めて起動した(または状態がクリアされた)ときに、ファイルがリストされるタイムスタンプ。値は、ミリ秒単位のエポックタイムスタンプか、2025-02-01T00:00:00Z のような形式の UTC datetime で指定できます。 |
listing-strategy |
新規/更新エンティティの判定方法を指定します。詳しくは各戦略の説明をご覧ください。 |
max-file-age |
指定された値より古いファイルは省略されます。 |
max-file-size |
与えられた値より大きなファイルは省略されます。 |
min-file-age |
リストされるために必要な、ファイルの最低年齢。(最終更新日付に従って)この期間より若いファイルは無視されます。 |
min-file-size |
与えられた値より小さいファイルは省略されます。 |
path-filter |
指定した正規表現にパス (ファイルの親ディレクトリまで) が一致するファイルだけがリストされます。 |
record-writer |
リストの作成に使用するRecord Writerを指定します。指定しない場合は、リストされたエンティティごとに FlowFile が1つ作成されます。Record Writerを指定すると、個々の FlowFiles に属性を追加する代わりに、すべてのエンティティが単一の FlowFile に書き込まれます。 |
smb-client-provider-service |
SMB 接続の作成に使用する SMB クライアントプロバイダーを指定します。 |
target-system-timestamp-precision |
ターゲットシステムでのタイムスタンプ精度を指定します。このプロセッサーは、エンティティのタイムスタンプを使用してリストを決定するため、正しいタイムスタンプ精度を使用することが重要です。 |
状態管理¶
スコープ |
説明 |
|---|---|
CLUSTER |
ファイルのリストをパフォーマンスした後、重複することなく連続的にファイルをリストするために、前回のリストの状態を保存することができます。 |
リレーションシップ¶
名前 |
説明 |
|---|---|
success |
受信したすべての FlowFiles は成功にルーティングされます。 |
属性の書き込み¶
名前 |
説明 |
|---|---|
filename |
ファイルシステムから読み込まれたファイル名。 |
shortName |
ファイルシステムから読み込まれたファイルのショートネーム。 |
path |
パスは、リモートファイルシステム上のファイルのディレクトリの、共有ルートディレクトリからの相対パスにセットされます。例えば、与えられたリモートlocationsmb://HOSTNAME:PORT/SHARE/DIRECTORY で、ファイルがsmb://HOSTNAME:PORT/SHARE/DIRECTORY/sub/folder/fileからリストされる場合、パス属性は "DIRECTORY/sub/folder" にセットされます。 |
serviceLocation |
シェアの SMB URL。 |
lastModifiedTime |
'yyyy-MM-dd'T'HH:mm:ss' としてファイルシステムでファイルの内容が変更された時のタイムスタンプ。 |
creationTime |
'yyyy-MM-dd'T'HH:mm:ss' としてファイルがファイルシステムに作成された時のタイムスタンプ。 |
lastAccessTime |
ファイルがファイルシステムでアクセスされた時のタイムスタンプを 'yyyy-MM-dd'T'HH:mm:ss' で表します。 |
changeTime |
ファイルの属性がファイルシステムで変更されたときのタイムスタンプを 'yyyy-MM-dd'T'HH:mm:ss' で指定します。 |
size |
ファイルのサイズ(バイト単位)。 |
allocationSize |
サーバー上のファイルに割り当てられたバイト数。 |