SampleRecord 2025.5.31.15

バンドル

org.apache.nifi | nifi-standard-nar

説明

指定されたサンプリング戦略(貯水池サンプリングなど)に基づき、 FlowFile の記録をサンプルします。その結果、 FlowFile は、固定数の記録(リザバーベースのアルゴリズムの場合)、または全記録数のサブセット(確率的サンプリングの場合)、または決定論的記録数(インターバルサンプリングの場合)のいずれかになります。

タグ

間隔、範囲、記録、リザバー、サンプル

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

record-reader

受信データのパースとスキーマの決定に使用する Controller Service を指定します。

record-writer

FlowFile への結果の書き込みに使用するController Serviceを指定します。

sample-record-interval

発信 FlowFile に記録を書き込む前にスキップする記録数を指定します。このプロパティは、サンプリングストラテジーがインターバルサンプリングにセットされている場合にのみ使用されます。ゼロ(0)の値を指定すると、発信 FlowFile に記録は含まれず、1(1)の値を指定するとすべての記録が含まれ、2(2)の値を指定すると半数の記録が含まれるようになります。

sample-record-probability

記録が発信 FlowFile に含まれる確率を(0~100 のパーセンテージで)指定します。このプロパティは、サンプリングストラテジーが確率的サンプリングにセットされている場合にのみ使用されます。値がゼロ(0)の場合、発信 FlowFile に記録は含まれず、値が100の場合、すべての記録が発信 FlowFile に含まれます。

sample-record-random-seed

(確率戦略で使用する) 乱数発生器の種として使用する特定の数値を指定します。このプロパティをセットすると、確率的戦略を使用する場合でも、同じ記録が選択されるようになります。

sample-record-range

サンプルに含める記録の範囲を1から総レコード数まで指定します。例えば「3,6-8,20-」は、3番目の記録、6番目、7番目、8番目の記録、そして20番目以降のすべての記録を含みます。カンマで区切られた区間は重なりません。区間は2つの数字の間(例:6-8)、または指定された数字まで(例:-5)、または数字から最後の記録の数字まで(例:20-)です。このプロパティが設定されていない場合、すべての記録が含まれます。

sample-record-reservoir

発信 FlowFile に書き込む記録数を指定。このプロパティは、サンプリングストラテジーがリザバーサンプリングなどのリザバーベースのストラテジーにセットされている場合にのみ使用されます。

sample-record-sampling-strategy

受信 FlowFile から入力された記録をサンプリングするために使用する方法を指定します。

リレーションシップ

名前

説明

failure

FlowFile が何らかの理由で処理に失敗した場合 (たとえば、いずれかの記録が有効でない場合)、元の FlowFile はこのリレーションシップにルーティングされます。

original

サンプリングに成功した場合、元の FlowFile は、このリレーションシップにルーティングされます。

success

サンプリングが正常に完了した場合、 FlowFile はこのリレーションシップにルーティングされます。

属性の書き込み

名前

説明

mime.type

Record Writerが示す MIME タイプ

record.count

結果のフローファイルの記録数