SampleRecord 2025.5.31.15¶
バンドル¶
org.apache.nifi | nifi-standard-nar
説明¶
指定されたサンプリング戦略(貯水池サンプリングなど)に基づき、 FlowFile の記録をサンプルします。その結果、 FlowFile は、固定数の記録(リザバーベースのアルゴリズムの場合)、または全記録数のサブセット(確率的サンプリングの場合)、または決定論的記録数(インターバルサンプリングの場合)のいずれかになります。
入力要件¶
REQUIRED
機密動的プロパティをサポート¶
false
プロパティ¶
プロパティ |
説明 |
---|---|
record-reader |
受信データのパースとスキーマの決定に使用する Controller Service を指定します。 |
record-writer |
FlowFile への結果の書き込みに使用するController Serviceを指定します。 |
sample-record-interval |
発信 FlowFile に記録を書き込む前にスキップする記録数を指定します。このプロパティは、サンプリングストラテジーがインターバルサンプリングにセットされている場合にのみ使用されます。ゼロ(0)の値を指定すると、発信 FlowFile に記録は含まれず、1(1)の値を指定するとすべての記録が含まれ、2(2)の値を指定すると半数の記録が含まれるようになります。 |
sample-record-probability |
記録が発信 FlowFile に含まれる確率を(0~100 のパーセンテージで)指定します。このプロパティは、サンプリングストラテジーが確率的サンプリングにセットされている場合にのみ使用されます。値がゼロ(0)の場合、発信 FlowFile に記録は含まれず、値が100の場合、すべての記録が発信 FlowFile に含まれます。 |
sample-record-random-seed |
(確率戦略で使用する) 乱数発生器の種として使用する特定の数値を指定します。このプロパティをセットすると、確率的戦略を使用する場合でも、同じ記録が選択されるようになります。 |
sample-record-range |
サンプルに含める記録の範囲を1から総レコード数まで指定します。例えば「3,6-8,20-」は、3番目の記録、6番目、7番目、8番目の記録、そして20番目以降のすべての記録を含みます。カンマで区切られた区間は重なりません。区間は2つの数字の間(例:6-8)、または指定された数字まで(例:-5)、または数字から最後の記録の数字まで(例:20-)です。このプロパティが設定されていない場合、すべての記録が含まれます。 |
sample-record-reservoir |
発信 FlowFile に書き込む記録数を指定。このプロパティは、サンプリングストラテジーがリザバーサンプリングなどのリザバーベースのストラテジーにセットされている場合にのみ使用されます。 |
sample-record-sampling-strategy |
受信 FlowFile から入力された記録をサンプリングするために使用する方法を指定します。 |
リレーションシップ¶
名前 |
説明 |
---|---|
failure |
FlowFile が何らかの理由で処理に失敗した場合 (たとえば、いずれかの記録が有効でない場合)、元の FlowFile はこのリレーションシップにルーティングされます。 |
original |
サンプリングに成功した場合、元の FlowFile は、このリレーションシップにルーティングされます。 |
success |
サンプリングが正常に完了した場合、 FlowFile はこのリレーションシップにルーティングされます。 |
属性の書き込み¶
名前 |
説明 |
---|---|
mime.type |
Record Writerが示す MIME タイプ |
record.count |
結果のフローファイルの記録数 |