ConsumeTwitter 2025.5.31.15¶
バンドル¶
org.apache.nifi | nifi-social-media-nar
説明¶
API v2からのツイートのストリームのTwitterのストリーミング。ストリームは、以前にアップロードされたルールに基づくサンプルストリームまたは検索ストリームを提供します。このプロセッサーは、ツイートの特定のフィールドをレスポンスの一部として返すパススルーも提供します。ツイート・オブジェクト・モデルに関する詳しい情報は、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction を参照してください。
入力要件¶
FORBIDDEN
機密動的プロパティをサポート¶
false
プロパティ¶
プロパティ |
説明 |
---|---|
backfill-minutes |
切断後にリクエストするストリームデータの分数(最大5分)。学術研究アクセスプロジェクトのみ利用可能。https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-featuresを参照してください。 |
backoff-attempts |
何らかの理由でストリームが切断された場合に、例外をスローするまでにプロセッサーが試みる再接続の回数。この例外が発生し、接続が修正された後にストリームを開始するには、プロセッサーを停止して再起動してください。このプロパティの値が0である場合、バックオフは発生せず、ストリームが失敗した場合、プロセッサーは常に再起動する必要があります。 |
backoff-time |
現在のストリームが何らかの理由で失敗した場合に、新しいストリームをリクエストする前にバックオフする時間。再起動に失敗するたびに2倍になります。 |
base-path |
プロセッサーが HTTP リクエストを行うときに使用するベースパス。ほとんどのユースケースはデフォルト値で十分です。 |
batch-size |
一つの FlowFile に書き込まれるツイート数の最大サイズ。プロセッサーの起動時にキューで利用可能な数に基づいて、より少ないツイートを書き込みます。 |
bearer-token |
Twitterが提供するBearer Token。 |
connect-timeout |
タイムアウトになる前にクライアントがTwitter API との接続を確立すべき最大時間。値を0に設定すると、接続タイムアウトが無効になります。 |
expansions |
返されたツイートのオブジェクトの展開のカンマ区切りのリスト。正しい使用方法については https://developer.twitter.com/en/docs/twitter-api/expansions を参照してください。可能なフィールド値: author_id、referred_tweets.id、referred_tweets.id.author_id、entities.mentions.username、 attachments.poll_ids、attachments.media_keys,in_reply_to_user_id、geo.place_id |
maximum-backoff-time |
新しいストリームの試行を始めるためのバックオフの最大時間。この数値は、「Backoff Time」プロパティよりもはるかに大きくすることを推奨します。 |
media-fields |
ツイートの一部として返されるメディアフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media を参照してください。可能なフィールド値: alt_text、duration_ms、height、media_key、non_public_metrics、organic_metrics、preview_image_url、promoted_metrics、public_metrics、type、url、width |
place-fields |
ツイートの一部として返されるプレースフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place を参照してください。可能なフィールド値: contained_within、country、country_code、full_name、geo、id、name、place_type |
poll-fields |
ツイートの一部として返されるポーリングフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll を参照してください。可能なフィールド値:duration_minutes、end_datetime、id、options、voting_status |
queue-size |
ストリームメッセージの内部キューの最大サイズ |
read-timeout |
タイムアウトが発生する前に、Twitterから API を通して、ツイートを受信するまでの最大非アクティブ時間。値を0に設定すると、読み取りタイムアウトが無効になります。 |
stream-endpoint |
プロセッサーがツイートを消費するソース。 |
tweet-fields |
ツイートの一部として返されるツイートフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet を参照してください。可能なフィールド値: attachments、author_id、context_annotations、conversation_id、created_at、entities、geo、id、in_reply_to_user_id、lang、non_public_metrics、organic_metrics、possibly_sensitive、promoted_metrics、public_metrics、referred_tweets、reply_settings、source、text、withheld |
user-fields |
ツイートの一部として返されるユーザーフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user を参照してください。設定可能なフィールド値: created_at、description、entity、id、location、name、pinned_tweet_id、profile_image_url、protected、public_metrics、url、username、verified、withheld |
リレーションシップ¶
名前 |
説明 |
---|---|
success |
1つ以上のツイートの配列を含む FlowFiles |
属性の書き込み¶
名前 |
説明 |
---|---|
mime.type |
application/json にセットされている MIME タイプ |
tweets |
FlowFile でのツイート数 |