ConsumeTwitter 2025.5.31.15

バンドル

org.apache.nifi | nifi-social-media-nar

説明

API v2からのツイートのストリームのTwitterのストリーミング。ストリームは、以前にアップロードされたルールに基づくサンプルストリームまたは検索ストリームを提供します。このプロセッサーは、ツイートの特定のフィールドをレスポンスの一部として返すパススルーも提供します。ツイート・オブジェクト・モデルに関する詳しい情報は、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction を参照してください。

タグ

json, social media, status, tweets, twitter

入力要件

FORBIDDEN

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

backfill-minutes

切断後にリクエストするストリームデータの分数(最大5分)。学術研究アクセスプロジェクトのみ利用可能。https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-featuresを参照してください。

backoff-attempts

何らかの理由でストリームが切断された場合に、例外をスローするまでにプロセッサーが試みる再接続の回数。この例外が発生し、接続が修正された後にストリームを開始するには、プロセッサーを停止して再起動してください。このプロパティの値が0である場合、バックオフは発生せず、ストリームが失敗した場合、プロセッサーは常に再起動する必要があります。

backoff-time

現在のストリームが何らかの理由で失敗した場合に、新しいストリームをリクエストする前にバックオフする時間。再起動に失敗するたびに2倍になります。

base-path

プロセッサーが HTTP リクエストを行うときに使用するベースパス。ほとんどのユースケースはデフォルト値で十分です。

batch-size

一つの FlowFile に書き込まれるツイート数の最大サイズ。プロセッサーの起動時にキューで利用可能な数に基づいて、より少ないツイートを書き込みます。

bearer-token

Twitterが提供するBearer Token。

connect-timeout

タイムアウトになる前にクライアントがTwitter API との接続を確立すべき最大時間。値を0に設定すると、接続タイムアウトが無効になります。

expansions

返されたツイートのオブジェクトの展開のカンマ区切りのリスト。正しい使用方法については https://developer.twitter.com/en/docs/twitter-api/expansions を参照してください。可能なフィールド値: author_id、referred_tweets.id、referred_tweets.id.author_id、entities.mentions.username、 attachments.poll_ids、attachments.media_keys,in_reply_to_user_id、geo.place_id

maximum-backoff-time

新しいストリームの試行を始めるためのバックオフの最大時間。この数値は、「Backoff Time」プロパティよりもはるかに大きくすることを推奨します。

media-fields

ツイートの一部として返されるメディアフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media を参照してください。可能なフィールド値: alt_text、duration_ms、height、media_key、non_public_metrics、organic_metrics、preview_image_url、promoted_metrics、public_metrics、type、url、width

place-fields

ツイートの一部として返されるプレースフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place を参照してください。可能なフィールド値: contained_within、country、country_code、full_name、geo、id、name、place_type

poll-fields

ツイートの一部として返されるポーリングフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll を参照してください。可能なフィールド値:duration_minutes、end_datetime、id、options、voting_status

queue-size

ストリームメッセージの内部キューの最大サイズ

read-timeout

タイムアウトが発生する前に、Twitterから API を通して、ツイートを受信するまでの最大非アクティブ時間。値を0に設定すると、読み取りタイムアウトが無効になります。

stream-endpoint

プロセッサーがツイートを消費するソース。

tweet-fields

ツイートの一部として返されるツイートフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet を参照してください。可能なフィールド値: attachments、author_id、context_annotations、conversation_id、created_at、entities、geo、id、in_reply_to_user_id、lang、non_public_metrics、organic_metrics、possibly_sensitive、promoted_metrics、public_metrics、referred_tweets、reply_settings、source、text、withheld

user-fields

ツイートの一部として返されるユーザーフィールドのカンマ区切りリスト。正しい使用方法については、https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user を参照してください。設定可能なフィールド値: created_at、description、entity、id、location、name、pinned_tweet_id、profile_image_url、protected、public_metrics、url、username、verified、withheld

リレーションシップ

名前

説明

success

1つ以上のツイートの配列を含む FlowFiles

属性の書き込み

名前

説明

mime.type

application/json にセットされている MIME タイプ

tweets

FlowFile でのツイート数