ConsumeTwitter 2025.5.31.15

Bundle

org.apache.nifi | nifi-social-media-nar

Beschreibung

Streamt Tweets von Twitters Streaming-API v2. Der Stream liefert einen Beispiel-Stream oder einen Such-Stream basierend auf zuvor hochgeladenen Regeln. Dieser Prozessor bietet auch eine Durchleitung für bestimmte Felder des Tweets, die als Teil der Antwort zurückgegeben werden sollen. Weitere Informationen zum Tweet-Objektmodell finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction.

Tags

json, social media, status, tweets, twitter

Eingabeanforderung

FORBIDDEN

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

backfill-minutes

Die Anzahl der Minuten (bis zu 5 Minuten) an Streaming-Daten, die nach einer Unterbrechung der Verbindung angefordert werden sollen. Nur für Projekte mit Zugang zu akademischer Forschung verfügbar. Siehe https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features

backoff-attempts

Die Anzahl der Wiederverbindungsversuche, die der Prozessor im Falle einer Unterbrechung des Streams aus irgendeinem Grund unternimmt, bevor er eine Ausnahme auslöst. Um einen Stream zu starten, nachdem diese Ausnahme aufgetreten ist und die Verbindung repariert wurde, stoppen Sie den Prozessor und starten ihn neu. Wenn der Wert dieser Eigenschaft 0 ist, findet nie ein Backoff statt und der Prozessor muss immer neu gestartet werden, wenn der Stream ausfällt.

backoff-time

Die Dauer des Backoffs, bevor ein neuer Stream angefordert wird, wenn der aktuelle Stream aus irgendeinem Grund ausfällt. Erhöht sich jedes Mal um den Faktor 2, wenn ein Neustart fehlschlägt

base-path

Der Basispfad, den der Prozessor für die HTTP-Anfragen verwendet. Der Standardwert sollte für die meisten Anwendungsfälle ausreichend sein.

batch-size

Die maximale Größe der Anzahl der Tweets, die in ein einzelnes FlowFile geschrieben werden sollen. Schreibt weniger Tweets, je nachdem, wie viele Tweets zum Zeitpunkt des Prozessoraufrufs in der Warteschlange verfügbar sind.

bearer-token

Das von Twitter bereitgestellte Bearer-Token.

connect-timeout

Die maximale Zeit, innerhalb derer der Client eine Verbindung zur Twitter-API herstellen sollte, bevor ein Timeout auftritt. Wenn Sie den Wert auf 0 setzen, werden Verbindungs-Timeouts deaktiviert.

expansions

Eine durch Kommas getrennte Liste von Erweiterungen für Objekte im zurückgegebenen Tweet. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/expansions. Mögliche Feldwerte sind: author_id, referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys, in_reply_to_user_id, geo.place_id

maximum-backoff-time

Die maximale Wartezeit, bevor ein neuer Stream versucht wird. Es wird empfohlen, diesen Wert deutlich höher als die Eigenschaft „Backoff Time“ zu setzen.

media-fields

Eine durch Kommas getrennte Liste von Medienfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media. Mögliche Feldwerte sind: alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url, width

place-fields

Eine durch Kommas getrennte Liste von Ortsfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place. Mögliche Feldwerte sind: contained_within, country, country_code, full_name, geo, id, name, place_type

poll-fields

Eine durch Kommas getrennte Liste von Abfragefeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll. Mögliche Feldwerte sind: duration_minutes, end_datetime, id, options, voting_status

queue-size

Maximale Größe der internen Warteschlange für gestreamte Meldungen

read-timeout

Die maximale Zeit der Inaktivität zwischen dem Empfang von Tweets von Twitter über die API, bevor ein Timeout auftritt. Wenn Sie den Wert auf 0 setzen, werden Lese-Timeouts deaktiviert.

stream-endpoint

Die Quelle, aus der der Prozessor Tweets empfängt.

tweet-fields

Eine durch Kommas getrennte Liste von Tweet-Feldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet. Mögliche Feldwerte sind: attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text, withheld

user-fields

Eine durch Kommas getrennte Liste von Benutzerfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user. Mögliche Feldwerte sind: created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld

Beziehungen

Name

Beschreibung

success

FlowFiles mit einem Array von einem oder mehreren Tweets

Schreibt Attribute

Name

Beschreibung

mime.type

Der MIME-Typ ist auf application/json eingestellt

tweets

Die Anzahl der Tweets im FlowFile