ConsumeTwitter 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-social-media-nar
Beschreibung¶
Streamt Tweets von Twitters Streaming-API v2. Der Stream liefert einen Beispiel-Stream oder einen Such-Stream basierend auf zuvor hochgeladenen Regeln. Dieser Prozessor bietet auch eine Durchleitung für bestimmte Felder des Tweets, die als Teil der Antwort zurückgegeben werden sollen. Weitere Informationen zum Tweet-Objektmodell finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction.
Eingabeanforderung¶
FORBIDDEN
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
backfill-minutes |
Die Anzahl der Minuten (bis zu 5 Minuten) an Streaming-Daten, die nach einer Unterbrechung der Verbindung angefordert werden sollen. Nur für Projekte mit Zugang zu akademischer Forschung verfügbar. Siehe https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features |
backoff-attempts |
Die Anzahl der Wiederverbindungsversuche, die der Prozessor im Falle einer Unterbrechung des Streams aus irgendeinem Grund unternimmt, bevor er eine Ausnahme auslöst. Um einen Stream zu starten, nachdem diese Ausnahme aufgetreten ist und die Verbindung repariert wurde, stoppen Sie den Prozessor und starten ihn neu. Wenn der Wert dieser Eigenschaft 0 ist, findet nie ein Backoff statt und der Prozessor muss immer neu gestartet werden, wenn der Stream ausfällt. |
backoff-time |
Die Dauer des Backoffs, bevor ein neuer Stream angefordert wird, wenn der aktuelle Stream aus irgendeinem Grund ausfällt. Erhöht sich jedes Mal um den Faktor 2, wenn ein Neustart fehlschlägt |
base-path |
Der Basispfad, den der Prozessor für die HTTP-Anfragen verwendet. Der Standardwert sollte für die meisten Anwendungsfälle ausreichend sein. |
batch-size |
Die maximale Größe der Anzahl der Tweets, die in ein einzelnes FlowFile geschrieben werden sollen. Schreibt weniger Tweets, je nachdem, wie viele Tweets zum Zeitpunkt des Prozessoraufrufs in der Warteschlange verfügbar sind. |
bearer-token |
Das von Twitter bereitgestellte Bearer-Token. |
connect-timeout |
Die maximale Zeit, innerhalb derer der Client eine Verbindung zur Twitter-API herstellen sollte, bevor ein Timeout auftritt. Wenn Sie den Wert auf 0 setzen, werden Verbindungs-Timeouts deaktiviert. |
expansions |
Eine durch Kommas getrennte Liste von Erweiterungen für Objekte im zurückgegebenen Tweet. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/expansions. Mögliche Feldwerte sind: author_id, referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys, in_reply_to_user_id, geo.place_id |
maximum-backoff-time |
Die maximale Wartezeit, bevor ein neuer Stream versucht wird. Es wird empfohlen, diesen Wert deutlich höher als die Eigenschaft „Backoff Time“ zu setzen. |
media-fields |
Eine durch Kommas getrennte Liste von Medienfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media. Mögliche Feldwerte sind: alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url, width |
place-fields |
Eine durch Kommas getrennte Liste von Ortsfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place. Mögliche Feldwerte sind: contained_within, country, country_code, full_name, geo, id, name, place_type |
poll-fields |
Eine durch Kommas getrennte Liste von Abfragefeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll. Mögliche Feldwerte sind: duration_minutes, end_datetime, id, options, voting_status |
queue-size |
Maximale Größe der internen Warteschlange für gestreamte Meldungen |
read-timeout |
Die maximale Zeit der Inaktivität zwischen dem Empfang von Tweets von Twitter über die API, bevor ein Timeout auftritt. Wenn Sie den Wert auf 0 setzen, werden Lese-Timeouts deaktiviert. |
stream-endpoint |
Die Quelle, aus der der Prozessor Tweets empfängt. |
tweet-fields |
Eine durch Kommas getrennte Liste von Tweet-Feldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet. Mögliche Feldwerte sind: attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text, withheld |
user-fields |
Eine durch Kommas getrennte Liste von Benutzerfeldern, die als Teil des Tweets zurückgegeben werden sollen. Informationen zur korrekten Verwendung finden Sie unter https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user. Mögliche Feldwerte sind: created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld |
Beziehungen¶
Name |
Beschreibung |
---|---|
success |
FlowFiles mit einem Array von einem oder mehreren Tweets |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
mime.type |
Der MIME-Typ ist auf application/json eingestellt |
tweets |
Die Anzahl der Tweets im FlowFile |