ConsumeTwitter 2025.5.31.15

Bundle

org.apache.nifi | nifi-social-media-nar

Description

Diffuse des tweets à partir de l’API de streaming version 2 de Twitter. Le flux fournit un échantillon de flux ou un flux de recherche selon les règles précédemment chargées. Ce processeur permet également le renvoi de certains champs du tweet dans la réponse. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction pour plus d’informations sur le modèle d’objet du tweet.

Balises

json, social media, status, tweets, twitter

Exigences en matière d’entrées

FORBIDDEN

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

backfill-minutes

Nombre de minutes (jusqu’à 5) de données de flux à requérir après une déconnexion. Uniquement disponible pour les projets bénéficiant d’un accès à la recherche académique. Voir https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features

backoff-attempts

Le nombre de tentatives de reconnexion que le processeur effectuera en cas de déconnexion du flux – quelque qu’en soit la raison – avant de lever une exception. Pour démarrer un flux après l’apparition de cette exception et le rétablissement de la connexion, veuillez arrêter et redémarrer le processeur. Si la valeur de cette propriété est 0, cette temporisation ne se produira jamais et le processeur devra toujours être redémarré en cas d’échec du flux.

backoff-time

Durée de la temporisation avant de demander un nouveau flux si le flux actuel échoue pour une raison quelconque. Cette valeur est multipliée par 2 chaque fois qu’un redémarrage échoue

base-path

Le chemin de base que le processeur utilisera pour effectuer les requêtes HTTP. La valeur par défaut devrait être suffisante pour la plupart des cas d’utilisation.

batch-size

Le nombre maximal de tweets à écrire dans un seul FlowFile. Le nombre de tweets écrits sera réduit en fonction du nombre de tweets disponibles dans la file d’attente au moment de l’invocation du processeur.

bearer-token

Le jeton au porteur fourni par Twitter.

connect-timeout

Le délai maximum pendant lequel le client doit établir une connexion avec l’API Twitter avant l’expiration du délai d’attente. Le paramètre 0 désactive les délais d’expiration de la connexion.

expansions

La liste séparée par des virgules des expansions destinées aux objets du tweet renvoyé. Voir https://developer.twitter.com/en/docs/twitter-api/expansions pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : author_id, referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys ,in_reply_to_user_id et geo.place_id

maximum-backoff-time

La durée de temporisation maximale avant de demander un nouveau flux. Il est recommandé de choisir une valeur beaucoup plus élevée que pour la propriété « Backoff Time »

media-fields

La liste séparée par des virgules des champs média à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url et width

place-fields

La liste séparée par des virgules des champs de placement à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : contained_within, country, country_code, full_name, geo, id, name et place_type

poll-fields

La liste séparée par des virgules des champs de sondage à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : duration_minutes, end_datetime, id, options et voting_status

queue-size

Taille maximale de la file d’attente interne pour les messages en flux

read-timeout

Le temps maximum d’inactivité entre la réception de tweets de Twitter via l’API avant qu’un délai d’expiration ne se produise. Le paramètre 0 désactive les délais d’expiration pour la lecture.

stream-endpoint

La source à partir de laquelle le processeur consommera des tweets.

tweet-fields

La liste séparée par des virgules des virgules des champs de tweet à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text et withheld

user-fields

La liste séparée par des virgules des champs d’utilisateur à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified et withheld

Relations

Nom

Description

success

Pour les FlowFiles contenant un tableau d’un ou plusieurs tweets

Écrit les attributs

Nom

Description

mime.type

Le type MIME défini sur application/json

tweets

Le nombre de tweets dans le FlowFile