ConsumeTwitter 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-social-media-nar
Description¶
Diffuse des tweets à partir de l’API de streaming version 2 de Twitter. Le flux fournit un échantillon de flux ou un flux de recherche selon les règles précédemment chargées. Ce processeur permet également le renvoi de certains champs du tweet dans la réponse. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction pour plus d’informations sur le modèle d’objet du tweet.
Exigences en matière d’entrées¶
FORBIDDEN
Prend en charge les propriétés dynamiques sensibles¶
false
Propriétés¶
Propriété |
Description |
---|---|
backfill-minutes |
Nombre de minutes (jusqu’à 5) de données de flux à requérir après une déconnexion. Uniquement disponible pour les projets bénéficiant d’un accès à la recherche académique. Voir https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features |
backoff-attempts |
Le nombre de tentatives de reconnexion que le processeur effectuera en cas de déconnexion du flux – quelque qu’en soit la raison – avant de lever une exception. Pour démarrer un flux après l’apparition de cette exception et le rétablissement de la connexion, veuillez arrêter et redémarrer le processeur. Si la valeur de cette propriété est 0, cette temporisation ne se produira jamais et le processeur devra toujours être redémarré en cas d’échec du flux. |
backoff-time |
Durée de la temporisation avant de demander un nouveau flux si le flux actuel échoue pour une raison quelconque. Cette valeur est multipliée par 2 chaque fois qu’un redémarrage échoue |
base-path |
Le chemin de base que le processeur utilisera pour effectuer les requêtes HTTP. La valeur par défaut devrait être suffisante pour la plupart des cas d’utilisation. |
batch-size |
Le nombre maximal de tweets à écrire dans un seul FlowFile. Le nombre de tweets écrits sera réduit en fonction du nombre de tweets disponibles dans la file d’attente au moment de l’invocation du processeur. |
bearer-token |
Le jeton au porteur fourni par Twitter. |
connect-timeout |
Le délai maximum pendant lequel le client doit établir une connexion avec l’API Twitter avant l’expiration du délai d’attente. Le paramètre 0 désactive les délais d’expiration de la connexion. |
expansions |
La liste séparée par des virgules des expansions destinées aux objets du tweet renvoyé. Voir https://developer.twitter.com/en/docs/twitter-api/expansions pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : author_id, referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys ,in_reply_to_user_id et geo.place_id |
maximum-backoff-time |
La durée de temporisation maximale avant de demander un nouveau flux. Il est recommandé de choisir une valeur beaucoup plus élevée que pour la propriété « Backoff Time » |
media-fields |
La liste séparée par des virgules des champs média à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url et width |
place-fields |
La liste séparée par des virgules des champs de placement à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : contained_within, country, country_code, full_name, geo, id, name et place_type |
poll-fields |
La liste séparée par des virgules des champs de sondage à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : duration_minutes, end_datetime, id, options et voting_status |
queue-size |
Taille maximale de la file d’attente interne pour les messages en flux |
read-timeout |
Le temps maximum d’inactivité entre la réception de tweets de Twitter via l’API avant qu’un délai d’expiration ne se produise. Le paramètre 0 désactive les délais d’expiration pour la lecture. |
stream-endpoint |
La source à partir de laquelle le processeur consommera des tweets. |
tweet-fields |
La liste séparée par des virgules des virgules des champs de tweet à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text et withheld |
user-fields |
La liste séparée par des virgules des champs d’utilisateur à renvoyer dans le cadre du tweet. Voir https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user pour des conseils d’utilisation. Les valeurs de champ possibles sont les suivantes : created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified et withheld |
Relations¶
Nom |
Description |
---|---|
success |
Pour les FlowFiles contenant un tableau d’un ou plusieurs tweets |
Écrit les attributs¶
Nom |
Description |
---|---|
mime.type |
Le type MIME défini sur application/json |
tweets |
Le nombre de tweets dans le FlowFile |