ConsumeTwitter 2025.5.31.15

Pacote

org.apache.nifi | nifi-social-media-nar

Descrição

Transmite tweets do streaming da API v2 de streaming do Twitter. O fluxo fornece um fluxo de amostra ou um fluxo de pesquisa com base em regras carregadas anteriormente. Esse processador também fornece uma passagem para determinados campos do tweet a serem retornados como parte da resposta. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/introduction para obter mais informações sobre o modelo de objeto Tweet.

Tags

json, social media, status, tweets, twitter

Requisito de entrada

FORBIDDEN

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

backfill-minutes

O número de minutos (até 5 minutos) de transferência de dados a serem solicitados após uma desconexão. Disponível apenas para projetos com acesso para pesquisa acadêmica. Consulte https://developer.twitter.com/pt/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features

backoff-attempts

O número de tentativas de reconexão que o processador realizará no caso de uma desconexão do fluxo por qualquer motivo, antes de gerar uma exceção. Para iniciar um fluxo depois que essa exceção ocorrer e a conexão for corrigida, pare e reinicie o processador. Se o valor dessa propriedade for 0, a espera nunca ocorrerá e o processador sempre precisará ser reiniciado se o fluxo falhar.

backoff-time

A duração da espera antes de solicitar um novo fluxo se o atual falhar por qualquer motivo. Aumentará em um fator de 2 toda vez que houver falha na reinicialização

base-path

O caminho base que o processador usará para fazer solicitações HTTP. O valor padrão deve ser suficiente para a maioria dos casos de uso.

batch-size

O tamanho máximo do número de tweets a serem gravados em um único FlowFile. Escreverá menos tweets com base no número disponível na fila no momento da invocação do processador.

bearer-token

O token de portador fornecido pelo Twitter.

connect-timeout

O tempo máximo que o cliente deve levar parra estabelecer uma conexão com a API do Twitter antes de atingir o tempo limite. Definir o valor como 0 desativa os tempos limite de conexão.

expansions

Uma lista de expansões separada por vírgulas para objetos no tweet retornado. Consulte https://developer.twitter.com/pt/docs/twitter-api/expansions para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys, in_reply_to_user_id, geo.place_id

maximum-backoff-time

A duração máxima de espera para iniciar a tentativa de um novo fluxo. Recomenda-se que esse número seja muito maior do que a propriedade “backoff-time”

media-fields

Uma lista separada por vírgulas de campos de mídia a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/media para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url, width

place-fields

Uma lista separada por vírgulas de campos de local a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/place para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: contained_within, country, country_code, full_name, geo, id, name, place_type

poll-fields

Uma lista separada por vírgulas de campos de pesquisa a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/poll para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: duration_minutes, end_datetime, id, options, voting_status

queue-size

Tamanho máximo da fila interna para mensagens transmitidas

read-timeout

O tempo máximo de inatividade entre o recebimento de tweets do Twitter por meio da API antes de atingir o tempo limite. Definir o valor como 0 desativa os tempos limite de leitura.

stream-endpoint

A fonte da qual o processador consumirá tweets.

tweet-fields

Uma lista separada por vírgulas de campos de tweet a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/tweet para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text, withheld

user-fields

Uma lista separada por vírgulas de campos de usuário a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/user para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld

Relações

Nome

Descrição

success

FlowFiles contendo uma matriz de um ou mais tweets

Grava atributos

Nome

Descrição

mime.type

O tipo MIME foi definido como application/json

tweets

O número de tweets no FlowFile