ConsumeTwitter 2025.5.31.15¶
Pacote¶
org.apache.nifi | nifi-social-media-nar
Descrição¶
Transmite tweets do streaming da API v2 de streaming do Twitter. O fluxo fornece um fluxo de amostra ou um fluxo de pesquisa com base em regras carregadas anteriormente. Esse processador também fornece uma passagem para determinados campos do tweet a serem retornados como parte da resposta. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/introduction para obter mais informações sobre o modelo de objeto Tweet.
Requisito de entrada¶
FORBIDDEN
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
---|---|
backfill-minutes |
O número de minutos (até 5 minutos) de transferência de dados a serem solicitados após uma desconexão. Disponível apenas para projetos com acesso para pesquisa acadêmica. Consulte https://developer.twitter.com/pt/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features |
backoff-attempts |
O número de tentativas de reconexão que o processador realizará no caso de uma desconexão do fluxo por qualquer motivo, antes de gerar uma exceção. Para iniciar um fluxo depois que essa exceção ocorrer e a conexão for corrigida, pare e reinicie o processador. Se o valor dessa propriedade for 0, a espera nunca ocorrerá e o processador sempre precisará ser reiniciado se o fluxo falhar. |
backoff-time |
A duração da espera antes de solicitar um novo fluxo se o atual falhar por qualquer motivo. Aumentará em um fator de 2 toda vez que houver falha na reinicialização |
base-path |
O caminho base que o processador usará para fazer solicitações HTTP. O valor padrão deve ser suficiente para a maioria dos casos de uso. |
batch-size |
O tamanho máximo do número de tweets a serem gravados em um único FlowFile. Escreverá menos tweets com base no número disponível na fila no momento da invocação do processador. |
bearer-token |
O token de portador fornecido pelo Twitter. |
connect-timeout |
O tempo máximo que o cliente deve levar parra estabelecer uma conexão com a API do Twitter antes de atingir o tempo limite. Definir o valor como 0 desativa os tempos limite de conexão. |
expansions |
Uma lista de expansões separada por vírgulas para objetos no tweet retornado. Consulte https://developer.twitter.com/pt/docs/twitter-api/expansions para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys, in_reply_to_user_id, geo.place_id |
maximum-backoff-time |
A duração máxima de espera para iniciar a tentativa de um novo fluxo. Recomenda-se que esse número seja muito maior do que a propriedade “backoff-time” |
media-fields |
Uma lista separada por vírgulas de campos de mídia a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/media para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url, width |
place-fields |
Uma lista separada por vírgulas de campos de local a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/place para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: contained_within, country, country_code, full_name, geo, id, name, place_type |
poll-fields |
Uma lista separada por vírgulas de campos de pesquisa a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/poll para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: duration_minutes, end_datetime, id, options, voting_status |
queue-size |
Tamanho máximo da fila interna para mensagens transmitidas |
read-timeout |
O tempo máximo de inatividade entre o recebimento de tweets do Twitter por meio da API antes de atingir o tempo limite. Definir o valor como 0 desativa os tempos limite de leitura. |
stream-endpoint |
A fonte da qual o processador consumirá tweets. |
tweet-fields |
Uma lista separada por vírgulas de campos de tweet a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/tweet para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text, withheld |
user-fields |
Uma lista separada por vírgulas de campos de usuário a serem retornados como parte do tweet. Consulte https://developer.twitter.com/pt/docs/twitter-api/data-dictionary/object-model/user para obter informações sobre o uso adequado. Os valores de campo possíveis incluem: created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld |
Relações¶
Nome |
Descrição |
---|---|
success |
FlowFiles contendo uma matriz de um ou mais tweets |
Grava atributos¶
Nome |
Descrição |
---|---|
mime.type |
O tipo MIME foi definido como application/json |
tweets |
O número de tweets no FlowFile |