Configure o Openflow Connector for HubSpot¶
Nota
O conector está sujeito aos Termos do conector Snowflake.
Este tópico descreve as etapas para configurar o Openflow Connector for HubSpot.
Pré-requisitos¶
Certifique-se de ter revisado Sobre a Openflow Connector for HubSpot.
Certifique-se de ter revisado Configuração do Openflow - BYOC ou Configuração do Openflow – Implantações do Snowflake.
Se você usa Openflow - Snowflake Deployments, garanta que já tenha revisado a configuração dos domínios necessários e concedido acesso a esses domínios para o conector Hubspot.
Obtenha as credenciais¶
Como administrador do HubSpot, gere um token de aplicativo privado HubSpot ou crie um em sua conta HubSpot. Isso permite que você autentique suas solicitações na HubSpot API.
Faça login em sua conta HubSpot.
Navegue até Settings selecionando o ícone de engrenagem na barra de navegação superior.
Na navegação esquerda, vá para Integrations » Private Apps.
Selecione Create a private app.
Digite um nome para seu aplicativo.
Navegue até a guia Scopes.
Selecione os escopos necessários para as solicitações de API que você pretende fazer. Para encontrar os escopos necessários para as solicitações de API, consulte Escopos.
Selecione Create app.
Defina os escopos necessários para as solicitações de API que você pretende fazer para cada ponto de extremidade.
Selecione View access token para visualizar o token de acesso. Cole o token nos parâmetros do conector ou salve-o em segurança.
Configure a conta Snowflake¶
Como administrador de conta Snowflake, execute as seguintes tarefas:
Crie uma nova função ou use uma função existente e conceda Privilégios de banco de dados e Privilégios de exibição.
Crie um novo usuário de serviço Snowflake com o tipo SERVICE.
Conceda ao usuário do serviço Snowflake a função que você criou nas etapas anteriores.
Configure com a autenticação de pares de chaves para o usuário do Snowflake SERVICE da etapa 2.
A Snowflake recomenda enfaticamente essa etapa. Configure um gerenciador de segredos compatível com o Openflow, por exemplo, AWS, Azure e Hashicorp, e armazene as chaves públicas e privadas no armazenamento de segredos.
Nota
Se, por algum motivo, você não quiser usar um gerenciador de segredos, você será responsável por proteger os arquivos de chave pública e privada usados para autenticação de par de chaves de acordo com as políticas de segurança da sua organização.
Depois que o gerenciador de segredos estiver configurado, determine como você se autenticará nele. No AWS, é recomendável que você use a função de instância EC2 associada ao Openflow, pois dessa forma nenhum outro segredo precisa ser mantido.
No Openflow, configurar um provedor de parâmetros associado a este Secrets Manager, a partir do menu de configuração no canto superior direito. Navegue até Controller Settings » Parameter Provider e depois buscar seus valores de parâmetro.
Nesse momento, todas as credenciais podem ser referenciadas com os caminhos de parâmetros associados e nenhum valor sensível precisa ser mantido no Openflow.
Se qualquer outro usuário Snowflake precisar de acesso aos documentos e tabelas brutos ingeridos pelo conector (por exemplo, para processamento personalizado no Snowflake), conceda a esses usuários a função criada na etapa 1.
Crie um banco de dados e um esquema no Snowflake para que o conector armazene os dados ingeridos. Conceda os seguintes Privilégios de banco de dados à função criada na primeira etapa.
Crie um warehouse que será usado pelo conector ou use um já existente. Comece com o menor tamanho de warehouse e, em seguida, experimente o tamanho, dependendo do número de tabelas sendo replicadas e da quantidade de dados transferidos. Os números de tabelas grandes normalmente são mais bem dimensionados com warehouses multicluster, em vez de warehouses maiores.
Certifique-se de que o usuário com a função usada pelo conector tenha os privilégios necessários para usar o warehouse. Se esse não for o caso, conceda os privilégios necessários à função.
Configuração do conector¶
Como engenheiro de dados, execute as seguintes tarefas para instalar e configurar o conector:
Instalação do conector¶
Para instalar o conector, faça o seguinte como engenheiro de dados:
Navegue até a página de visão geral do Openflow. Na seção Featured connectors, selecione View more connectors.
Na página de conectores do Openflow, localize o conector e selecione Add to runtime.
Na caixa de diálogo Select runtime, selecione seu tempo de execução na lista suspensa Available runtimes e clique em Add.
Nota
Antes de instalar o conector, verifique se você criou um banco de dados e um esquema no Snowflake para que o conector armazene os dados ingeridos.
Autentique-se na implementação com as credenciais de sua conta Snowflake e selecione Allow quando solicitado para permitir que o aplicativo de tempo de execução acesse sua conta Snowflake. O processo de instalação do conector leva alguns minutos para ser concluído.
Autentique-se no tempo de execução com as credenciais de sua conta Snowflake.
A tela do Openflow é exibida com o grupo de processos do conector adicionado a ela.
Configuração do conector¶
Clique com o botão direito do mouse no grupo de processos importado e selecione Parameters.
Preencha os valores dos parâmetros necessários conforme descrito em Parâmetros de fluxo.
Parâmetros de fluxo¶
Esta seção descreve os parâmetros de fluxo que podem ser configurados com base nos contextos de parâmetros a seguir:
Parâmetros de origem do HubSpot: usados para estabelecer conexão com o HubSpot.
Parâmetros de destino do HubSpot: usados para estabelecer conexão com o Snowflake.
Parâmetros de ingestão do HubSpot: usados para definir a configuração dos dados baixados do HubSpot.
Parâmetros de origem do HubSpot¶
Parâmetro |
Descrição |
|---|---|
Token de acesso HubSpot |
Token de acesso ao aplicativo privado do HubSpot. |
Parâmetros de destino do HubSpot¶
Parâmetro |
Descrição |
Obrigatório |
|---|---|---|
Banco de dados de destino |
O banco de dados onde os dados serão mantidos. Ele já deve existir no Snowflake. O nome diferencia maiúsculas de minúsculas. Para identificadores sem aspas, forneça o nome em maiúsculas. |
Sim |
Esquema de destino |
O esquema onde os dados serão persistidos, que já deve existir no Snowflake. O nome diferencia maiúsculas de minúsculas. Para identificadores sem aspas, forneça o nome em maiúsculas. Veja os exemplos a seguir:
|
Sim |
Estratégia de autenticação Snowflake |
Ao utilizar:
|
Sim |
Identificador de conta Snowflake |
Ao utilizar:
|
Sim |
Chave privada Snowflake |
Ao utilizar:
|
Não |
Arquivo de chave privada Snowflake |
Ao utilizar:
|
Não |
Senha de chave privada Snowflake |
Ao usar
|
Não |
Função Snowflake |
Ao usar
|
Sim |
Nome de usuário do Snowflake |
Ao usar
|
Sim |
Estratégia de valores excedentes |
Determina como o conector lida com valores que excedem os limites de tamanho internos (16 MB) durante a replicação. Os valores possíveis são:
|
Não |
Warehouse Snowflake |
Warehouse Snowflake usado para executar consultas. |
Sim |
Parâmetros de ingestão do HubSpot¶
Parâmetro |
Descrição |
|---|---|
Tipos de objetos |
Lista de tipos de objeto HubSpot separados por vírgula a serem ingeridos. Os valores de tipo de objeto compatíveis são:
|
Atualizado após |
Filtre objetos atualizados após a data ou hora especificada. Este parâmetro é opcional. |
Cronograma de ingestão de dados |
Tempo entre o próximo cronograma. Ele deve ter uma duração de tempo válida, como 30 minutos ou 1 hora. |
Execute o fluxo¶
Clique com o botão direito do mouse no plano e selecione Enable all Controller Services.
Clique com o botão direito do mouse no grupo de processos importado e selecione Start. O conector inicia a ingestão de dados.
Reconfigure o conector¶
Você pode modificar os parâmetros do conector depois que o conector tiver começado a ingerir dados. Se os critérios de consulta de problemas forem alterados, execute as etapas a seguir para garantir que os dados na tabela de destino sejam consistentes.
Pare o conector: certifique-se de que todos os processadores Openflow estejam parados.
Acesse as definições de configuração: navegue até as definições de configuração do conector na interface do Snowflake Openflow.
Modifique os parâmetros: ajuste os parâmetros conforme necessário.
Limpe o estado do processador: se você está alterando os critérios de ingestão, o Snowflake recomenda fortemente que você inicie a ingestão desde o início para manter os dados consistentes na tabela de destino. Depois de limpar o estado no processador
List Fresh HubSpot Objects, o conector buscará todos os objetos desde o início. O truncamento manual da tabela de destino pode ser necessário para impedir duplicação de linhas.
Estrutura de dados e exibições¶
O conector armazena os dados nos dois formatos a seguir em seu banco de dados Snowflake:
Armazenamento de dados brutos¶
Todos os dados brutos do HubSpot são armazenados em tabelas com os nomes exatos especificados no parâmetro de tipos de objeto. Por exemplo:
Se você configurar
Products,Contacts,Companiesno parâmetro de tipos de objeto, o conector criará três tabelas:PRODUCTS,CONTACTSeCOMPANIES.Cada tabela contém a carga útil JSON completa das respostas da HubSpot API.
Os dados brutos preservam a estrutura original e todos os metadados do HubSpot.
Exibições niveladas¶
Para consultas e análises mais fáceis, o conector cria automaticamente exibições niveladas para cada tipo de objeto:
Cada tabela bruta tem uma exibição correspondente com o sufixo
_VIEW. Por exemplo:PRODUCTS_VIEW,CONTACTS_VIEWeCOMPANIES_VIEW.As exibições extraem os campos mais usados da carga útil JSON para colunas individuais.
As estruturas aninhadas complexas são niveladas para simplificar as consultas SQL.