Instalação e configuração do Openflow Connector for Oracle¶
Nota
O conector está sujeito aos Termos do conector Snowflake.
Nota
O Openflow Connector for Oracle também está sujeito a termos de serviço adicionais além dos termos de serviço padrão do conector. Para obter mais informações, consulte o Adendo do Openflow Connector para Oracle.
Este tópico descreve as etapas para instalar e configurar o conector Openflow Connector for Oracle.
Como engenheiro de dados, execute as seguintes tarefas para instalar e configurar o conector:
Instalação do conector¶
Para instalar o conector, faça o seguinte como engenheiro de dados:
Navegue até a página de visão geral do Openflow. Na seção Featured connectors, selecione View more connectors.
Na página de conectores do Openflow, localize o conector e selecione Add to runtime.
Na caixa de diálogo Select runtime, selecione seu tempo de execução na lista suspensa Available runtimes e clique em Add.
Nota
Antes de instalar o conector, verifique se você criou um banco de dados e um esquema no Snowflake para que o conector armazene os dados ingeridos.
Autentique-se na implementação com as credenciais de sua conta Snowflake e selecione Allow quando solicitado para permitir que o aplicativo de tempo de execução acesse sua conta Snowflake. O processo de instalação do conector leva alguns minutos para ser concluído.
Autentique-se no tempo de execução com as credenciais de sua conta Snowflake.
A tela do Openflow é exibida com o grupo de processos do conector adicionado a ela.
Configuração do conector¶
Para configurar o conector, faça o seguinte como engenheiro de dados:
Clique com o botão direito do mouse no tempo de execução adicionado e selecione Parameters.
Preencha os valores de parâmetro necessários.
Para obter mais informações sobre os valores de parâmetro necessários, consulte as seções a seguir:
Parâmetros de destino do Snowflake: utilizado para estabelecer conexão com o Snowflake.
Parâmetros de ingestão do Oracle: utilizado para especificar as tabelas a serem replicadas.
Parâmetros de origem Oracle: utilizado para definir a configuração dos dados baixados do Oracle.
Parâmetros de destino do Snowflake¶
Parâmetro |
Descrição |
Obrigatório |
|---|---|---|
Banco de dados de destino |
O banco de dados onde os dados serão persistidos. Ele já deve existir no Snowflake. O nome diferencia maiúsculas de minúsculas. Para identificadores sem aspas, forneça o nome em maiúsculas. |
Sim |
Estratégia de autenticação Snowflake |
Ao utilizar:
|
Sim |
Identificador de conta Snowflake |
Ao utilizar:
|
Sim |
Estratégia de conexão com o Snowflake |
Ao usar KEY_PAIR, especifique a estratégia para conexão com o Snowflake:
|
Necessário somente para BYOC com KEY_PAIR; caso contrário, será ignorado. |
Chave privada Snowflake |
Ao utilizar:
|
Não |
Arquivo de chave privada Snowflake |
Ao utilizar:
|
Não |
Senha de chave privada Snowflake |
Ao usar
|
Não |
Função Snowflake |
Ao usar
|
Sim |
Nome de usuário do Snowflake |
Ao usar
|
Sim |
Estratégia de valores excedentes |
Determina como o conector lida com valores que excedem os limites de tamanho internos (16 MB) durante a replicação. Os valores possíveis são:
|
Não |
Warehouse Snowflake |
Warehouse Snowflake usado para executar consultas. |
Sim |
Parâmetros de ingestão do Oracle¶
Parâmetro |
Descrição |
|---|---|
Nomes de tabela inclusos |
Lista separada por vírgulas de caminhos de tabela totalmente qualificados. As tabelas devem ser especificadas usando o formato de nome de banco de dados, esquema e tabela totalmente qualificado: DATABASE_NAME.SCHEMA_NAME.TABLE_NAME. Por exemplo: |
Regex de tabela inclusa |
Uma expressão regular para corresponder aos caminhos da tabela para inclusão automática de tabelas existentes e novas. O padrão regex deve corresponder à convenção de nomenclatura de três partes: DATABASE_NAME.SCHEMA_NAME.TABLE_NAME. Por exemplo: |
Filtro de coluna JSON |
Opcional. Uma matriz JSON de objetos de filtro que especifica quais colunas incluir ou excluir por tabela. Para conferir detalhes e exemplos de sintaxe, consulte Replicar um subconjunto de colunas em uma tabela. |
CRON do cronograma de tarefas de fusão |
Uma expressão CRON para definir quando as operações de mesclagem do diário para a tabela de destino são acionadas. Por exemplo, * * * * * ? para mesclagem contínua. |
Resolução do identificador do objeto |
Especifica como os identificadores de objetos de origem, como esquemas, tabelas e nomes de colunas, são armazenados e consultados no Snowflake. Essa configuração determina se você deve usar aspas duplas em consultas SQL. Opção 1: padrão, sem distinção entre maiúsculas e minúsculas (recomendado).
Nota A Snowflake recomenda usar esta opção se não for esperado que os objetos de banco de dados tenham nomes que misturem letras maiúsculas e minúsculas. Opção 2: com distinção entre maiúsculas e minúsculas.
Importante Não altere esta configuração após o início da ingestão do conector. Se esta configuração for alterada após o início da ingestão, ela será interrompida. Se você precisar alterar essa configuração, crie uma nova instância do conector. |
Estratégia de busca de instantâneos |
Determina a estratégia de busca de carregamento de instantâneo:
|
Parâmetros de origem Oracle¶
Parâmetro |
Descrição |
Obrigatório |
|---|---|---|
URL da conexão Oracle |
URL JDBC da conexão de banco de dados com o DB. O URL deve especificar o contêiner de destino (PDB ou CDB) que contém os dados a serem replicados. Por exemplo, Quando SSL estiver habilitado, use o protocolo TCPS, por exemplo, Nota O conector funciona dentro de um único banco de dados/container. Certifique-se de que o URL JDBC aponte diretamente para o contêiner que contém as tabelas a serem replicadas. |
Sim |
Nome de usuário Oracle |
Nome do usuário de conexão que tem acesso ao XStream Server. |
Sim |
Senha Oracle |
Senha do usuário de conexão que tem acesso ao XStream Server. |
Sim |
Modo SSL Oracle |
Controla a criptografia SSL para conexões com o banco de dados Oracle.
Quando definido como VERIFY_CA ou VERIFY_IDENTITY, você também deve fornecer o parâmetro Oracle Wallet Filename. |
Sim |
Oracle Wallet Filename |
Carregue o arquivo que contém o arquivo da wallet de login automático no Oracle ( Para obter informações sobre como criar a wallet, consulte Configurar conexões SSL (opcional). |
Obrigatório quando o modo SSL não é DISABLED |
Multiplicador de processador do banco de dados Oracle |
Fator de licenciamento de núcleo do processador, conforme descrito na tabela de fatores de núcleo do processador Oracle |
Obrigatório apenas para licença incorporada |
Núcleos do processador do banco de dados Oracle |
O número de núcleos do processador em seu banco de dados Oracle. |
Obrigatório apenas para licença incorporada |
Confirmação de cobrança XStream |
Uma confirmação do contrato de licenciamento |
Obrigatório apenas para licença incorporada |
Nome do servidor de saída XStream |
O nome do servidor XStream que já deve existir no Oracle. |
Sim |
URL do servidor de saída XStream |
URL JDBC da conexão de banco de dados para XStream, deve usar o driver OCI. Por exemplo, Quando SSL estiver habilitado, use o protocolo TCPS, por exemplo, Nota Quando o modo SSL estiver habilitado, o conector adicionará automaticamente |
Sim |
Reiniciar a replicação da tabela¶
Uma tabela no estado FAILED, por exemplo, devido a uma chave primária ausente ou alteração de esquema incompatível, não é reiniciada automaticamente. Se uma tabela entrar no estado FAILED, ou se você precisar reiniciar a replicação do zero, use o procedimento a seguir para remover e adicionar novamente a tabela à replicação.
Nota
Se a falha foi causada por um problema na tabela de origem, como a falta de uma chave primária, resolva esse problema no banco de dados de origem antes de continuar.
Remova a tabela dos parâmetros de fluxo: no contexto de parâmetros de ingestão, remova a tabela de Included Table Names ou modifique o Included Table Regex para que a tabela não seja mais correspondida.
Verifique se a tabela foi removida:
Na tela do tempo de execução do Openflow, clique com o botão direito do mouse em um grupo de processadores e escolha Controller Services.
Na tabela com a lista de serviços do controlador, localize a linha Table State Store, clique nos três pontos verticais à direita da linha e escolha View State.
Importante
É necessário aguardar até que o estado da tabela seja totalmente removido da lista antes de prosseguir. Não continue até que esta alteração de configuração tenha sido concluída.
Limpe o destino: assim que o estado da tabela for exibido como totalmente removido, execute DROP manualmente da tabela de destino no Snowflake. Observe que o conector não substituirá uma tabela de destino existente durante a fase do instantâneo. Se a tabela ainda existir, a replicação falhará novamente. Opcionalmente, a tabela de diário e o fluxo também podem ser removidos se não forem mais necessários.
Adicione a tabela novamente: atualize os parâmetros Included Table Names ou Included Table Regex para incluir a tabela novamente.
Verifique a reinicialização: consulte Table State Store seguindo as instruções já apresentadas. O estado da tabela deve aparecer com status NEW, depois passar para SNAPSHOT_REPLICATION e, por fim, INCREMENTAL_REPLICATION.
Replique um subconjunto de colunas em uma tabela¶
O conector pode filtrar os dados replicados por tabela para um subconjunto de colunas configuradas. As colunas de chave primária são sempre incluídas, independentemente das exclusões.
Para aplicar filtros de coluna, defina o parâmetro Column Filter JSON no contexto de parâmetros de ingestão para uma matriz JSON de objetos de filtro, um por tabela que você deseja filtrar.
As colunas podem ser incluídas ou excluídas por nome ou por padrão de expressão regular. Você pode aplicar uma única condição por tabela ou combinar várias condições, com as exclusões sempre tendo precedência sobre as inclusões.
Sintaxe¶
Cada objeto da matriz identifica uma tabela e especifica quais colunas incluir ou excluir. Como este conector usa nomes totalmente qualificados de três partes (banco de dados, esquema e tabela), cada objeto pode incluir um campo database ou databasePattern, além dos campos de esquema e tabela.
As seguintes regras são aplicáveis:
Use
database,schemaetablepara correspondência exata de nome, oudatabasePattern,schemaPatternetablePatternpara correspondência de regex. Não é possível usar um campo e sua variante de padrão no mesmo objeto (por exemplo, ambosschemaeschemaPatternnão podem aparecer).É necessário inserir pelo menos um destes:
included,excluded,includedPatternouexcludedPattern.Quando ambos os filtros incluídos e excluídos são especificados, as exclusões têm precedência.
Quando vários filtros correspondem à mesma tabela, o último filtro correspondente é usado, com precedência das correspondências exatas sobre os filtros baseados em padrão.
O valor pode ser uma matriz de objetos para aplicar filtros diferentes a tabelas distintas.
Exemplos¶
Incluir colunas específicas por nome:
Excluir colunas específicas por nome:
Combinar um padrão de inclusão com uma exclusão específica (por exemplo, incluir todas as colunas de e-mail exceto admin_email):
Misturar um padrão de banco de dados com um nome de esquema e tabela exato para aplicar um filtro a vários bancos de dados:
Passar vários objetos de filtro para aplicar regras diferentes a tabelas distintas:
Execute o fluxo¶
Clique com o botão direito do mouse no plano e selecione Enable all Controller Services.
Clique com o botão direito do mouse no grupo de processos importado e selecione Start. O conector inicia a ingestão de dados.