CaptureChangeMySQL 2025.5.31.15

Pacote

com.snowflake.openflow.runtime | runtime-database-cdc-processors-nar

Descrição

Lê eventos CDC de um banco de dados MySQL. O processador lê continuamente eventos de arquivos de log binários, filtrando aqueles relacionados às tabelas fornecidas por TableStateService e descartando o restante. O processador gera dois tipos de FlowFiles: DDLs contendo o esquema de uma tabela (o esquema inicial e um novo esquema em cada alteração de esquema); e DMLs contendo registros que representam alterações de dados na tabela. Um FlowFile sempre representa os dados relacionados a uma única tabela. O DDL com o esquema é gravado no conteúdo do FlowFile como um objeto JSON:{ «columns»: [ { «name»: «<columnName>», «type»: «<snowflakeType>», «nullable»: <true|false>, «scale»: <scale>, «precision»: <precision> }, …], «primaryKeys»: [«<primaryKey1>», «<primaryKey2>», …]}Estrutura do FlowFiles que contém os registros DML:{ «primaryKeys»: { «<column>»: <value>, … }, «payload»: { «<column>»: <value>, … }, «metadata»: { «<column>»: <value>, … }}

Tags

cdc, event, jdbc, mysql, sql

Requisito de entrada

FORBIDDEN

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Armazenamento de filtro de colunas

Serviço que armazena configurações de filtragem de colunas por tabela.

Tempo limite de conexão

Tempo limite de conexão com o banco de dados de origem

Local do driver JDBC

Lista separada por vírgulas de arquivos/pastas e/ou URLs contendo o driver JAR e suas dependências (se houver). Por exemplo, “/var/tmp/mariadb-java-client-3.4.1.jar”

JDBC URL

URL do JDBC da conexão com o banco de dados, ou seja, jdbc:mariadb://localhost:3306/mysql

Tamanho máximo do lote

O número máximo de registros a serem processados em uma única iteração. O número de registros pode exceder o tamanho máximo do lote quando o último evento do log binário contém mais de uma linha.

Tempo máximo de espera do lote

O tempo máximo de espera para que os dados apareçam no log binário.

Tamanho máximo da fila

O número máximo de elementos lidos do log binário até que o thread do leitor aguarde pelo onTrigger

Senha

Senha para acessar o banco de dados MySQL

Record Writer

O Record Writer é usado para serializar eventos DML

Serviço de contexto SSL

O serviço de contexto SSL que oferece suporte à comunicação por soquete criptografado

Modo SSL

Modo SSL usado quando o serviço de contexto SSL está configurado para oferecer suporte a opções de verificação de certificado

ID do servidor

ID do servidor (no intervalo de 1 a 2^32 - 1). Esse valor deve ser exclusivo em todo o grupo de replicação (ou seja, diferente de qualquer outro ID de servidor que esteja sendo usado por qualquer mestre ou servo). Lembre-se de que cada cliente de log binário deve ser tratado como um servo simplificado e, portanto, deve também usa um ID de servidor diferente.

Estratégia de ID de servidor

Determina como o ID de servidor é selecionado

Armazenamento de estado de tabela

O armazenamento compartilhado que mantém o estado das tabelas replicadas.

Nome de usuário

Nome de usuário para acessar o banco de dados MySQL

Gerenciamento do estado

Escopos

Descrição

CLUSTER

Informações como um “ponteiro” para o evento CDC atual no banco de dados são armazenadas por esse processador, de modo que ele possa continuar do mesmo local se for reiniciado.

Relações

Nome

Descrição

success

FlowFile criado com sucesso a partir de eventos de fluxo da CDC

Grava atributos

Nome

Descrição

source.schema.name

Nome do esquema de tabela da qual um evento se originou

source.table.name

Nome da tabela da qual um evento se originou

cdc.event.type

Tipo de evento realizado pelo FlowFile: ddl ou dml

cdc.most.significant.position

A posição mais significativa do ddl no fluxo da CDC

cdc.least.significant.position

A posição menos significativa do ddl no fluxo da CDC

cdc.event.seen.at

Carimbo de data/hora do momento em que o evento ddl foi lido pelo processador