CaptureChangePostgreSQL 2025.5.31.15¶
Pacote¶
com.snowflake.openflow.runtime | runtime-database-cdc-processors-nar
Descrição¶
Lê eventos CDC de um banco de dados PostgreSQL. O processador lê continuamente os eventos que chegam ao fluxo, filtrando aqueles relacionados às tabelas fornecidas pelo TableStateService e descartando o restante. Depois que o lote atual de eventos é processado, o processador confirma a posição do slot de replicação de volta para PostgreSQL, permitindo que ele apare o WAL. O processador gera dois tipos de FlowFiles: DDLs contendo o esquema inicial de uma tabela e, em seguida, sempre que o esquema for alterado, e DMLs com registros que representam alterações nos dados da tabela. Um FlowFile sempre representa os dados relacionados a uma única tabela. O DDL com o esquema é gravado no conteúdo do FlowFile como um objeto JSON, em um formato como: { «columns»: [ { «name»: «<columnName>», «type»: «<snowflakeType>», «nullable»: <true|false>, «scale»: <scale>, «precision»: <precision> }, …], «primaryKeys»: [«<primaryKey1>», «<primaryKey2>», …]}. Os registros DML são estruturados como: { «primaryKeys»: { «<column>»: <value>, … }, «payload»: { «<column>»: <value>, … }, «metadata»: { «<column>»: <value>, … }}
Requisito de entrada¶
FORBIDDEN
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
| Propriedade | Descrição | 
|---|---|
| Armazenamento de filtro de colunas | Serviço que armazena configurações de filtragem de colunas por tabela. | 
| Local do driver JDBC | Lista separada por vírgulas de arquivos/pastas e/ou URLs contendo o driver JAR e suas dependências (se houver). Por exemplo, “/var/tmp/postgresql-java-client-42.7.5.jar” | 
| JDBC URL | URL do JDBC da conexão com o banco de dados, ou seja, jdbc:postgresql://localhost:5432/postgres | 
| Tamanho máximo do lote | O número máximo de registros a serem processados em uma única iteração | 
| Tempo máximo de espera do lote | O tempo máximo de espera para que os dados apareçam no fluxo da CDC. | 
| Senha | Senha para acessar o banco de dados PostgreSQL | 
| Nome da publicação | O nome da publicação CDC da qual você deve ler. | 
| Record Writer | O Record Writer é usado para serializar eventos DML | 
| Serviço de contexto SSL | O serviço de contexto SSL que oferece suporte à comunicação por soquete criptografado | 
| Modo SSL | Se deve usar e aplicar SSL ao se conectar ao PostgreSQL | 
| Armazenamento de estado de tabela | O armazenamento compartilhado que mantém o estado das tabelas replicadas. | 
| Nome de usuário | Nome de usuário para acessar o banco de dados PostgreSQL | 
Gerenciamento do estado¶
| Escopos | Descrição | 
|---|---|
| CLUSTER | Informações como um “ponteiro” para o evento CDC atual no banco de dados são armazenadas por esse processador, de modo que ele possa continuar no mesmo local se for reiniciado, e o nome do slot de replicação criado em PostgreSQL. | 
Relações¶
| Nome | Descrição | 
|---|---|
| success | FlowFile criado com sucesso a partir de eventos de fluxo da CDC | 
Grava atributos¶
| Nome | Descrição | 
|---|---|
| source.schema.name | Nome do esquema de tabela da qual um evento se originou | 
| source.table.name | Nome da tabela da qual um evento se originou | 
| cdc.event.type | Tipo de evento realizado pelo FlowFile: ddl ou dml | 
| cdc.most.significant.position | A posição mais significativa do ddl no fluxo da CDC | 
| cdc.least.significant.position | A posição menos significativa do ddl no fluxo da CDC | 
| cdc.event.seen.at | Carimbo de data/hora do momento em que o evento ddl foi lido pelo processador |