Funções de métricas de dados do sistema

Este tópico é uma referência para as funções de métricas de dados (DMFs) do sistema que a Snowflake fornece para todas as contas.

Você pode chamar essas DMFs do sistema para começar a avaliar a qualidade de seus dados imediatamente.

Sobre as DMFs do sistema

A Snowflake fornece DMFs de sistema no esquema CORE do SNOWFLAKE banco de dados compartilhado. As DMFs do sistema são mantidas pela Snowflake; você não pode alterar o nome ou a funcionalidade de nenhuma DMF do sistema.

Cada DMF do sistema permite que você meça um atributo de qualidade de dados diferente. Você pode atribuir mais de uma DMF do sistema para uma tabela ou exibição para permitir uma medição da qualidade de dados mais abrangente para atender às suas necessidades de governança e conformidade.

Para usar uma DMF de sistema, escolha uma das seguintes abordagens de controle de acesso:

  • Conceda a função de banco de dados DATA_METRIC_USER à função do proprietário da tabela, que é a função com o privilégio OWNERSHIP na tabela. Esta função de banco de dados tem o privilégio USAGE sobre o esquema SNOWFLAKE.CORE e o privilégio USAGE em todas as DMFs do sistema no esquema SNOWFLAKE.CORE.

    Além disso, conceda os seguintes privilégios à função de proprietário da tabela:

    Privilégio

    Objeto

    Notas

    EXECUTE DATA METRIC FUNCTION

    Conta

    Este privilégio permite que você controle quais funções têm acesso aos recursos de computação sem servidor para chamar a DMF do sistema.

    USAGE

    Banco de dados, esquema

    Esses objetos são o banco de dados e o esquema que contêm a tabela table.referenced à qual o DMF está associado.

  • Conceda IMPORTED PRIVILEGES no banco de dados SNOWFLAKE à função de proprietário da tabela. Para obter mais informações, consulte Habilitando outras funções para usar esquemas no banco de dados SNOWFLAKE.

  • Use a função ACCOUNTADMIN.

DMFs do sistema

Atualmente, o Snowflake oferece suporte a essas DMFs de sistema para medir métricas comuns sem ter que defini-las:

Categoria

DMF do sistema

Descrição

Precisão

BLANK_COUNT

Determine quantos valores em branco há em uma coluna.

BLANK_PERCENT

Determine qual porcentagem dos valores de uma coluna estão em branco.

NULL_COUNT

Determine quantos valores NULL há em uma coluna.

NULL_PERCENT

Determine qual porcentagem dos valores de uma coluna são NULL.

Atualidade

FRESHNESS

Determine a atualidade dos dados de uma tabela com base em uma coluna de carimbo de data/hora.

DATA_METRIC_SCHEDULE_TIME

Defina as métricas de atualidade personalizadas.

Estatísticas

AVG

Determine o valor médio de uma coluna.

MAX

Determine o valor máximo de uma coluna.

MIN

Determine o valor mínimo de uma coluna.

STDDEV

Determine o valor do desvio padrão de uma coluna.

Singularidade

ACCEPTED_VALUES

Determine se os valores em uma coluna correspondem a uma expressão booleana.

DUPLICATE_COUNT

Determine o número de valores duplicados em uma coluna, incluindo valores NULL.

UNIQUE_COUNT

Determine o número de valores exclusivos não NULL em uma coluna.

Volume

ROW_COUNT

Determine quantos registros há na tabela ou exibição.