Uso da classificação de dados

Este tópico fornece informações sobre como classificar tabelas em um esquema, revisar os resultados da classificação e definir tags do sistema nas colunas das tabelas usando SQL ou Snowsight.

Visão geral

Um administrador de dados pode classificar tabelas em um esquema para atender aos regulamentos de privacidade de dados. Essas tabelas incluem os seguintes cenários:

  • Novas tabelas em um esquema.

  • Novas colunas ou colunas alteradas em uma tabela no mesmo esquema.

  • Tabelas previamente classificadas que talvez precisem ser classificadas novamente.

A avaliação desses cenários permite que o administrador de dados classifique informações confidenciais e pessoais. Definir tags do sistema na coluna pode facilitar o monitoramento de dados. Posteriormente, um engenheiro de dados pode proteger os dados pessoais e confidenciais com uma política de mascaramento ou política de acesso a linhas em Snowsight ou usando SQL.

Início da classificação de dados

Antes de classificar uma única tabela ou tabelas em um esquema:

  • Escolha um fluxo de trabalho:

  • Decida qual warehouse usar. Por exemplo, utilize um warehouse que corresponda ao centro de custo ou à unidade de negócios à qual você pertence para permitir relatórios e orçamentos precisos.

  • Considere a latência em seu fluxo de trabalho. Snowsight atualiza a área Databases de Snowsight a cada 12 horas, momento em que as tabelas atualizadas podem ser classificadas.

  • Confirme a configuração de controle de acesso para sua função atual:

    • Use uma instrução SHOW GRANTS TO ROLE para ver as concessões em objetos que um usuário com essa função pode acessar. A função em uso deve ter estas concessões no mínimo:

      • USAGE no warehouse para usar durante o processo de classificação.

      • SELECT na tabela para iniciar o processo de classificação.

      • A função de banco de dados SNOWFLAKE.CORE_VIEWER, que permite definir as tags do sistema nas colunas.

      • A função de banco de dados SNOWFLAKE.GOVERNANCE_VIEWER para consultar a exibição Account Usage DATA_CLASSIFICATION_LATEST.

    • Para outras combinações de concessões, consulte a referência de privilégio de classificação de dados.

    • O modelo de controle de acesso permite que diferentes personas participem dos fluxos de trabalho. Por exemplo, um administrador de dados pode preparar a classificação de tabelas em um esquema e o engenheiro de dados pode avaliar os resultados em Snowsight. Escolha o modelo de controle de acesso e o fluxo de trabalho que melhor funciona para você.

Uso do SQL para classificar uma única tabela

Essa abordagem usa SQL para classificar uma tabela e definir tags do sistema nas colunas das tabelas. Revise a seção Início da classificação de dados para garantir que a função em uso tenha as concessões de controle de acesso necessárias para classificar as tabelas no esquema.

Este procedimento pressupõe que você use uma função com as concessões apropriadas. Conclua as etapas a seguir para usar SQL para classificar tabelas em um esquema e definir tags do sistema nas colunas da tabela:

  1. Identificar uma tabela para classificar.

  2. Chame o procedimento armazenado SYSTEM$CLASSIFY para classificar e marcar as colunas da tabela:

    CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'auto_tag': true});
    
    Copy
  3. Chame a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para confirmar as atribuições de tags nas colunas da tabela:

    SELECT *
    FROM TABLE(
      hr.INFORMATION_SCHEMA.TAG_REFERENCES_ALL_COLUMNS(
        'hr.tables.empl_info',
        'table'
    ));
    
    Copy
  4. Depois disso, você pode consultar a exibição do Account Usage DATA_CLASSIFICATION_LATEST para ver o resultado de classificação mais recente da tabela.

Repita essas etapas para cada tabela que deseja classificar.

Uso do SQL para classificar tabelas em um esquema

Essa abordagem usa SQL para classificar todas as tabelas em um esquema e definir tags do sistema nas colunas de cada tabela. Este procedimento pressupõe que você:

  • Este procedimento pressupõe que você use uma função com as concessões apropriadas.

  • Selecione um esquema que contenha menos de 1000 objetos de tabela. Você pode usar um comando SHOW TABLES IN SCHEMA para determinar o número de objetos de tabela no esquema.

Conclua as etapas a seguir para usar SQL para classificar todas as tabelas em um esquema e definir tags do sistema em cada coluna de cada tabela:

  1. Identifique um esquema que contém tabelas para classificar.

  2. Chame o procedimento armazenado SYSTEM$CLASSIFY_SCHEMA para agendar a classificação de tabelas no esquema:

    CALL SYSTEM$CLASSIFY_SCHEMA('hr.tables', {'auto_tag': true});
    
    Copy
  3. Se a saída contiver uma mensagem failed para uma ou mais tabelas, use um comando SNOW GRANTS ON TABLE para determinar as concessões na tabela especificada. Por exemplo:

    SHOW GRANTS ON TABLE hr.tables.salary;
    
    Copy
  4. Se necessário, conceda privilégios na tabela não classificada à função que chama o procedimento armazenado SYSTEM$CLASSIFY_SCHEMA. Caso contrário, chame a função SYSTEM$GET_CLASSIFICATION_RESULT em cada tabela do esquema:

    SELECT SYSTEM$GET_CLASSIFICATION_RESULT('hr.tables.empl_info');
    
    Copy
  5. Chame a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para confirmar as atribuições de tags nas colunas da tabela:

    SELECT *
    FROM TABLE(
      hr.INFORMATION_SCHEMA.TAG_REFERENCES_ALL_COLUMNS(
        'hr.tables.empl_info',
        'table'
    ));
    
    Copy
  6. Depois disso, você pode consultar a exibição do Account Usage DATA_CLASSIFICATION_LATEST para ver o resultado de classificação mais recente da tabela.

Repita essas etapas para cada esquema que contém tabelas que você deseja classificar.

Uso do Snowsight para classificar tabelas em um esquema

Essa abordagem usa Snowsight para preparar a classificação de tabelas em um esquema e para marcar automaticamente colunas para cada tabela no esquema. O procedimento pressupõe que você use uma função com as concessões apropriadas.

Para classificar todas as tabelas em um esquema e definir tags do sistema em cada coluna de cada tabela contida no esquema, conclua as etapas a seguir em Snowsight:

  1. Acione a classificação e marcação de tabelas no esquema:

    1. Em Snowsight, use o explorador de objetos para navegar até o esquema selecionado.

    2. Selecione o menu More () e selecione Classify Data.

    3. Selecione um warehouse e ative a opção Auto-tagging data.

    4. Selecione Classify Data and Apply Tags.

      Você pode selecionar esta opção para reclassificar uma tabela que foi classificada anteriormente.

    Snowsight classifica até 1.000 tabelas por vez. Se o seu esquema contiver mais de 1.000 tabelas, conclua primeiro este procedimento para o lote inicial de tabelas e depois repita o procedimento para as tabelas restantes.

    Como alternativa, você pode abrir um Worksheet e chamar SYSTEM$CLASSIFY_SCHEMA conforme mostrado em Uso do SQL para classificar tabelas em um esquema. Se você escolher essa opção, navegue de volta ao esquema no explorador de objetos depois de chamar esse procedimento armazenado.

  2. Permita que o processo de classificação seja concluído. Quando concluído, uma marca de seleção verde aparece na coluna CLASSIFICATION.

  3. Selecione View Results.

    Se você decidir desativar a opção Auto-tagging data, selecione Review Classification, avalie os resultados e determine o valor da tag a ser definido em cada coluna.

    Para visualizar as tags definidas nas colunas da guia Column details, use uma função concedida a IMPORTED PRIVILEGES no banco de dados SNOWFLAKE.

  4. Avalie a coluna VALUE TO BE APPLIED, altere o valor da tag conforme necessário e selecione Complete classification.

  5. A guia Tables exibe Classification results reviewed and applied. Você pode confirmar as atribuições de tags fazendo o seguinte:

    1. Selecione a tabela.

    2. Navegue até a guia Columns.

    3. Analise a coluna TAGS.

    Como alternativa, você pode fazer o seguinte:

    1. Use uma planilha para chamar a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para visualizar as atribuições de tags para colunas em uma tabela específica. Para outras opções, consulte Rastreamento de tags do sistema.

    2. Revise os registros da exibição do Account Usage DATA_CLASSIFICATION_LATEST navegando até a exibição usando o explorador de objetos ou consultando a exibição em uma planilha.

  6. Repita essas etapas para outros esquemas que contenham tabelas para classificação.