Uso da classificação de dados¶
Este tópico fornece informações sobre como classificar tabelas em um esquema, revisar os resultados da classificação e definir tags do sistema nas colunas das tabelas usando SQL ou Snowsight.
Visão geral¶
Um administrador de dados pode classificar tabelas em um esquema para atender aos regulamentos de privacidade de dados. Essas tabelas incluem os seguintes cenários:
Novas tabelas em um esquema.
Novas colunas ou colunas alteradas em uma tabela no mesmo esquema.
Tabelas previamente classificadas que talvez precisem ser classificadas novamente.
A avaliação desses cenários permite que o administrador de dados classifique informações confidenciais e pessoais. Definir tags do sistema na coluna pode facilitar o monitoramento de dados. Posteriormente, um engenheiro de dados pode proteger os dados pessoais e confidenciais com uma política de mascaramento ou política de acesso a linhas em Snowsight ou usando SQL.
Início da classificação de dados¶
Antes de classificar uma única tabela ou tabelas em um esquema:
Escolha um fluxo de trabalho:
Se preferir uma abordagem programática, siga as etapas nestas seções:
Se preferir usar a interface da web, siga as etapas da seção Uso do Snowsight para classificar tabelas em um esquema.
Decida qual warehouse usar. Por exemplo, utilize um warehouse que corresponda ao centro de custo ou à unidade de negócios à qual você pertence para permitir relatórios e orçamentos precisos.
Considere a latência em seu fluxo de trabalho. Snowsight atualiza a área Databases de Snowsight a cada 12 horas, momento em que as tabelas atualizadas podem ser classificadas.
Confirme a configuração de controle de acesso para sua função atual:
Use uma instrução SHOW GRANTS TO ROLE para ver as concessões em objetos que um usuário com essa função pode acessar. A função em uso deve ter estas concessões no mínimo:
USAGE no warehouse para usar durante o processo de classificação.
SELECT na tabela para iniciar o processo de classificação.
A função de banco de dados SNOWFLAKE.CORE_VIEWER, que permite definir as tags do sistema nas colunas.
A função de banco de dados SNOWFLAKE.GOVERNANCE_VIEWER para consultar a exibição Account Usage DATA_CLASSIFICATION_LATEST.
Para outras combinações de concessões, consulte a referência de privilégio de classificação de dados.
O modelo de controle de acesso permite que diferentes personas participem dos fluxos de trabalho. Por exemplo, um administrador de dados pode preparar a classificação de tabelas em um esquema e o engenheiro de dados pode avaliar os resultados em Snowsight. Escolha o modelo de controle de acesso e o fluxo de trabalho que melhor funciona para você.
Uso do SQL para classificar uma única tabela¶
Essa abordagem usa SQL para classificar uma tabela e definir tags do sistema nas colunas das tabelas. Revise a seção Início da classificação de dados para garantir que a função em uso tenha as concessões de controle de acesso necessárias para classificar as tabelas no esquema.
Este procedimento pressupõe que você use uma função com as concessões apropriadas. Conclua as etapas a seguir para usar SQL para classificar tabelas em um esquema e definir tags do sistema nas colunas da tabela:
Identificar uma tabela para classificar.
Chame o procedimento armazenado SYSTEM$CLASSIFY para classificar e marcar as colunas da tabela:
CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'auto_tag': true});
Chame a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para confirmar as atribuições de tags nas colunas da tabela:
SELECT * FROM TABLE( hr.INFORMATION_SCHEMA.TAG_REFERENCES_ALL_COLUMNS( 'hr.tables.empl_info', 'table' ));
Depois disso, você pode consultar a exibição do Account Usage DATA_CLASSIFICATION_LATEST para ver o resultado de classificação mais recente da tabela.
Repita essas etapas para cada tabela que deseja classificar.
Uso do SQL para classificar tabelas de forma assíncrona em um esquema¶
Essa abordagem usa SQL para classificar todas as tabelas, de forma assíncrona, em um esquema e definir tags do sistema nas colunas de cada tabela. Este procedimento pressupõe que você:
Este procedimento pressupõe que você use uma função com as concessões apropriadas.
Selecione um esquema que contenha menos de 1000 objetos de tabela. Você pode usar um comando SHOW TABLES IN SCHEMA para determinar o número de objetos de tabela no esquema.
Conclua as etapas a seguir para usar SQL para classificar todas as tabelas em um esquema e definir tags do sistema em cada coluna de cada tabela:
Identifique um esquema que contém tabelas para classificar.
Chame o procedimento armazenado SYSTEM$CLASSIFY_SCHEMA para agendar a classificação de tabelas no esquema:
CALL SYSTEM$CLASSIFY_SCHEMA('hr.tables', {'auto_tag': true});
Tenha cuidado para não classificar muitos esquemas simultaneamente. Para obter mais informações, consulte as notas de uso.
Para exibir os resultados, chame a função SYSTEM$GET_CLASSIFICATION_RESULT em cada tabela do esquema:
SELECT SYSTEM$GET_CLASSIFICATION_RESULT('hr.tables.empl_info');
Chame a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para confirmar as atribuições de tags nas colunas da tabela:
SELECT * FROM TABLE( hr.INFORMATION_SCHEMA.TAG_REFERENCES_ALL_COLUMNS( 'hr.tables.empl_info', 'table' ));
Depois disso, você pode consultar a exibição do Account Usage DATA_CLASSIFICATION_LATEST para ver o resultado de classificação mais recente da tabela.
Repita essas etapas para cada esquema que contém tabelas que você deseja classificar.
Dica
Se você quiser cancelar a classificação de tabelas em um esquema, chame o procedimento armazenado SYSTEM$CANCEL_CLASSIFY_SCHEMA.
Uso do Snowsight para classificar tabelas em um esquema¶
Essa abordagem usa Snowsight para preparar a classificação de tabelas em um esquema e para marcar automaticamente colunas para cada tabela no esquema. O procedimento pressupõe que você use uma função com as concessões apropriadas.
Para classificar todas as tabelas em um esquema e definir tags do sistema em cada coluna de cada tabela contida no esquema, conclua as etapas a seguir em Snowsight:
Acione a classificação e marcação de tabelas no esquema:
Em Snowsight, use o explorador de objetos para navegar até o esquema selecionado.
Selecione o menu More (…) e selecione Classify and Tag Sensitive Data.
Selecione um warehouse caso ainda não haja um warehouse em uso.
Selecione as tabelas que você deseja classificar. Por padrão, as tabelas não são selecionadas.
Avalie as Advanced Options selecione-as conforme necessário:
A opção Auto-tagging data permite que você atribua tags automaticamente às colunas após classificar os dados. Essa opção é habilitada por padrão e você pode desabilitá-la se necessário.
A opção Include custom classifiers permite que você use os classificadores personalizados que você pode acessar para classificar dados.
Para determinar os classificadores personalizados que você pode acessar, selecione View custom classifiers e execute o comando na planilha.
Selecione Classify and Tag Sensitive Data.
Você pode selecionar esta opção para reclassificar uma tabela que foi classificada anteriormente.
Snowsight classifica até 1000 tabelas.
Como alternativa, você pode abrir um Worksheet e chamar SYSTEM$CLASSIFY_SCHEMA conforme mostrado em Uso do SQL para classificar tabelas de forma assíncrona em um esquema. Se você escolher essa opção, navegue de volta ao esquema no explorador de objetos depois de chamar esse procedimento armazenado. Tenha cuidado com o número de vezes que você chama esse procedimento armazenado em um período de tempo relativamente curto. Para obter mais informações, consulte as notas de uso.
Permita que o processo de classificação seja concluído. Quando concluído, uma marca de seleção verde aparece na coluna CLASSIFICATION.
Selecione View Results.
Altere o valor da tag conforme necessário. Para fazer isso, use uma função que recebeu IMPORTED PRIVILEGES no banco de dados do SNOWFLAKE.
Siga as instruções para revisar e aprovar tabelas no esquema. Atualize os valores das tag conforme necessário.
Selecione Complete classification.
A guia Tables exibe Classification results reviewed and applied. Você pode confirmar as atribuições de tags fazendo o seguinte:
Selecione a tabela.
Navegue até a guia Columns.
Analise a coluna TAGS.
Como alternativa, você pode fazer o seguinte:
Use uma planilha para chamar a função de tabela do Information Schema TAG_REFERENCES_ALL_COLUMNS para visualizar as atribuições de tags para colunas em uma tabela específica. Para outras opções, consulte Rastreamento de tags do sistema.
Revise os registros da exibição do Account Usage DATA_CLASSIFICATION_LATEST navegando até a exibição usando o explorador de objetos ou consultando a exibição em uma planilha.
Repita essas etapas para outros esquemas que contenham tabelas para classificação.