Caso de uso: sobreposição e segmentação

O Snowflake fornece um modelo de sobreposição e segmentação para determinar quais entidades existem nos dados para todos os colaboradores e mostrar informações agregadas sobre essas entidades.

Ao usar esse modelo, duas partes adicionam uma ou mais tabelas a uma clean room. As entidades nessas tabelas são unidas ou identificadas pelas colunas de junção que você especificar. Além disso, a contagem de sobreposições pode ser dividida e filtrada por atributos de segmentação específicos. Isso permite que as partes tenham uma visão da sobreposição entre seus conjuntos de dados, o que pode ajudar a determinar o valor da colaboração e facilitar outros casos de uso downstream na clean room. O consumidor especifica quais colunas devem ser unidas e quais colunas devem ser exibidas. Todas as colunas projetadas devem ser agrupadas ou agregadas com uma função de agregação. As colunas que identificam a entidade são bloqueadas nos resultados de consulta e a privacidade diferencial é aplicada pela clean room para proteger ainda mais as informações sobre entidades específicas. Se habilitado pelo criador da clean room, os resultados podem ser ativados para terceiros (somente aplicativo Web).

Por exemplo, um anunciante pode realizar uma análise de sobreposição no inventário de um editor para ajudar a informar o valor da compra de mídia nesse editor. O anunciante então ativa os IDs do público-alvo desejado de volta para o editor para fins de segmentação.

O modelo de sobreposição e segmentação está disponível para uso tanto no aplicativo Web quanto no código. O aplicativo Web permite o uso fácil de provedores de identidade e a ativação de parceiros terceirizados, enquanto o uso do código permite várias tabelas do provedor e consumidor.

Uso de aplicativos Web

No aplicativo Web, esse caso de uso é compatível por meio de um modelo pronto chamado Audience Overlap & Segmentation. Embora esse modelo seja voltado para casos de uso de marketing e publicidade, ele pode ser usado para qualquer caso de uso de sobreposição e segmentação em todos os setores. Siga as etapas abaixo para saber como criar e usar esse modelo.

Recursos do modelo Web:

  • Ativação com um clique, se configurada pelo administrador da clean room.

  • Uso de provedores de identidade com um clique, se configurado pelo administrador da clean room.

  • Suporte a análises conduzidas por provedores.

  • Ambos os lados podem importar dados e especificar colunas de junção (não visualizáveis), projetadas (visualizáveis) e ativáveis (que podem ser exportadas para um terceiro designado, se a ativação estiver ativada)

  • Consulta de sobreposição em uma tabela de consumidor e uma tabela de provedor das tabelas disponíveis.

  • Privacidade diferencial configurável.

Nota

Experimente o tutorial da interface da Web para ver um passo a passo completo do uso de clean rooms no aplicativo Web. Esse modelo também é abordado neste tutorial.

Etapa 1: o provedor cria a clean room

Veja como um provedor cria e configura uma clean room com o modelo Audience Overlap & Segmentation:

  1. Faça login no aplicativo Web e crie uma nova clean room.

  2. Em Add Data, faça o seguinte:

    1. Escolha as tabelas para vincular (importar) para a clean room. Se as tabelas de que você precisa não estiverem listadas, fale com um administrador de clean rooms.

  3. Em Specify Join Policies, faça o seguinte:

    • Escolha em quais colunas um colaborador pode se unir a partir de suas tabelas. Lembre-se de que as colunas uníveis também não podem ser exibidas ou usadas na análise para segmentação, filtragem ou agrupamento.

    • Se você quiser usar um provedor de identidade para ajudar a resolver entidades que possam ter vários identificadores, por exemplo, um único indivíduo que tenha várias contas de e-mail em diferentes bancos de dados, escolha um provedor de identidade em Identity Hub.

  4. Em Configure Analysis & Query, faça o seguinte:

    1. Selecione Audience Overlap & Segmentation como o tipo de análise. (Você pode selecionar vários modelos para uma clean room) As opções de configuração de cada modelo serão exibidas na página.

    2. Para Tables, escolha quais tabelas que você vinculou anteriormente devem estar disponíveis para os consumidores nessa clean room com esse modelo.

    3. Use Segmentation & Attribute Columns para escolher quais colunas são exibidas nos resultados de consulta. O colaborador pode exibir, filtrar e agrupar por colunas selecionadas. Os colaboradores podem ativar esses valores de atributos quando a ativação do Snowflake estiver habilitada na clean room. Se não vir uma coluna listada aqui, provavelmente é porque você a marcou como juntável, e uma coluna não pode ser juntável e visível nos resultados de consulta.

    4. Allow categorical value previews during filtering especifica se as visualizações mostram valores reais. Ele é ativado por padrão se houver menos de 20 valores distintos na coluna, mas desativado por padrão se houver mais de 20 valores distintos, para proteger as PII.

    5. Consulte a seção Activation Settings para ativar, configurar ou desativar a ativação dos dados de resultados:

      • Selecione ID Columns que deve estar disponível durante os casos de uso de ativação. Por padrão, as colunas da política de junção são selecionadas automaticamente.

      • Habilite Allow non-overlap activation para ativar os IDs de seu conjunto de dados sem corresponder a IDs no conjunto de dados de seu colaborador. Por exemplo, se você trouxesse 100 IDs e executasse uma análise de sobreposição com seu colaborador e apenas 25 IDs se sobrepusessem, a ativação sem sobreposição ativaria os 75 IDs não correspondentes do seu conjunto de dados.

      • Revise Enabled Partners para garantir que apenas os destinos de ativação preferidos sejam ativados em sua clean room. Se você precisar alterar os destinos habilitados, fale com um administrador de clean rooms.

    6. Atualize o Privacy Settings padrão conforme necessário:

      • Threshold Value é ativado por padrão e definido como 5. Isso impede que os resultados sejam exibidos para qualquer grupo em que a contagem distinta de uma coluna de política de junção esteja abaixo desse limite.

      • Differential Privacy está desativado por padrão. Quando ativado, ele oferece proteção contra possíveis ataques de diferenciação, adicionando ruído aos resultados e limitando o número de consultas diárias. Saiba mais sobre Privacidade diferencial no Snowflake Data Clean Rooms e entenda os custos de ativar esse recurso.

  5. Em Share clean rooms, faça o seguinte:

    • Expanda o menu Select collaborator para adicionar colaboradores à clean room. Os colaboradores receberão um e-mail convidando-os a participar e usar sua clean room, conforme descrito a seguir. A lista de colaboradores na página mostra todas as contas, incluindo a sua, que podem acessar essa clean room.

    • Selecione Enable run analysis and query ao lado de um colaborador para controlar se essa conta pode executar um modelo na clean room. Por padrão, sua própria conta não pode executar uma análise na clean room (ou seja, análises executadas pelo provedor estão desativadas por padrão). Por padrão, os consumidores podem executar qualquer modelo na clean room.

Etapa 2: o consumidor entra na clean room

Veja como um consumidor se junta e configura uma clean room que inclui o modelo de análise Audience Overlap & Segmentation:

  1. Faça login no aplicativo Web e participe da clean room.

  2. Em Add Data, faça o seguinte:

    • Escolha as tabelas para vincular (importar) para a clean room. Se as tabelas de que você precisa não estiverem listadas, fale com um administrador de clean rooms.

  3. Em Specify Join Policies, faça o seguinte:

    • Decida quais colunas juntáveis em seus dados mapeiam para colunas juntáveis nos dados do provedor. Você especificará em qual dessas colunas deseja fazer a junção a cada execução.

    • Se quiser usar um provedor de identidade para ajudar a resolver entidades que possam ter vários identificadores – por exemplo, um único indivíduo que tenha várias contas de e-mail em diferentes bancos de dados – escolha um provedor de identidade no Identity Hub.

  4. Na etapa Configure Analysis & Query, faça o seguinte:

    • Selecione a análise Audience Overlap & Segmentation para exibir as opções de configuração para esse modelo.

    • Escolha quais de suas tabelas devem ser usadas nessa análise no menu suspenso Tables.

    • Use Segmentation & Attribute Columns para escolher quais colunas são exibidas nos resultados de consulta. Essas colunas também podem ser ativadas quando a ativação do Snowflake estiver habilitada na clean room. Se não vir uma coluna listada aqui, provavelmente é porque você a marcou como juntável, e uma coluna não pode ser juntável e visível nos resultados de consulta.

    • Selecione ID Columns que deve estar disponível durante os casos de uso de ativação. Por padrão, as colunas da política de junção são selecionadas automaticamente.

    • Opcionalmente, habilite Allow activation for clean room provider para permitir que o provedor de clean room ative os destinos de ativação compatíveis. Essa opção é exibida somente quando a execução pelo provedor está ativada na clean room. Observe que essa ativação permite que os dados em nível de linha sejam ativados de volta para a conta de provedor. Observe que o consumidor é cobrado pelos custos de computação ao executar as consultas e a ativação do provedor, embora o consumidor deva concordar em permitir a ação do provedor.

    • Analise Enabled Partners para garantir que os destinos de ativação preferenciais estejam ativados na clean room. Se precisar alterar os destinos habilitados, entre em contato com o provedor da clean room.

  5. Clique em Finish para salvar seus resultados. Para executar a análise, consulte a próxima seção.

Etapa 3: o consumidor executa a análise

Nota

A configuração padrão permite que apenas o consumidor execute uma análise usando esse modelo. Para ativar a análise executada pelo provedor com esse modelo, o provedor deve abrir a guia Share clean rooms na configuração da clean room e selecionar Enable run analysis and query ao lado do nome da conta.

Depois que o provedor e consumidor configurarem a clean room para a sobreposição e segmentação do público-alvo, qualquer uma das partes com permissão para executar uma análise poderá fazer isso desta forma:

  1. No aplicativo Web, navegue até Clean rooms.

  2. Selecione Run para a clean room em que você configurou a sobreposição de público e, em seguida, selecione Audience Overlap & Segmentation > Proceed. (Como alternativa, acesse a página Analyses & Queries, selecione + New Analysis & Query, escolha o tipo Audience Overlap & Segmentation e, em seguida, escolha a clean room que tenha esse tipo de análise configurado)

  3. Configure os detalhes da execução em Query Configurations section:

    • My tables – Escolha quais de suas tabelas serão unidas às tabelas de seu colaborador.

    • Collaborator table – Escolha uma tabela de colaboradores para participar de sua tabela.

    • My join columns – Selecione todas as colunas a serem unidas entre as tabelas.

    • User segmentation – Opcionalmente, selecione colunas de agrupamento.

    • Filters – Opcionalmente, forneça um ou mais filtros nas colunas especificadas como colunas de segmentação e atributo durante a configuração.

    • Privacy settings – Essa consulta implementa privacidade diferencial e um número mínimo de linhas por agrupamento. Você pode ver a privacidade diferencial usada e restante e o tamanho mínimo do grupo aqui.

  4. Se estiver conduzindo a análise como consumidor, você pode alterar o tamanho do warehouse para melhorar os tempos de consulta selecionando um warehouse maior ou reduzir o custo selecionando um warehouse menor. Ao realizar uma análise como provedor, a seleção de warehouse não permanece disponível, mas o dimensionamento automático tentará otimizar os tempos de consulta.

  5. Selecione Run. Se essa for uma nova consulta, faça o seguinte:

  6. Selecione Save para iniciar ou programar a execução. Pode levar algum tempo para concluir cada execução. Você pode verificar o status ou os resultados da análise na página Analysis & Queries do aplicativo Web.

Uso do código

Você pode baixar e executar um notebook de amostra que mostra como usar o exemplo de sobreposição e segmentação no código SQL. Esse exemplo pode ser carregado e executado no Snowsight.

O notebook não demonstra como usar provedores de identidade, ativação para provedores de terceiros ou análises executadas pelo provedor. Consulte os tópicos vinculados para demonstrar como realizar essas ações no código.

Pré-requisitos

Você deve ter duas contas na mesma organização com o Snowflake Data Clean Rooms instalado. Use uma conta para o provedor e outra para o consumidor.

Instale e execute o exemplo de código

  1. Faça o download do exemplo de notebook.

  2. Instale o notebook em suas contas de provedor e consumidor. Para realizar o upload de um notebook, faça o seguinte:

    1. Navegue até Projects » Notebooks no Snowsight.

    2. Selecione + Notebook » Import .ipynb file.

    3. Selecione o arquivo .ipynb que você baixou.

    4. Dê ao arquivo o nome que desejar e escolha um banco de dados e um esquema.

    5. Mantenha o warehouse padrão APP_WH.

    6. Selecione Create.

    7. Abra o notebook na conta de provedor e preencha a parte do provedor para criar a clean room.

    8. Abra o notebook na conta de consumidor e conclua a parte do consumidor para instalar e configurar a clean room e executar o modelo.