Cortex Analyst¶

Visão geral¶

Cortex Analyst é um recurso de LLM do Snowflake Cortex totalmente gerenciado e habilitado que ajuda você a criar aplicativos capazes de responder de forma confiável a perguntas de negócios com base em seus dados estruturados no Snowflake. Com o Cortex Analyst, os usuários empresariais podem fazer perguntas em linguagem natural e receber respostas diretas sem escrever SQL. Disponível como um REST API prático, Cortex Analyst pode ser perfeitamente integrado em qualquer aplicativo.

Criar uma solução de análise de autoatendimento conversacional de nível de produção requer um serviço que gere respostas SQL de texto precisas. Para a maioria das equipes, desenvolver um serviço que equilibre com sucesso precisão, latência e custos é uma tarefa assustadora. O Cortex Analyst simplifica esse processo ao fornecer um sistema de AI de agente sofisticado e totalmente gerenciado que lida com todas essas complexidades, gerando respostas SQL de texto altamente precisas. Ele ajuda você a acelerar a entrega de análise conversacionais de alta precisão e autoatendimento para equipes de negócios, evitando perdas de tempo, como padrões de soluções RAG complexos, experimentação de modelo e planejamento de capacidade de GPU. As consultas SQL geradas são executadas no mecanismo escalável Snowflake, garantindo desempenho de preço líder do setor e menor custo total de propriedade (TCO).

Dica

Quer começar a usar o Cortex Analyst rapidamente? Experimente o tutorial Tutorial: Responda a perguntas sobre dados de receita de séries temporais com o Cortex Analyst.

Principais recursos¶

Análises de autoatendimento por meio de consultas em linguagem natural. Encante suas equipes de negócios e usuários não técnicos com respostas instantâneas e insights de seus dados estruturados no Snowflake. Usando o Cortex Analyst, você pode criar aplicativos de bate-papo downstream que permitem que seus usuários façam perguntas usando linguagem natural e recebam respostas precisas rapidamente.
REST API conveniente para integração em fluxos de trabalho empresariais existentes. Cortex Analyst adota uma abordagem de primeiro API, dando a você controle total sobre a experiência do usuário final. Integre facilmente o Cortex Analyst às ferramentas e plataformas de negócios existentes, levando o poder dos insights de dados para onde os usuários de negócios já operam, como aplicativos Streamlit, Slack, Teams, interfaces de bate-papo personalizadas e muito mais.
Desenvolvido com modelos de linguagem de última geração: Por padrão, Cortex Analyst é desenvolvido com os modelos mais recentes Meta Llama e Mistral, que são executados com segurança dentro do Snowflake Cortex, o serviço de AI inteligente e totalmente gerenciado da Snowflake. Opcionalmente, você também pode dar acesso ao Cortex Analyst aos modelos mais recentes de OpenAI GPT hospedados no Azure. Em tempo de execução, Cortex Analyst seleciona a melhor combinação de modelos para garantir a mais alta precisão e desempenho para cada consulta. Para obter mais detalhes, consulte Habilitação do uso de modelos do Azure OpenAI. À medida que LLMs evoluem, a Snowflake continuará explorando a adição de mais modelos à mistura para melhorar ainda mais o desempenho e a precisão.
Modelo semântico para alta precisão e exatidão: soluções de AI genéricas geralmente têm dificuldades com conversões de texto para SQL quando recebem apenas um esquema de banco de dados, pois os esquemas não têm conhecimento crítico, como definições de processos de negócios e tratamento de métricas. O Cortex Analyst supera essa limite usando um modelo semântico que preenche a lacuna entre usuários de negócios e bancos de dados. Capturados em um arquivo YAML leve, a estrutura geral e os conceitos do modelo semântico são semelhantes aos dos esquemas de banco de dados, mas permitem uma descrição mais rica das informações semânticas em torno dos dados.
Segurança e governança. A base de privacidade em primeiro lugar e a segurança de nível empresarial da Snowflake garantem que você possa explorar casos de uso orientados a AI com confiança, sabendo que seus dados estão protegidos pelos mais altos padrões de privacidade e governança.
- Cortex Analyst não faz treinamento em dados do cliente. Não usamos seus Dados do Cliente para treinar ou ajustar qualquer modelo a ser disponibilizado para uso em nossa base de clientes. Além disso, para inferência, Cortex Analyst utiliza os metadados fornecidos no arquivo YAML de modelo semântico (por exemplo, nomes de tabela, nomes de colunas, tipo de valor, descrições etc.) apenas para geração de consulta SQL. Essa consulta SQL é então executada no seu warehouse virtual Snowflake para gerar a saída final.
- Os dados permanecem dentro dos limites de governança da Snowflake. Por padrão, Cortex Analyst é alimentado por LLMs hospedados do Snowflake da Mistral e Meta, garantindo que nenhum dados, incluindo metadados ou prompts, saia dos limites de governança do Snowflake. Se você optar por usar modelos OpenAI do Azure, somente metadados e prompts serão transmitidos fora do limite de governança do Snowflake.
- Integração perfeita com os recursos de privacidade e governança do Snowflake. Cortex Analyst integra-se totalmente com as políticas de controle de acesso baseadas em funções (RBAC) do Snowflake, garantindo que as consultas SQL geradas e executadas estejam de acordo com todos os controles de acesso estabelecidos. Isso garante segurança e governança robustas para seus dados.

Requisitos de controle de acesso¶

Para fazer uma solicitação ao Cortex Analyst, é necessário usar uma função que tenha a função SNOWFLAKE.CORTEX_USER concedida.

Para usar o Cortex Analyst com um modelo semântico, você também precisa dos seguintes privilégios:

Privilégio	Objeto
READ ou WRITE	Estágio que contém o arquivo YAML do modelo semântico, se o modelo semântico for carregado em um estágio.
USAGE	Os serviços Cortex Search mencionados no modelo semântico.
SELECT	As tabelas mencionadas no modelo semântico.

As solicitações para a Cortex Analyst API devem incluir um token de autorização. Para obter detalhes sobre como se autenticar na API, consulte Autenticando o Snowflake REST APIs com Snowflake.

Observe que o exemplo deste tópico usa um token de sessão para se autenticar em uma conta Snowflake.

Limitação do acesso a funções específicas¶

Por padrão, a função CORTEX_USER é concedida à função PUBLIC. A função PUBLIC é concedida automaticamente a todos os usuários e funções. Se não quiser que todos os usuários tenham esse privilégio, você pode revogar o acesso à função PUBLIC e conceder acesso a funções específicas. Para obter mais informações, consulte Privilégios obrigatórios.

Para controlar o acesso a modelos semânticos específicos, é possível armazenar o arquivo YAML em um estágio e controlar o acesso a esse estágio.

Disponibilidade de região¶

Cortex Analyst está disponível nativamente nas seguintes regiões.

AWS ap-northeast-1 (Tokyo)
AWS ap-southeast-2 (Sydney)
AWS us-east-1 (Virginia)
AWS us-west-2 (Oregon)
AWS eu-central-1 (Frankfurt)
AWS eu-west-1 (Ireland)
Azure East US 2 (Virginia)
Azure West Europe (Netherlands)

Se sua conta Snowflake estiver em uma região de nuvem diferente, você ainda poderá usar Cortex Analyst aproveitando o Inferência entre regiões. Depois que a inferência entre regiões estiver habilitada, Cortex Analyst processa solicitações em outras regiões para modelos que não estão disponíveis na sua região padrão. Para um desempenho ideal, faça a configuração entre regiões com regiões AWS US.

Problemas e limitações conhecidos¶

Se você carregar um arquivo YAML de modelo semântico em um estágio, o acesso a esse modelo semântico será controlado pelo acesso ao estágio em que ele foi carregado. Isso significa que qualquer função com acesso ao estágio pode acessar os modelos semânticos naquele estágio, mesmo que a função não tenha acesso às tabelas subjacente.
Por padrão, Cortex Analyst tem uma taxa limitada a 20 solicitações por minuto, o que deve ser suficiente para prova de conceito. Entre em contato com seu engenheiro de vendas para solicitação um limite maior.

Habilitação do uso de modelos do Azure OpenAI¶

Por padrão, o Cortex Analyst é alimentado por LLMs hospedados no Snowflake. No entanto, você pode optar explicitamente por permitir que o Cortex Analyst use dos modelos OpenAIGPT mais recentes, hospedados pelo Microsoft Azure, juntamente com os modelos hospedados pelo Snowflake. Em tempo de execução, Cortex Analyst seleciona a combinação ideal de modelos para garantir a mais alta precisão e desempenho para cada consulta.

Nota

Se você optar por usar os modelos OpenAI do Azure, Cortex Analyst estará disponível para uso em todas as regiões AWS, Azure e GCP, exceto implantações Gov e VPS.

Você pode configurar sua conta para permitir o uso dos modelos OpenAI GPT do Azure com o parâmetroENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI. Por padrão, o parâmetro está desabilitado e só pode ser definir pela função ACCOUNTADMIN usando o comando ALTER ACCOUNT:

USE ROLE ACCOUNTADMIN;

ALTER ACCOUNT SET ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI = TRUE;

Copy

Dica

Para ver o valor atual deste parâmetro, use a seguinte instrução SQL.

SHOW PARAMETERS LIKE 'ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI' IN ACCOUNT

Copy

Consulte ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI para obter mais detalhes.

Quando este parâmetro estiver habilitado, Cortex Analyst poderá ser alimentado por qualquer combinação de:

Modelos hospedados pela Snowflake, atualmente modelos Mistral Large e Llama3
Modelos OpenAI do Azure, atualmente GPT-4o (requer aceitação explícita)

Nota

Cortex Analyst pode usar modelos diferentes no futuro para melhorar ainda mais o desempenho e a precisão.

Considerações¶

Arquivos de modelo semântico são classificados como metadados. Se você optar por usar modelos OpenAI do Azure no Cortex Analyst, seu modelo semântico será processado pelo Microsoft Azure, um terceiro. No entanto, os Dados do Cliente não são compartilhados nem processados pelo Azure.

ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI¶

O parâmetro de conta ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI, se TRUE, permite que o Cortex Analyst use os modelos OpenAI do Azure.

Tipo de parâmetro	Sessão
Tipo de dados	BOOLEAN
Descrição	Controla se o Cortex Analyst pode usar modelos OpenAI do Azure para processar solicitações.
Valores	FALSE: Cortex Analyst usa apenas modelos hospedados pelo Snowflake para processar solicitações. TRUE: Cortex Analyst pode usar modelos OpenAI do Azure, além de modelos hospedados no Snowflake, para processar solicitações.
Padrão	FALSE

Conversas com múltiplas interações no Cortex Analyst¶

O Cortex Analyst oferece suporte a conversas com várias interações para perguntas relacionadas a dados. Esse recurso permite fazer perguntas complementares que se baseiam em consultas anteriores, criando uma experiência de exploração de dados mais dinâmica e interativa. Por exemplo, o usuário pergunta: «Qual é o crescimento da receita mês a mês para 2021 na Ásia?» e, em seguida, pergunta: «E na América do Norte?»

O Cortex Analyst reconhece o acompanhamento, recupera o contexto da consulta inicial e reformula a segunda pergunta como: «Qual é o crescimento da receita mês a mês para 2021 na América do Norte?» O Cortex Analyst gera uma consulta SQL para responder a essa pergunta.

Para usar esse recurso, passe o histórico da conversa no campo messages:

{
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "What is the month over month revenue growth for 2021 in Asia?"
                }
            ]
        },
        {
            "role": "analyst",
            "content": [
                {
                    "type": "text",
                    "text": "We interpreted your question as ..."
                },
                {
                    "type": "sql",
                    "statement": "SELECT * FROM table"
                }
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "What about North America?"
                }
            ]
        },
    ],
    "semantic_model_file": "@my_stage/my_semantic_model.yaml"
}

Copy

O histórico da conversa é uma matriz de mensagens em ordem cronológica, em que cada mensagem tem uma função e um conteúdo. A função pode ser "user" (para perguntas anteriores) ou "analyst" (para respostas anteriores). As respostas do analista têm texto e respostas SQL, conforme mostrado no exemplo acima, enquanto as mensagens do usuário têm apenas texto.

Limitações conhecidas em conversas com múltiplas interações¶

Algumas das limitações a seguir podem ser abordadas em versões futuras do Cortex Analyst.

Acesso aos resultados de consultas SQL anteriores: O Cortex Analyst não tem acesso aos resultados de consultas SQL anteriores. Por exemplo, se você perguntar primeiro «Quais são meus produtos?» e depois perguntar «Qual é a receita do segundo produto?», o Cortex Analyst não poderá consultar a lista de produtos da primeira consulta para obter o segundo produto.
Insights gerais sobre os negócios: O Cortex Analyst limita-se a responder a perguntas que podem ser resolvidas com SQL. Ele não gera insights para consultas mais amplas relacionadas aos negócios, como «Quais tendências você observa?»
Conversas longas: Se uma conversa tiver muitas interações ou o usuário mudar de intenção com frequência, o Cortex Analyst poderá ter dificuldade para interpretar as perguntas de acompanhamento. Nesses casos, reinicie a conversa e comece novamente.

Opções de introdução¶

Os desenvolvedores podem usar os seguintes recursos para começar a usar o Cortex Analyst:

Exemplo de código básico: o Exemplo de Cortex Analyst na seção a seguir fornece um script simples e fácil de ler que o ajuda a criar um aplicativo interativo usando o Cortex Analyst.

Escolha essa opção se você quiser um exemplo básico fundamental para começar e se sentir à vontade para usar o Streamlit e fazer suas próprias modificações. É possível executar este exemplo no Streamlit in Snowflake (SiS) ou localmente.
Repositório de amostras do Snowflake: se, em vez disso, você estiver procurando uma implementação mais abrangente, a demonstração de SiS avançada do Cortex Analyst no repositório Snowflake Samples tem todos os recursos e opções já configurados. Esse repositório é configurado com vários recursos pré-configurados que tornam a implementação do Cortex Analyst simples e robusta.

Escolha essa opção se estiver tentando testar o recurso pela primeira vez ou se tiver menos modificações personalizadas a fazer.

Nota

Isso é mostrado apenas como um exemplo. A Snowflake não fornece suporte ao conteúdo abaixo, nem garante que o conteúdo abaixo seja preciso.

Para saber mais, consulte a Demonstração de SiS avançada do Cortex Analyst no repositório GitHub Snowflake Samples.

Exemplo de Cortex Analyst¶

Siga estas etapas para criar um Streamlit interativo no Snowflake (SiS) ou um aplicativo Streamlit independente que usa Cortex Analyst.

Criar um modelo semântico
Carregar o modelo semântico para o estágio
Criar e executar um Streamlit no app Snowflake
Interagir com o Streamlit no aplicativo Snowflake

Criar um modelo semântico¶

Um modelo semântico é um mecanismo leve que aborda questões relacionadas à diferença de linguagem entre usuários empresariais e definições de banco de dados, permitindo a especificação de detalhes semânticos adicionais sobre um conjunto de dados. Esses detalhes semânticos adicionais, como nomes mais descritivos ou sinônimos, permitem ao Cortex Analyst responder a perguntas de dados de forma muito mais confiável.

Comece com uma lista de perguntas que você gostaria que o Cortex Analyst respondesse. Com base nisso, decida o conjunto de dados para seu modelo semântico.
Crie seu modelo semântico com base em YAML na especificação. Para sua conveniência, experimente o Criação de um modelo semântico usando o gerador de modelos. Além disso, não deixe de revisar as dicas para criar um modelo semântico.

Carregar modelo semântico¶

Você pode carregar um arquivo YAML de modelo semântico para um estágio ou passar o modelo semântico YAML como uma cadeia de caracteres no corpo da solicitação. Se você carregar um YAML de modelo semântico em um estágio, o acesso a esse modelo semântico será controlado pelo acesso ao estágio em que ele foi carregado. Isso significa que qualquer função com acesso ao estágio pode acessar os modelos semânticos naquele estágio, mesmo que a função não tenha acesso às tabelas nas quais os modelos são baseados. Garanta que as funções com acesso concedido a um estágio tenham acesso SELECT a todas as tabelas referenciadas em todos os modelos semânticos naquele estágio.

Abaixo está um exemplo de como definir os estágios contendo os modelos semânticos. Um estágio (public) é acessível a todos os membros da organização, enquanto outro estágio (sales) é acessível apenas à função sales_analyst.

Crie o banco de dados e o esquema para o estágio. O exemplo a seguir cria um banco de dados chamado semantic_model com um esquema chamado definition, mas você pode usar qualquer cadeia de caracteres de identificador válida para esses nomes.

CREATE DATABASE semantic_model;
CREATE SCHEMA semantic_model.definitions;
GRANT USAGE ON DATABASE semantic_model TO ROLE PUBLIC;
GRANT USAGE ON SCHEMA semantic_model.definitions TO ROLE PUBLIC;

USE SCHEMA semantic_model.definitions;

Copy

Em seguida, crie os estágios para armazenar seus modelos semânticos:

CREATE STAGE public DIRECTORY = (ENABLE = TRUE);
GRANT READ ON STAGE public TO ROLE PUBLIC;

CREATE STAGE sales DIRECTORY = (ENABLE = TRUE);
GRANT READ ON STAGE sales TO ROLE sales_analyst;

Copy

Se estiver usando o Snowsight, você pode atualizar a página e encontrar os estágios recém-criados no explorador de objeto de banco de dados. Você pode abrir a página do estágio em uma nova guia e carregar seus arquivos YAML no Snowsight.

Como alternativa, você pode usar o cliente Snowflake CLI para fazer upload do seu sistema de arquivo local.

snow stage copy file:///path/to/local/file.yaml @sales

Copy

Criação de um Streamlit no aplicativo Snowflake¶

Este exemplo mostra como criar um Streamlit no aplicativo Snowflake que recebe uma pergunta em linguagem natural como entrada e chama Cortex Analyst para gerar uma resposta com base no modelo semântico fornecido.

Nota

Isso é mostrado apenas como um exemplo. A Snowflake não fornece suporte ao conteúdo abaixo, nem garante que o conteúdo abaixo seja preciso.

Para obter mais informações sobre como criar e executar aplicativos Streamlit no Snowflake, consulte Sobre a Streamlit in Snowflake.

Siga as instruções em Criação de um aplicativo Streamlit usando Snowsight para criar um novo aplicativo Streamlit no Snowsight.
Copie o código Streamlit de nosso repositório GitHub para o editor de código.
Substitua os valores do espaço reservado pelos detalhes da sua conta.
Para versão preliminar do aplicativo, selecione Run para atualizar o conteúdo no painel de versão preliminar do Streamlit.

Interagir com o aplicativo Streamlit¶

Navegue até o aplicativo Streamlit no seu navegador ou até o painel de versão preliminar do Streamlit no Snowflake.
Comece a fazer perguntas sobre seus dados em linguagem natural (por exemplo “Quais perguntas posso fazer?”).

Criação de um aplicativo Streamlit independente¶

Você também pode usar o código de exemplo para criar um aplicativo autônomo.

Nota

Isso é mostrado apenas como um exemplo. A Snowflake não fornece suporte ao conteúdo abaixo, nem garante que o conteúdo abaixo seja preciso.

Instale o Streamlit.
Crie um arquivo Python localmente chamado analyst_api.py.
Copie o código Streamlit de nosso repositório GitHub para o arquivo.
Substitua os valores do espaço reservado pelos detalhes da sua conta.
Execute o aplicativo Streamlit usando streamlit run analyst_api.py.

O banco de dados e esquema especificados no código são o local de estágio do arquivo YAML do modelo semântico. A função usada no conector Snowflake deve ter acesso aos dados subjacente definidos no modelo semântico.

Para obter uma implementação mais abrangente, consulte a Demonstração de SiS avançada do Cortex Analyst no repositório GitHub Snowflake Samples. Esse repositório é configurado com vários recursos pré-configurados que tornam a implementação do Cortex Analyst simples e robusta.

Como desabilitar a funcionalidade Cortex Analyst¶

Se você não quiser que Cortex Analyst esteja disponível em sua conta, desabilite o recurso alterando o parâmetro ENABLE_CORTEX_ANALYST usando a função ACCOUNTADMIN:

USE ROLE ACCOUNTADMIN;
ALTER ACCOUNT SET ENABLE_CORTEX_ANALYST = FALSE;

Copy

Tipo de parâmetro	Sessão
Tipo de dados	BOOLEAN
Descrição	Controla se a funcionalidade Cortex Analyst está habilitada na sua conta.
Valores	FALSE: a funcionalidade Cortex Analyst não está disponível. TRUE: a funcionalidade Cortex Analyst está disponível. Se ENABLE_CORTEX_ANALYST_MODEL_AZURE_OPENAI estiver definir como TRUE, Cortex Analyst poderá usar modelos OpenAI do Azure e também modelos hospedados no Snowflake. Caso contrário, somente modelos hospedados pelo Snowflake podem ser usados.
Padrão	TRUE

Considerações sobre custo¶

O uso da taxa de crédito para o Cortex Analyst baseia-se no número de mensagens processadas, conforme descrito em Snowflake Service Consumption Table. Somente as respostas bem-sucedidas (HTTP 200) são contadas. O número de tokens em cada mensagem não afeta o custo.

Nota

As tarifas acima cobrem os custos de AI de texto para SQL. Custos adicionais de warehouse se aplicam se você executar o SQL gerado pelo Cortex Analyst.

Monitoramento do custo do Cortex Analyst¶

Para visualizar o consumo de crédito para o Cortex Analyst, use Exibição CORTEX_ANALYST_USAGE_HISTORY. Por exemplo:

SELECT * FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_ANALYST_USAGE_HISTORY;

Copy

O uso do Cortex Analyst também aparece na exibição Exibição METERING_HISTORY do esquema ACCOUNT_USAGE com um tipo de serviço de AI_SERVICES.

Avisos legais¶

Cortex Analyst é alimentado por tecnologia de machine learning, incluindo os modelos Llama 3 e Mistral Large da Meta. Os modelos base Llama 3 são licenciados sob a Licença Comunitária Llama 3 e os direitos autorais (c) Meta Platforms, Inc. Todos os direitos reservados. O uso deste recurso está sujeito à política de uso aceitável da Meta_.

A classificação dos dados de entradas e saídas é definido na tabela a seguir.

Classificação de dados de entrada	Classificação de dados de saída	Designação
Usage Data	Usage Data	Preview AI Features [1]

Para obter informações adicionais, consulte AI e ML Snowflake.