Especificação do modelo semântico Cortex Analyst¶

Por que usar modelos semânticos?¶

O Cortex Analyst permite que os usuários consultem os dados do Snowflake usando linguagem natural. No entanto, os usuários corporativos geralmente usam uma linguagem incompatível com o esquema. Embora os usuários especifiquem termos comerciais específicos do domínio em suas perguntas, os dados subjacentes geralmente são armazenados usando abreviações técnicas. Por exemplo, “CUST” é frequentemente usado para clientes. Essa desconexão, combinada com a falta de contexto semântico do esquema, dificulta o fornecimento de respostas precisas pelo Cortex Analyst.

Os modelos semânticos mapeiam a terminologia comercial para esquemas de banco de dados e acrescentam significado contextual. Por exemplo, quando um usuário pergunta sobre “receita total no mês passado”, o modelo semântico pode definir “receita” como receita líquida e “mês passado” como o mês anterior. Esse mapeamento ajuda o Cortex Analyst a entender a intenção do usuário e a fornecer respostas precisas.

Nota

Modelos semânticos são considerados metadados.

Principais conceitos¶

Nota

Neste tópico, os artefatos do banco de dados são chamados de objetos “físicos”, enquanto os artefatos do modelo semântico são chamados de objetos “lógicos”.

A estrutura e os conceitos do modelo semântico são semelhantes aos dos esquemas de banco de dados, mas os modelos semânticos permitem que você forneça mais informações semânticas sobre seus dados.

Conceitos de camada semântica¶

A estrutura e os conceitos que definem a camada semântica lógica são semelhantes aos que definem a camada física do banco de dados. A seguir estão os tipos de conceito para uma camada semântica:

Nível de tabela lógica
Nível do modelo
Contexto adicional

Conceitos de modelo semântico mostrando o modelo semântico na parte superior.

Conceitos lógicos em nível de tabela¶

Uma tabela lógica é um conceito fundamental do modelo semântico do Snowflake. Ela representa uma tabela do banco de dados física ou uma exibição. Normalmente, isso corresponde a entidades comerciais (como clientes, pedidos ou fornecedores) ou dimensões (como localização ou tempo). Normalmente, cada linha em uma tabela lógica representa uma instância exclusiva da entidade, como ID de um cliente.

As tabelas lógicas contêm os seguintes tipos de colunas:

Fatos (dados quantitativos sobre eventos de negócios)
Dimensões (quem, o que, onde e como)
Hora (quando o evento ocorreu)
Filtros associados à tabela lógica para permitir que os resultados de consulta sejam limitados a subconjuntos de dados específicos.

Você pode definir métricas usando agregações ou combinações de outros objetos lógicos.

Os exemplos a seguir usam o esquema TPC-H, que inclui a tabela de fatos LINEITEM. Para obter uma implementação completa do YAML, faça o download do arquivo snow_tpch.

Esquema TPC-H mostrando a relação entre a tabela de fatos LINEITEM e as tabelas DIMENSIONS.

Todos os exemplos de nível de tabela lógica a seguir pertencem à tabela lógica order_lineitems.

tables:
  - name: order_lineitems
    description: >
      The order line items table contains detailed information about each item within an
      order, including quantities, pricing, and dates.

    base_table:
      database: SNOWFLAKE_SAMPLE_DATA
      schema: TPCH_SF1
      table: LINEITEM
    primary_key:
      columns:
        - order_key
        - order_lineitem_number

Copy

Uma dimensão representa dados categóricos que fornecem contexto aos fatos, como informações sobre produtos, clientes ou locais. As dimensões normalmente contêm valores de texto descritivos, como nomes de produto ou endereços de cliente. Elas são usadas para filtrar, agrupar e rotular fatos em análises e relatórios.

Uma dimensão de tempo fornece contexto temporal para analisar fatos em diferentes períodos. Ela permite o rastreamento de métricas em intervalos de tempo específicos (datas, meses, anos) e oferece suporte a análises como identificação de tendências e comparações entre períodos.

time_dimensions:
  - name: shipment_duration
    synonyms:
      - "shipping time"
      - "shipment time"
    description: The time it takes for items to be shipped.

    expr: DATEDIFF(day, lineitem.L_SHIPDATE, lineitem.L_RECEIPTDATE)
    data_type: NUMBER
    unique: false

Copy

Fatos são dados mensuráveis e quantitativos que fornecem contexto para as análises. Os fatos representam valores numéricos relacionados aos processos de negócios, como vendas, custo ou quantidade. Um fato é um conceito não agregado, em nível de linha.

# Fact columns in the logical table.
facts:
  - name: net_revenue
    synonyms:
      - "revenue after discount"
      - "net sales"
    description: Net revenue after applying discounts.

    expr: lineitem.L_EXTENDEDPRICE * (1 - lineitem.L_DISCOUNT)
    data_type: NUMBER

Copy

Os fatos podem se tornar privados (acessíveis no modelo semântico, mas não pelos usuários finais) definindo o campo access_modifier como private_access. Por padrão, os fatos são públicos (acessíveis aos usuários).

Um filtro é uma condição que limita os resultados de consulta a subconjuntos de dados específicos com base em critérios como período de tempo, local ou categoria.

- name: north_america
  synonyms:
    - "NA"
    - "North America region"
  description: >
    Filter to restrict data to orders from North America.
  comments: Used for analysis focusing on North American customers.
  expr: nation.N_NAME IN ('Canada', 'Mexico', 'United States')

Copy

Uma métrica é uma medida quantificável de desempenho comercial expressa como uma fórmula SQL. Você pode usar métricas como principais indicadores de desempenho (KPIs) em relatórios e painéis. É possível calcular dois tipos de métricas:

Métricas regulares agregam valores (usando funções como SUM ou AVG) em uma coluna de fatos.
Métricas derivadas são calculadas a partir de métricas existentes, usando operações aritméticas, como adição ou divisão.

Definir métricas em seu nível mais granulares para agregação em níveis superiores. Por exemplo, defina total_revenue no nível do item de linha para permitir a agregação por cliente, fornecedor ou região.

O exemplo a seguir mostra o cálculo de duas métricas regulares: um simples e um mais complexo. Elas são definidas dentro de uma definição table, portanto, elas têm como escopo essa tabela lógica.

metrics:

    # Simple metric referencing objects from the same logical table
    - name: total_revenue
      expr: SUM(lineitem.l_extendedprice * (1 - lineitem.l_discount))

    # Complex metric referencing objects from multiple logical tables.
    # The relationships between tables have been defined below.
    - name: total_profit_margin
      description: >
                  The profit margin from orders. This metric is not additive
                  and should always be calculated directly from the base tables.
      expr: (SUM(order_lineitems.net_revenue) -
            SUM(part_suppliers.part_supplier_cost * order_lineitems.lineitem_quantity))
            / SUM(order_lineitems.net_revenue)

Copy

Dica

As métricas podem ser tornadas privadas (acessíveis no modelo semântico, mas não pelos usuários finais) definindo o campo access_modifier como private_access. Por padrão, as métricas são públicas (acessíveis pelos usuários).

Referências permitidas¶

Expressions for dimensions, facts, filters, or regular table-scoped metrics can reference:

Colunas físicas de sua própria tabela base
Colunas lógicas dentro da mesma tabela lógica
Colunas lógicas de outras tabelas lógicas no modelo semântico

Métricas derivadas com escopo de modelo podem fazer referência a métricas definidas em qualquer tabela lógica no modelo semântico ou outras métricas derivadas.

Nota

As expressões não podem fazer referência a colunas físicas de outras tabelas físicas.

Conceitos em nível de modelo¶

As relações conectam tabelas lógicas por meio de junções de chaves compartilhadas. Por exemplo, pode haver uma relação entre as tabelas de clientes e pedidos por meio de uma junção na coluna customer_id. Você pode usar junções para analisar os dados de pedidos com atributos de clientes.

relationships:

  # Relationship between orders and lineitems
  - name: order_lineitems_to_orders
    left_table: order_lineitems
    right_table: orders
    relationship_columns:
      - left_column: order_key
        right_column: order_key
    join_type: left_outer
    relationship_type: many_to_one

  # Relationship between lineitems and partsuppliers
  - name: order_lineitems_to_part_suppliers
    left_table: order_lineitems
    right_table: part_suppliers
    # The relationship requires equality of multiple columns from each table
    relationship_columns:
      - left_column: part_key
        right_column: part_key
      - left_column: supplier_key
        right_column: supplier_key
    join_type: left_outer
    relationship_type: many_to_one

Copy

Um repositório de consultas verificadas (VQR) é uma coleção de perguntas e consultas SQL correspondentes que são verificadas como corretas. Você pode usar as consultas para ajudar a melhorar a precisão dos resultados do Cortex Analyst.

Você pode usar Instruções personalizadas no Cortex Analyst para ter maior controle sobre a geração de consulta SQL do Cortex Analyst. Nas instruções personalizadas, você fornece o contexto exclusivo de seu negócio para o LLM.

Os modelos semânticos do Cortex Analyst são especificados em YAML. O modelo fornece as informações semânticas necessárias para responder a perguntas de linguagem natural com alta precisão.

Formato YAML¶

YAML é um meio-termo entre legibilidade humana e precisão. Os usuários corporativos podem entendê-lo, enquanto os engenheiros e analistas de dados podem definir claramente os conceitos técnicos.

A sintaxe geral de um modelo semântico do Cortex Analyst é a seguinte:

# Name and description of the semantic model.
name: <name>
description: <string>
comments: <string>

# Logical table-level concepts

# A semantic model can contain one or more logical tables.
tables:

  # A logical table on top of a base table.
  - name: <name>
    description: <string>


    # The fully qualified name of the base table.
    base_table:
      database: <database>
      schema: <schema>
      table: <base table name>

    # Dimension columns in the logical table.
    dimensions:
      - name: <name>
        synonyms: <array of strings>
        description: <string>

        expr: <SQL expression>
        data_type: <data type>
        unique: <boolean>
        cortex_search_service:
          service: <string>
          literal_column: <string>
          database: <string>
          schema: <string>
        is_enum: <boolean>


    # Time dimension columns in the logical table.
    time_dimensions:
      - name: <name>
        synonyms:  <array of strings>
        description: <string>

        expr: <SQL expression>
        data_type: <data type>
        unique: <boolean>

    # Fact columns in the logical table.
    facts:
      - name: <name>
        synonyms: <array of strings>
        description: <string>
        access_modifier: < public_access | private_access >  # Default is public_access

        expr: <SQL expression>
        data_type: <data type>


    # Regular metrics scoped to the logical table.
    metrics:
      - name: <name>
        synonyms: <array of strings>
        description: <string>
        access_modifier: < public_access | private_access >  # Default is public_access

        expr: <SQL expression>


    # Commonly used filters over the logical table.
    filters:
      - name: <name>
        synonyms: <array of strings>
        description: <string>

        expr: <SQL expression>

# Model-level concepts

# Relationships between logical tables
relationships:
  - name: <string>

    left_table: <table>
    right_table: <table>
    relationship_columns:
      - left_column: <column>
        right_column: <column>
      - left_column: <column>
        right_column: <column>
    join_type: <left_outer | inner>
    relationship_type: < one_to_one | many_to_one >

# Derived metrics scoped to the semantic model
metrics:
  - name: <name>
    synonyms: <array of strings>
    description: <string>
    access_modifier: < public_access | private_access >  # Default is public_access

    expr: <SQL expression>


# Additional context concepts

#  Verified queries with example questions and queries that answer them
verified_queries:
  - name:        # A descriptive name of the query.

    question:    # The natural language question that this query answers.
    verified_at: # Optional: Time (in seconds since the UNIX epoch, January 1, 1970) when the query was verified.
    verified_by: # Optional: Name of the person who verified the query.
    use_as_onboarding_question:  # Optional: Marks this question as an onboarding question for the end user.
    sql:                         # The SQL query for answering the question

Copy

Para obter um exemplo de especificação, consulte o arquivo snow_tpch.yaml.

Criação de um modelo semântico usando o gerador de modelos¶

Use o gerador de modelo semântico para criar um modelo semântico a partir de suas tabelas. Em vez de criar um modelo semântico manualmente com sua própria especificação YAML, é possível usar o gerador de modelo no Snowsight para economizar tempo. O processo de criação de um modelo semântico envolve as seguintes ações:

Fornecer uma descrição com informações básicas sobre o modelo.
Fornecer a fonte de dados que você está usando para criar o modelo. É necessário fornecer pelo menos uma tabela ou exibição.
Selecionar as colunas que está usando para criar o modelo.

Para começar a criar o modelo, navegue até a página Let’s Create a Semantic Model:

No Snowsight, selecione AI & ML.
Ao lado de Cortex Analyst, selecione Try.
Escolha Create new.

Você abriu a página de descrição do gerador de modelos semânticos. Para criar um modelo semântico, faça o seguinte:

Para Description, especifique informações sobre o modelo semântico. É necessário fornecer o nome do arquivo, o local do arquivo e o nome do modelo. Você também pode fornecer uma descrição com contexto sobre os dados.
(Opcional) Para User Questions, especifique os tipos de perguntas que os usuários podem fazer sobre os dados. O gerador de modelos usa as informações que você fornece no campo para sugerir tabelas, exibições e colunas que podem ser usadas para criar o modelo.
Para Select Data (Table/View), forneça a fonte de dados que você está usando para criar o modelo semântico. É necessário fornecer pelo menos uma tabela ou exibição. Não há limite para as tabelas ou exibições que podem ser especificadas, mas recomendamos não usar mais de 10 para o modelo semântico.
Para Select Columns, selecione as colunas que você está usando para criar o modelo semântico. É possível selecionar todas as colunas ou colunas específicas. Por motivos de desempenho, recomendamos que você não use mais de 50 colunas.

Após criar o modelo, salve-o em um estágio. Para salvar, selecione Save no canto superior direito da tela. Se precisar fazer outras modificações, é possível editar o modelo usando o Snowsight ou editando diretamente o arquivo YAML.

Como abrir um modelo semântico existente¶

Após criar um modelo semântico, é possível abri-lo no Snowsight. Para abrir um modelo semântico, faça o seguinte:

Selecione Open semantic model.
Selecione Open.
Selecione Select from stage.
Selecione o banco de dados e o esquema.
Clique fora da caixa de diálogo.
Selecione o estágio em que você salvou o arquivo.
Selecione Abrir.

Nota

If you don’t see your semantic model within your stage, try refreshing the list of models, not the page.

Dicas para criar um modelo semântico¶

Organize seu arquivo YAML por domínio ou tópico de negócios
- Estruture seus arquivos YAML para alinhá-los a domínios ou tópicos comerciais específicos, mantendo o escopo focado. Por exemplo, crie modelos semânticos separados para análise de vendas e análise de marketing.
- Adapte seus casos de uso com base no público-alvo, nas perguntas esperadas ou KPIs e nos dados necessários. Casos de uso bem definidos levam a modelos semânticos mais ricos e recuperação de dados mais eficaz.
Pense pela perspectiva do usuário final
- Identifique as principais perguntas que os usuários provavelmente farão sobre o tópico e inclua apenas as tabelas e colunas necessárias para responder a essas perguntas.
- Use nomes e sinônimos que sejam semelhantes ao vocabulário usado pelos usuários finais.
- Inclua detalhes importantes nos campos de descrição que seriam úteis para alguém que está escrevendo consultas neste conjunto de dados pela primeira vez, como o fuso horário de uma coluna DATETIME.
Capture cálculos complexos

Incorpore consultas mais difíceis ou específicas do negócio em expressões.
Use tabelas largas em vez de tabelas longas

Se você tiver uma tabela com colunas como “métrica” e “valor”, nivele a tabela para que cada métrica seja uma coluna. Essa abordagem fornece ao modelo mais informações semânticas sobre cada métrica.
Revise as descrições geradas automaticamente

Se você estiver usando o gerador de modelo semântico, ele tentará gerar automaticamente descrições para suas tabelas e colunas. Sempre revise essas descrições para garantir que sejam razoáveis e relevantes; faça modificações conforme necessário.
Comece de forma simples e expanda gradualmente

Um arquivo semântico bem delimitado garante maior precisão e exatidão dos resultados. Comece com um pequeno número de tabelas e colunas e expanda o YAML do modelo semântico gradualmente para abranger mais tipos de perguntas. Lembre-se de que a construção do YAML é um processo contínuo.
Inclua consultas verificadas

Um repositório de consulta verificado (VQR), que é uma coleção de perguntas e consultas em inglês simples que as respondem, pode ajudar a melhorar a precisão e a confiabilidade dos resultados.

Limitações conhecidas¶

O Cortex Analyst impõe um limite de tamanho de 1 MB no arquivo do modelo semântico para restringir o tamanho das entradas da API.

Especificação¶

Esta seção contém especificações detalhadas dos principais conceitos descritos nas seções anteriores.

Modelo semântico¶

Um modelo semântico representa uma coleção de tabelas. O modelo contém descrições de tabelas, cada uma das quais contém descrições de aspectos específicos da tabela. Cada tabela descrita no modelo é mapeada para uma tabela base física no Snowflake.

Ela possui os seguintes campos:

Obrigatório

name

Um nome descritivo para este modelo semântico.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

Opcional

Esses campos não são obrigatórios, mas devem ser incluídos sempre que possível.

description: Uma descrição deste modelo semântico, incluindo detalhes sobre para que tipo de análise ele é útil.
tables: Uma lista de tabelas lógicas neste modelo semântico.
relationships: Uma lista de junções entre tabelas lógicas.

Tabela lógica¶

Você pode pensar em uma tabela lógica como uma exibição sobre uma tabela ou exibição do banco de dados física. Ela possui os seguintes campos:

Obrigatório

name

Um nome descritivo para esta tabela.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

base_table

Um nome totalmente qualificado da tabela base subjacente no banco de dados.

Opcional

Esses campos não são obrigatórios, mas devem ser incluídos sempre que possível.

synonyms: Uma lista de outros termos/frases usados para se referir a esta tabela. Ela deve ser exclusiva entre sinônimos dentro da tabela lógica.
description: Uma descrição desta tabela.
primary_key: As colunas de chave primária dessa tabela. Necessário se você estiver definindo relações.
dimensions: Uma lista de colunas de dimensão nesta tabela.
time_dimensions: Uma lista de colunas de dimensão de tempo nesta tabela.
facts: Uma lista de colunas de fatos nessa tabela.
metrics: Uma lista de métricas nessa tabela.
filters: Filtros predefinidos nesta tabela, se houver.

Dimensão¶

Uma dimensão descreve valores categóricos como estado, tipo_de_usuário, plataforma etc. Ela possui os seguintes campos:

Obrigatório

name

Um nome descritivo para esta dimensão.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

expr

A expressão SQL para esta dimensão. Isso pode ser uma referência a uma coluna física ou uma expressão SQL com uma ou mais colunas da tabela base subjacente.

data_type

O tipo de dados desta dimensão. Para uma visão geral de todos os tipos de dados no Snowflake, consulte Referência dos tipos de dados SQL. Observe que VARIANT, OBJECT, GEOGRAPHY e ARRAY e não são suportados atualmente.

Opcional

Esses campos não são obrigatórios, mas devem ser incluídos sempre que possível.

synonyms

Uma lista de outros termos/frases usados para se referir a esta dimensão. Deve ser único entre todos os sinônimos neste modelo semântico.

description

Uma breve descrição sobre esta dimensão, incluindo quais dados ela possui.

unique

Um valor booliano que indica que esta dimensão tem valores únicos.

sample_values

Valores de amostra desta coluna, se houver. Adicione qualquer valor que provavelmente será mencionado nas perguntas do usuário.

is_enum

Um valor booliano. Se for True, os valores no campo sample_values serão considerados como a lista completa de valores possíveis, e o modelo só escolherá entre esses valores ao filtrar essa coluna.

cortex_search_service

Especifica o Cortex Search Service a ser usado para esta dimensão. Ela possui os seguintes campos:

service: o nome do serviço Cortex Search Service.
literal_column: (opcional) a coluna no Cortex Search Service com os valores literais.
database: (opcional) o banco de dados em que o Cortex Search Service está localizado. O padrão é o banco de dados de base_table.
schema: (opcional) o esquema em que o Cortex Search Service está localizado. O padrão é o esquema de base_table.

cortex_search_service replaces the cortex_search_service_name field, which could only specify the name. cortex_search_service_name has been deprecated.

Dimensão do tempo¶

Uma dimensão de tempo descreve valores de tempo, como sale_date, created_at e year. Ela possui os seguintes campos:

Obrigatório

name

Um nome descritivo para esta dimensão de tempo.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

expr

A expressão SQL para esta coluna. Isso pode ser uma referência a uma coluna física ou uma expressão SQL com uma ou mais colunas da tabela base subjacente.

data_type

O tipo de dados desta dimensão de tempo. Para uma visão geral de todos os tipos de dados no Snowflake, consulte Referência dos tipos de dados SQL. Observe que VARIANT, OBJECT, GEOGRAPHY e ARRAY e não são suportados atualmente.

Opcional

Esses campos não são obrigatórios, mas devem ser incluídos sempre que possível.

synonyms: Uma lista de outros termos/frases usados para se referir a esta dimensão de tempo. Deve ser único entre todos os sinônimos neste modelo semântico.
description: Uma breve descrição sobre esta dimensão, incluindo quais dados ela possui. Forneça informações que ajudarão alguém a escrever consultas usando esta tabela. Por exemplo, para colunas DATETIME, especifique o fuso horário dos dados.
unique:: Um valor booliano que indica que esta coluna tem valores exclusivos.
sample_values:: Valores de amostra desta coluna, se houver. Adicione quaisquer valores que provavelmente serão referenciados nas perguntas do usuário. Este campo é opcional.

Fato¶

A fact describes numerical values, such as revenue, impressions, and salary. Facts used to be called measures in earlier releases of Cortex Analyst. Facts are backward compatible with measures. Facts have the following fields:

Obrigatório

name

Um nome descritivo para esse fato.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

expr

Essa instrução SQL pode se referir a uma coluna física na mesma tabela física de base da tabela lógica ou a uma coluna lógica (fato, dimensão ou dimensão de tempo) dentro dessa tabela lógica.

data_type

O tipo de dados desse fato. Para uma visão geral de todos os tipos de dados no Snowflake, consulte Referência dos tipos de dados SQL. Observe que VARIANT, OBJECT, GEOGRAPHY e ARRAY e não são suportados atualmente.

Opcional

The following fields are not required, but should be included whenever possible.

synonyms: Uma lista de outros termos/frases usados para se referir a esta medida. Deve ser único entre todos os sinônimos neste modelo semântico.
description: Uma breve descrição sobre esta medida, incluindo quais dados esta coluna possui.
unique: Um valor booliano que indica que esta coluna tem valores exclusivos.
sample_values: Valores de amostra desta coluna, se houver. Adicione quaisquer valores que provavelmente serão referenciados nas perguntas do usuário.

O campo a seguir é opcional. Se não estiver incluído, o padrão será public_access.

access_modifier: public_access ou private_access. Se for private_access, o fato será acessível no modelo semântico, mas não pelos usuários finais.

Filter¶

Um filtro representa uma expressão SQL usada para filtragem. Ela possui os seguintes campos:

Obrigatório

name: Um nome descritivo para este filtro.
expr: A expressão SQL deste filtro, referenciando colunas lógicas.

Opcional

Esses campos não são obrigatórios, mas devem ser incluídos sempre que possível.

synonyms: Uma lista de outros termos/frases usados para se referir a este filtro. Deve ser único entre todos os sinônimos neste modelo semântico.
description: Uma breve descrição sobre esse filtro, incluindo detalhes sobre a finalidade para a qual ele é normalmente usado.

Métrica¶

A metric describes quantifiable measures of business performance, such as total revenue, average order value, or customer count. Metrics can be regular metrics or derived metrics.

Métricas regulares têm escopo para uma tabela lógica e podem fazer referência a colunas lógicas (fatos, dimensões ou dimensões de tempo) dentro da mesma tabela lógica ou colunas lógicas de outras tabelas lógicas no modelo semântico. No modelo semântico, o elemento metric está dentro de um elemento table. Métricas regulares usam funções agregadas e de janela para calcular valores gerais para a tabela.
Métricas derivadas têm como escopo o modelo semântico e fornecem uma maneira de combinar outras métricas. No modelo semântico, o elemento metric está dentro do elemento semantic_model. Você pode se referir apenas a outras métricas (incluindo outras métricas derivadas) na expressão da métrica.

Metrics have the following fields.

Obrigatório

name

A descriptive name for this metric. This name deterines whether it is a regular metric.

Deve ser único e seguir os requisitos de identificadores sem aspas. Também não pode entrar em conflito com palavras-chave reservadas do Snowflake.

expr

A expressão SQL para esta coluna. O formato da expressão depende de se a métrica é uma métrica regular ou uma métrica derivada.

Regular metrics, which are scoped to a table, reference a logical column (fact, dimension, or time dimension) in the same logical table or a logical column from another logical table in the semantic model and use aggregate or window functions to calculate overall values.
Métricas derivadas são expressões escalares que podem fazer referência a métricas regulares ou outras métricas derivadas.

Opcional

The following fields are not required, but should be included whenever possible.

synonyms: A list of other terms/phrases used to refer to this metric. Each synonym must be unique across all synonyms in the semantic model.
description: Uma breve descrição dessa métrica, incluindo quais dados essa coluna possui.
sample_values: Valores de amostra desta coluna, se houver. Adicione quaisquer valores que provavelmente serão referenciados nas perguntas do usuário.

O campo a seguir é opcional. Se não estiver incluído, o padrão será public_access.

access_modifier: public_access ou private_access. Se for private_access, a métrica será acessível no modelo semântico, mas não por usuários finais.

Tabela base¶

Uma tabela base é usada para representar nomes de tabela totalmente qualificados. Esta é a tabela física para a qual uma tabela lógica é mapeada. Ela possui os seguintes campos:

Obrigatório

database: Nome do banco de dados.
schema: Nome do esquema.
table: Nome da tabela.

Chave primária¶

Uma chave primária representa as colunas que representam exclusivamente cada linha da tabela. A chave primária é necessária se a tabela for usada em uma relação. Ela possui os seguintes campos:

Obrigatório

columns: Uma lista de colunas de dimensão que representam exclusivamente a tabela.

Relações¶

Define as relações de junção entre as tabelas lógicas. Para garantir a funcionalidade adequada de junção, as chaves primárias devem ser definidas para as tabelas envolvidas nas relações. Ela possui os seguintes campos:

Obrigatório

name: Um identificador exclusivo para a relação.
left_table: Nome da tabela lógica, conforme definido anteriormente no arquivo YAML. Para relações de muitos para um, a tabela da esquerda deve ser o lado muitos da relação para obter o desempenho ideal.
right_table: Nome da tabela lógica, conforme definido anteriormente no arquivo YAML. Para relações de muitos para um, a tabela correta deve ser o lado da relação para obter o desempenho ideal.
relationship_columns: Uma lista de colunas iguais de cada uma das tabelas da esquerda e da direita que representam o caminho de junção.
join_type: left_outer ou inner.
relationship_type: many_to_one ou one_to_one.

Consultas verificadas¶

Consulte Cortex Analyst Verified Query Repository para obter informações sobre a finalidade e a estrutura desta seção do arquivo YAML.

Instruções personalizadas¶

For information about custom instructions, see Instruções personalizadas no Cortex Analyst.