Clustering automático: mudanças de saída e sintaxe SYSTEM$CLUSTERING_INFORMATION

Atenção

Essa mudança de comportamento está no pacote 2023_04.

Para saber o status atual do pacote, consulte Histórico do pacote.

Atualmente você pode usar a função SYSTEM$CLUSTERING_INFORMATION para visualizar os erros de clustering automático que ocorreram nos últimos 14 dias.

Anteriormente

Os usuários não podem obter mensagens descritivas para erros encontrados durante o clustering automático.

Atualmente
  • A saída JSON da função SYSTEM$CLUSTERING_INFORMATION inclui um novo campo, clustering_errors, que contém uma matriz de erros. Cada erro contém um carimbo de data/hora e uma mensagem descritiva.

    Por exemplo, a nova saída da função pode ser:

    {
    "cluster_by_keys" : "LINEAR(i)",
    "notes" : "Clustering key columns contain high cardinality key I which
    might result in expensive re-clustering. Consider reducing the
    cardinality of clustering keys. Please refer to
    https://docs.snowflake.net/manuals/user-guide/tables-clustering-keys.html
    for more information.",
    "total_partition_count" : 0,
    "total_constant_partition_count" : 0,
    "average_overlaps" : 0.0,
    "average_depth" : 0.0,
    "partition_depth_histogram" : {
        "00000" : 0,
        // omitted for brevity
    },
    "clustering_errors" : [ {
        "timestamp" : "2023-04-03 17:50:42 +0000",
        "error" : "(003325) Clustering service has been disabled.\n"
    } ]
    }
    
    Copy
  • Por padrão, as 10 mensagens mais recentes são retornadas pela função. A nova sintaxe da função permite que você especifique um número inteiro como o segundo argumento opcional para retornar mais ou menos mensagens. Por exemplo, o seguinte retorna os 25 erros mais recentes:

    SELECT SYSTEM$CLUSTERING_INFORMATION( 'my_table' , 25);
    
    Copy

Ref: 985