Clustering automatique : modifications de la syntaxe et de la sortie de SYSTEM$CLUSTERING_INFORMATION

Attention

Ce changement de comportement est présent dans le bundle 2023_04.

Pour connaître le statut actuel du bundle, reportez-vous à Historique du bundle.

Vous pouvez actuellement utiliser la fonction SYSTEM$CLUSTERING_INFORMATION pour voir les erreurs de clustering automatique survenues au cours des 14 derniers jours.

Précédemment

Les utilisateurs ne peuvent pas obtenir de messages descriptifs pour les erreurs rencontrées lors du clustering automatique.

Actuellement
  • La sortie JSON de la fonction SYSTEM$CLUSTERING_INFORMATION comprend un nouveau champ, clustering_errors, qui contient un tableau d’erreurs. Chaque erreur contient un horodatage et un message descriptif.

    Par exemple, la nouvelle sortie de la fonction pourrait être :

    {
    "cluster_by_keys" : "LINEAR(i)",
    "notes" : "Clustering key columns contain high cardinality key I which
    might result in expensive re-clustering. Consider reducing the
    cardinality of clustering keys. Please refer to
    https://docs.snowflake.net/manuals/user-guide/tables-clustering-keys.html
    for more information.",
    "total_partition_count" : 0,
    "total_constant_partition_count" : 0,
    "average_overlaps" : 0.0,
    "average_depth" : 0.0,
    "partition_depth_histogram" : {
        "00000" : 0,
        // omitted for brevity
    },
    "clustering_errors" : [ {
        "timestamp" : "2023-04-03 17:50:42 +0000",
        "error" : "(003325) Clustering service has been disabled.\n"
    } ]
    }
    
    Copy
  • Par défaut, la fonction renvoie les 10 messages les plus récents. La nouvelle syntaxe des fonctions vous permet de spécifier un nombre entier comme second argument facultatif afin de renvoyer plus ou moins de messages. Par exemple, le message suivant renvoie les 25 erreurs les plus récentes :

    SELECT SYSTEM$CLUSTERING_INFORMATION( 'my_table' , 25);
    
    Copy

Réf : 985