Gestion des erreurs dans Snowpipe Streaming haute performance¶

Cette rubrique présente les mécanismes de gestion des erreurs disponibles dans l’édition haute performance de Snowpipe Streaming. Cette approche améliorée fournit des informations détaillées sur les erreurs et améliore le processus global de traitement des erreurs pour une expérience plus robuste et plus informative.

Fonctions clés de traitement des erreurs dans l’architecture haute performance¶

Amélioration du point de terminaison du statut du canal : Cette édition étend le point de terminaison du statut du canal afin de fournir des informations plus complètes sur les erreurs.
Détails granulaires des erreurs : L’édition haute performance fournit des informations plus détaillées sur les erreurs pour aider à identifier l’endroit où elles se sont produites et à trouver les causes racines des problèmes d’ingestion.
Amélioration de l’expérience client : L’édition haute performance simplifie la gestion des erreurs pour les clients, en réduisant la complexité du raisonnement et de la récupération des erreurs.
La vue de l’historique du canal : :doc:`/sql-reference/account-usage/snowpipe_streaming_channel_history`fournit un historique des activités du canal afin de surveiller et de localiser les erreurs. Cette fonctionnalité vous permet de suivre les tendances des erreurs et de traiter de manière proactive les problèmes potentiels.

Point de terminaison du statut du canal¶

L’architecture haute performance comprend un point de terminaison de statut de canal pour fournir des informations plus détaillées et ponctuelles sur un canal.

En plus des informations de statut de canal pour l’architecture classique, qui est statusCode, persistedOffsetToken, l’architecture haute performance comprend les informations suivantes :

channel_status_code : Représente le statut opérationnel actuel du canal de streaming. Ce code fournit une indication de haut niveau sur la santé du canal et sa capacité à ingérer des données. Pour plus d’informations sur les codes de statut des canaux, voir Gestion des erreurs côté client et actions requises.
last_commited_offset_token : Indique le jeton de décalage du dernier ensemble de lignes qui a été validé dans la table cible par Snowflake. C’est essentiel pour suivre les progrès et garantir la transmission des données.
created_on_ms : L’horodatage, en millisecondes, qui indique la date à laquelle le canal de streaming a été initialement créé dans Snowflake.
database_name : Le nom de la base de données vers laquelle le canal de diffusion est configuré pour ingérer des données.
schema_name : Le nom du schéma au sein de la base de données spécifiée où réside la table cible du canal de diffusion.
pipe_name : Le nom de l’objet Snowpipe qui est configuré pour utiliser ce canal Snowpipe Streaming pour l’ingestion de données dans une table cible spécifique.
channel_name : Un nom créé par l’utilisateur pour l’instance spécifique du canal de Snowpipe Streaming.
rows_inserted : Un décompte du nombre total de lignes de données qui ont été insérées dans la table cible par le biais de ce canal de diffusion depuis sa création.
rows_parsed : Un décompte du nombre total de lignes de données qui ont été traitées et analysées par le service Snowpipe Streaming pour ce canal (mais pas nécessairement insérées, par exemple en raison d’erreurs).
rows_error_count : Un décompte du nombre total de lignes de données qui ont rencontré des erreurs lors du traitement et qui ont donc été rejetées par le service Snowpipe Streaming pour ce canal.
last_error_offset_upper_bound : La limite supérieure de l’intervalle de jetons de décalage du dernier ensemble de lignes qui contenait des erreurs. Cela permet d’identifier l’emplacement approximatif des erreurs les plus récentes dans le flux de données.
last_error_message : Un message lisible par l’homme correspondant au dernier code d’erreur.
last_error_timestamp : L’horodatage indiquant quand l’erreur la plus récente s’est produite sur ce canal de diffusion.
snowflake_avg_processing_latency_ms : La latence moyenne, en millisecondes, observée par le service Snowflake dans le traitement des ensembles de lignes reçus par ce canal. Cette métrique donne un aperçu des performances du pipeline d’ingestion au sein de Snowflake.

Flux de traitement des erreurs dans l’architecture haute performance¶

Envoi de données par le client : L’application client utilise le SDK de Snowpipe Streaming pour envoyer des données à Snowflake via l’API appendRow(s).
Traitement par le serveur : Le service Snowflake traite les données. Cela implique ce qui suit :
- Mise en mémoire tampon des données.
- Analyse et validation des données.
- Enregistrement des données dans la table.
Détection des erreurs : Des erreurs peuvent se produire au cours de n’importe quelle zone de préparation de traitement côté serveur.
Enregistrement des erreurs : Snowflake enregistre des informations détaillées sur la dernière erreur qui s’est produite, notamment les informations suivantes :
- La limite supérieure de l’intervalle de jetons de décalage du dernier ensemble de lignes contenant des erreurs. Cela permet d’identifier l’emplacement approximatif des erreurs les plus récentes dans le flux de données.
- Un message d’erreur.
- Un horodatage.
Rapport d’erreur :
- Le point de terminaison amélioré du statut du canal permet d’accéder aux informations d’erreur enregistrées.
- Les clients peuvent interroger ce point de terminaison pour récupérer les détails de la dernière erreur survenue.
- Vue SNOWPIPE_STREAMING_CHANNEL_HISTORY fournit un historique des erreurs et de leurs décalages.
Action client : L’application cliente utilise les informations d’erreur pour effectuer les actions suivantes :
- Identifier la cause de l’erreur.
- Implémentez une logique de traitement des erreurs appropriée, telle que les actions suivantes :
  Réessayer l’opération qui a échoué.
  
  Consigner l’erreur.
  
  Alerter un administrateur.
  
  Déplacer les données erronées vers une file d’attente de lettres mortes.
  
  Réouvrir les canaux.

Gestion des erreurs côté client et actions requises¶

Le SDK Snowpipe Streaming simplifie la gestion des erreurs en mettant en œuvre une logique de relance interne pour les erreurs transitoires. Cependant, en cas d’erreurs de canal fatales et de problèmes d’autorisation persistants, vous devez intervenir manuellement.

Logique de nouvelle tentative du SDK pour les erreurs transitoires¶

Le SDK retente automatiquement la requête pour envoyer les données non vidées dans le canal au serveur pour les codes de statut HTTP suivants, car ils indiquent généralement un problème de service temporaire ou transitoire :

5XX (Erreurs de serveur)
429 (Trop de requêtes)
408 (Délai d’expiration de la requête)

Erreurs de canal nécessitant une réouverture manuelle¶

Le SDK Snowpipe Streaming ne rouvre pas automatiquement le canal. Lorsqu’un canal entre dans un état qui n’est pas valide, le client doit explicitement fermer et rouvrir le canal pour poursuivre l’ingestion.

Un canal n’est pas considéré comme valide, et nécessite une action client, si le channel_status_code dans la réponse du statut du canal est autre que SUCCESS.

Le tableau suivant présente les codes d’erreur persistants qui indiquent un état de canal fatal et nécessitent la réouverture du canal :

Code d’erreur	Contexte	Action client requise
ERR_PIPE_DOES_NOT_EXIST_OR_NOT_AUTHORIZED	Le canal cible est manquant ou inaccessible.	Corrigez le problème de canal. Rouvrez le canal.
ERR_TABLE_DOES_NOT_EXIST_NOT_AUTHORIZED	La table cible est manquante ou inaccessible.	Corrigez le problème de table. Rouvrez le canal.
ERR_CHANNEL_HAS_INVALID_ROW_SEQUENCER	L’état de séquencement des lignes n’est pas valide.	Rouvrez le canal.
ERR_CHANNEL_HAS_INVALID_CLIENT_SEQUENCER	L’état de séquencement du canal n’est pas valide.	Rouvrez le canal.
ERR_CHANNEL_MUST_BE_REOPENED	Une erreur générale indiquant que le canal est inutilisable.	Rouvrez le canal.
ERR_CHANNEL_MUST_BE_REOPENED_DUE_TO_ROW_SEQ_GAP	Un écart dans la séquence de lignes a été détecté.	Rouvrez le canal.

Échec de l’évolution du schéma et invalidation du canal¶

Lorsque vous utilisez l’architecture hautes performances de Snowpipe Streaming, vous devez tenir compte d’une exception spécifique au comportement ON_ERROR=CONTINUE général relatif à l’évolution des schémas.

Invalidation du canal sur les erreurs de schéma :

Même si l’option ON_ERROR=CONTINUE est configurée pour le chargement, le canal sera invalidé s’il rencontre un échec de l’évolution du schéma causé par des erreurs de l’utilisateur.

La liste suivante inclut les erreurs utilisateur courantes qui déclenchent l’invalidation du canal :

Soumission de données avec des noms de colonnes non valides qui ne peuvent pas être mappés.
Tentative d’ajout de colonnes supplémentaires par rapport à la limite autorisée par la limite de colonnes configurée dans un seul lot. Lorsque des colonnes sont ajoutées à plusieurs lots, il n’y a pas de limite.

Cette invalidation du canal l’empêche de continuer à accepter des données susceptibles de provoquer des problèmes de schéma persistants et non récupérables. Les utilisateurs peuvent vérifier le statut d’invalidation et la raison de l’échec du canal en utilisant la méthode getChannelStatus(). Pour plus d’informations sur les champs de statut du canal, voir Détails du point de terminaison du statut du canal.

Erreurs d’autorisation nécessitant une correction de la configuration¶

Lorsqu’une tentative d’ingestion aboutit à une erreur d’autorisation HTTP, le client doit corriger l’autorisation sous-jacente ou le problème d’identifiants. Ne rouvrez pas le canal pour ces erreurs, car le nouveau canal rencontrera immédiatement le même problème.

401 (Non autorisé)
403 (Interdit)

Pour ces erreurs, l’ingestion doit être arrêtée et la configuration de sécurité de l’application cliente (par exemple, les autorisations de canal, le rôle de l’utilisateur, les identifiants d’authentification) doit être corrigée avant la reprise de l’ingestion. Après avoir résolu le problème d’autorisation, vous pouvez rouvrir le client pour poursuivre l’ingestion.