Configurer l’ingestion de données pour vos données ServiceNow®¶
Ce chapitre explique comment configurer l’ingestion de données pour le Snowflake Connector for ServiceNow®.
Note
Snowflake Connector for ServiceNow® ingère les données de tables ServiceNow® dans Snowflake. L’ingestion de données dépend de v2 de l’ServiceNow` de table API®`_.
Stratégies d’ingestion de tables ServiceNow®¶
Note
Le connecteur ne peut uniquement ingérer que des tables comportant des colonnes
sys_id.Les vues ServiceNow ne sont pas prises en charge. Au lieu d’ingérer ces vues, vous devriez synchroniser toutes les tables pour la vue sous-jacente et joindre les tables synchronisées dans Snowflake.
Le connecteur utilise différentes stratégies d’ingestion, en fonction du schéma de la table. Le connecteur utilise trois modes d’ingestion :
Le chargement initial des données se produit pour chaque table lorsque la table est activée pour la synchronisation.
Dans ce mode, la table est ingérée en parcourant les enregistrements identifiés par les IDs de la colonne
sys_id. Une fois que tous les enregistrements ont été ingérés, la phase de chargement initial est terminée. Pour certaines tables, vous pouvez également définir la valeur correspondant aux heures de début des plages de données qui peut restreindre les enregistrements à ingérer.Les mises à jour incrémentielles ne se produisent que pour les tables comportant des colonnes
sys_updated_onousys_created_on.Incremental updates begin after the initial load is done and occur on a regular schedule that you can configure. In this mode, the connector ingests only the records that were added, updated, or deleted since the last synchronization. Information about deletions comes from the journal table provided during connector configuration.
Pour les tables qui n’ont pas de colonnes
sys_updated_onousys_created_on, le connecteur utilise le mode tronquer et charger.Dans ce mode, la table est toujours ingérée en utilisant l’approche du chargement initial, et les nouvelles données ingérées remplacent les anciennes. Le connecteur remplace les données en exécutant la commande
INSERT OVERWRITE.
Note
In the « incremental updates » mode, the connector uses the
sys_updated_oncolumn, if that column is present. If the column is not present, the connector uses thesys_created_oncolumn instead.Pour les tables pivotées, le connecteur utilise toujours la colonne
sys_created_on. Si la table est pivotée en utilisant une colonne différente desys_created_on, l’ingestion de cette table peut entraîner des problèmes de performance.Si les champs
sys_updated_onousys_created_onne sont pas mis à jour lorsque l’enregistrement est modifié dans ServiceNow, ces modifications ne seront pas transmises à Snowflake, ce qui entraîne une incohérence des données. Snowflake vous recommande d’éviter de désactiver la mise à jour des champs du système.Si la suppression d’un enregistrement n’est pas auditée, les informations sur les enregistrements supprimés ne seront pas transmises à Snowflake, ce qui entraînera une incohérence des données.
Note
Because of restrictions on the Snowflake and ServiceNow® REST APIs, the connector cannot ingest data into a table if a single row exceeds 128 MB of data. In that case, the connector tries to ingest data with the frequency defined in the table schedule. If a row exceeds the limit, the connector generates an error message and continues ingesting other tables. To overcome this limitation, you can configure column filtering to exclude large columns from ingestion.
Enregistrements archivés¶
The connector does not actively reflect the records archived in ServiceNow on the Snowflake side for the ingested tables. Assuming that you archive inactive records older than a certain date, the following apply:
Any record archived before the connector ingested it (for example, before the initial load of the table) will not be present in the table on the Snowflake side at all.
Tout enregistrement archivé après avoir été ingéré par le connecteur reste côté Snowflake sans aucune indication de l’action d’archivage.
Aucun enregistrement archivé restauré pour une table qui fonctionne déjà en mode de mises à jour incrémentielles ne sera ingéré côté Snowflake, sauf si cet enregistrement est également modifié par la suite (avec sa valeur
sys_updated_onmise à jour à l’heure actuelle).An archived record restored during the initial load of the table may be ingested on the Snowflake side depending on its ID in the
sys_idcolumn.
Si vous souhaitez mettre à jour la table avec une règle d’archivage active, vous pouvez recharger la table entière, mais tout enregistrement archivé ou restauré après le rechargement suivra les mêmes principes que ceux énumérés ci-dessus.
Les tables d’archivage ServiceNow ar_[table_name] peuvent être activées à des fins de synchronisation. Toutefois, la première mise à jour incrémentielle qui suit le chargement initial de cette table fait l’objet de recherches pour trouver les enregistrements créés/mis à jour après la date de début du chargement initial de la table d’archivage. Comme ni sys_updated_on, ni sys_created_on ne sont modifiés lorsque l’enregistrement est archivé, les enregistrements archivés après le chargement initial de la table d’archivage jusqu’à un moment donné n’y figurent pas côté Snowflake. Par exemple, si vous archivez des enregistrements datant de plus d’un an, aucun enregistrement archivé pendant un an après le chargement initial de la table d’archivage n’est ingéré dans la table d’archivage côté Snowflake. Les enregistrements archivés qui ont été restaurés ou supprimés par une règle de destruction à la suite du chargement initial d’une table d’archivage ne sont jamais supprimés de celle-ci côté Snowflake.
Parallel ingestion of ServiceNow® tables¶
Le connecteur ingère quelques tables en parallèle, mais l’ingestion de chaque table individuelle est un processus synchrone. Cela signifie que l’ingestion de tables volumineuses peut empêcher le connecteur de mettre à jour d’autres tables. Ce problème est plus susceptible de se produire pendant la phase de chargement initial que pendant les autres phases. Par défaut, le connecteur utilise 10 threads de travail, ce qui est considéré comme une valeur optimale pour ne pas surcharger l’instance ServiceNow®. Si vous savez avec certitude que votre instance peut prendre en charge une concurrence supplémentaire, vous pouvez augmenter cette valeur jusqu’à un maximum de 30 en appelant la procédure CONFIGURE_CONCURRENCY.
Set up data ingestion using Snowsight¶
Pour configurer l’ingestion de données via Snowsight, procédez comme suit :
Connectez-vous à Snowsight en tant qu’utilisateur ayant le rôle ACCOUNTADMIN.
Dans le menu de navigation, sélectionnez Catalog » Apps.
Recherchez l’appli Snowflake Connector for ServiceNow®, puis sélectionnez la vignette correspondant au connecteur.
Sur la page de Snowflake Connector for ServiceNow®, sélectionnez l’onglet Data Sync.
Une liste de toutes les tables ServiceNow® apparaît.
Note
Le connecteur ne peut uniquement ingérer que des tables comportant des colonnes
sys_id.Sélectionnez les tables que vous souhaitez ingérer :
Recherchez la table que vous souhaitez ingérer.
Cochez la case de la colonne Status à gauche de la table que vous souhaitez sélectionner.
Sous Sync Schedule, sélectionnez la fréquence de synchronisation de la table entre Snowflake et ServiceNow®.
Répétez ces étapes pour chaque table que vous souhaitez ingérer dans Snowflake.
Sélectionnez l’en-tête de la colonne Status pour voir les tables que vous avez actuellement sélectionnées.
Sélectionnez Start sync pour commencer à ingérer des données dans votre compte Snowflake.
Le statut du connecteur passe à Syncing data. Lorsqu’au moins une des tables est ingérée avec succès, le statut du connecteur devient Last Sync: just now.
Reportez-vous à Surveillance du Snowflake Connector for ServiceNow® pour savoir comment visualiser le contenu des tables dans Snowflake.
Modify data ingestion using Snowsight¶
Pour modifier les tables ServiceNow® à ingérer ou la planification de synchronisation des tables, procédez comme suit :
Connectez-vous à Snowsight en tant qu’utilisateur ayant le rôle ACCOUNTADMIN.
Dans le menu de navigation, sélectionnez Catalog » Apps.
Recherchez l’appli Snowflake Connector for ServiceNow®, puis sélectionnez la vignette correspondant au connecteur.
Dans la page Snowflake Connector for ServiceNow®, sélectionnez Data Sync.
Sélectionnez le bouton Edit tables pour passer en mode d’édition.
Modifiez les tables que vous souhaitez ingérer :
Recherchez la table que vous souhaitez ingérer.
Cochez la case de la colonne Status à gauche de la table que vous souhaitez sélectionner ou désélectionner.
Sous Sync Schedule, sélectionnez la fréquence de synchronisation de la table entre Snowflake et ServiceNow®.
Sélectionnez Update data sync.
Set up data ingestion using SQL statements¶
To set up data ingestion using SQL statements, do the following:
Note
Pour configurer ces paramètres, vous utilisez des procédures stockées définies dans le schéma PUBLIC de la base de données qui sert d’instance au connecteur.
Avant d’appeler ces procédures stockées, sélectionnez cette base de données comme base de données à utiliser pour la session.
Par exemple, si la base de données s’appelle my_connector_servicenow, exécutez la commande suivante :
USE DATABASE my_connector_servicenow;
Enable or disable the table synchronization¶
Cette section explique comment activer ou désactiver la synchronisation d’une table dans ServiceNow®. L’activation de la synchronisation peut être effectuée avec une configuration par défaut et une configuration personnalisée.
Enable multiple tables using the default configuration¶
Pour activer la synchronisation des données d’au moins une table dans ServiceNow®, appelez la procédure stockée ENABLE_TABLES avec les arguments suivants :
CALL ENABLE_TABLES(<tables_to_enable>);
Où :
tables_to_enableSpécifie un tableau de noms de table ServiceNow®.
Utilisez le nom de table et non l’étiquette affichée dans l’ServiceNow UI®. Vous pouvez trouver le nom de la table dans les tables du dictionnaire de données dans ServiceNow. Dans l’ServiceNow UI®, accédez à System Definition » Tables. La colonne Name affiche le nom de la table.
Par exemple, pour activer la synchronisation des tables nommées table1, table2, et table3, exécutez la commande suivante :
CALL ENABLE_TABLES(['table1', 'table2', 'table3']);
Disable multiple tables¶
Pour désactiver la synchronisation des données de table d’une table spécifique dans ServiceNow®, appelez la procédure stockée DISABLE_TABLES avec les arguments suivants :
CALL DISABLE_TABLES(<tables_to_disable>);
Où :
tables_to_disableSpécifie un tableau de noms de table ServiceNow®.
Utilisez le nom de table et non l’étiquette affichée dans l’ServiceNow UI®. Vous pouvez trouver le nom de la table dans les tables du dictionnaire de données dans ServiceNow. Dans l’ServiceNow UI®, accédez à System Definition » Tables. La colonne Name affiche le nom de la table.
Par exemple, pour désactiver la synchronisation des tables nommées table1 et table2, exécutez la commande suivante :
CALL DISABLE_TABLES(['table1', 'table2']);
La désactivation de la table arrête la synchronisation en douceur, dès que possible. Lorsque la synchronisation des tables est réactivée, l’ingestion reprend là où elle avait été interrompue.
Note
Disabling all tables from synchronization does not mean that the Snowflake Connector for ServiceNow® stops incurring cost. Background tasks, such as those related to notifications, can continue to execute.
Les procédures ENABLE_TABLES et DISABLE_TABLES ajoutent les noms de tables spécifiés à la vue CONFIGURED_TABLES.
Note
Le connecteur ne prend pas en charge les retours en arrière ou les récupérations de suppression dans ServiceNow®.
L’utilisation des fonctions de retour en arrière et de suppression de la restauration peut entraîner une incohérence des données. Les enregistrements récupérés dans ServiceNow® peuvent encore être marqués comme supprimés dans Snowflake. Pour résoudre ce problème, vous pouvez recharger la table.
Enable a single table by using custom configuration¶
Pour activer la synchronisation des données d’une table spécifique avec une configuration personnalisée dans ServiceNow®, appelez la procédure stockée
ENABLE_TABLEavec les arguments suivants :CALL ENABLE_TABLE('<table_to_enable>', <table_config>);
Où :
table_to_enableSpécifie un nom de table ServiceNow®.
table_configEn option : Spécifie un objet avec une configuration d’ingestion de tables. Si cette valeur n’est pas spécifiée, l’ingestion de tables utilise la configuration par défaut.
Les configurations actuellement prises en charge sont les suivantes :
filtrage de colonnes : spécifiez les propriétés
include_columnsouexclude_columnsavec une liste de noms de colonne.filtrage de lignes : spécifiez la propriété
filteravec une expression de filtre.planification de synchronisation : spécifiez la propriété
scheduleavec une planification d’ingestion personnalisée.activation de la synchronisation des suppressions : spécifiez la propriété booléenne
sync_deletions.extraction des valeurs d’affichage : spécifiez la propriété booléenne
fetch_display_values.
Note
Toutes les configurations personnalisées peuvent être combinées en un seul objet et utilisées simultanément pour une seule ingestion de tables.
Exemple :
La table
sys_audita la configuration suivante :La table doit être synchronisée tous les samedis à 10h00 AM UTC.
Seules les colonnes
newvalueetreasondoivent être ingérées.Seules les lignes dont la colonne
newvaluecommence par la chaîneprivacydoivent être ingérées.Si une table de journal est configurée, les suppressions ne doivent pas être synchronisées.
Les valeurs d’affichage doivent être extraites pour tous les champs.
Pour activer l’ingestion de la table, exécutez la commande suivante :
CALL ENABLE_TABLE('sys_audit', { 'schedule': { 'type': 'custom', 'value': { 'hour': 10, 'day_of_week': '6' } }, 'include_columns': ['newvalue', 'reason'], 'row_filter': 'newvalue STARTSWITH "privacy"', 'sync_deletions': false, 'fetch_display_values': true });
Enable a single table by using column filtering¶
If you don’t need all columns from a ServiceNow® table in Snowflake, the connector can ignore them. For example, skip columns if a single row exceeds the maximum row size of 128 MB.
Pour activer l’ingestion de tables avec les colonnes spécifiées, exécutez la commande suivante :
CALL ENABLE_TABLE('<table_to_enable>', <table_config>);
Où :
table_to_enableSpécifie un nom de table ServiceNow®.
table_configObjet comprenant la propriété
include_columnsouexclude_columnsavec une liste de noms de colonne. Sisys_id,sys_created_onetsys_updated_onexistent, ils sont toujours inclus. Vous n’avez pas besoin de les ajouter au tableauincluded_columnset vous ne pouvez pas les exclure viaexcluded_columns, car le connecteur les utilise dans le processus d’ingestion.
Note
Étant donné que les colonnes de ServiceNow® sont écrites en minuscules et que l’API que le connecteur utilise est sensible à la casse, les valeurs fournies pour les colonnes spécifiées doivent également être en minuscules.
Note
Vous ne devez pas fournir à la fois include_columns et exclude_columns. Si vous voulez dresser la liste de include_columns, vous devez ignorer la propriété exclude_columns, et inversement. Si les deux tableaux ne sont pas vides et qu’il n’y a pas de colonnes contradictoires, include_columns a la priorité sur exclude_columns.
Si include_columns et exclude_columns sont tous deux des tableaux vides, toutes les colonnes disponibles seront ingérées.
Par exemple, avec une table ServiceNow® nommée u_table avec les colonnes sys_id, sys_updated_on, col_1 et col_2 et exécutant :
CALL ENABLE_TABLE('u_table', { 'include_columns': ['sys_id', 'sys_updated_on'] });
n’ingérera que les colonnes sys_id et sys_updated_on pour la table donnée, mais l’appel à :
CALL ENABLE_TABLE('u_table', { 'exclude_columns': ['col_1'] });
ingérera sys_id, sys_updated_on et aussi col_2.
The connector validates the provided columns and rejects the enablement request if any of the columns are not available in ServiceNow®.
ServiceNow® API supports only include mode. As a result the connector transforms provided column arrays into included columns list and sends them with each request to ServiceNow®.
The URL with included columns could possibly be too long to be handled by ServiceNow®. The connector validates this limitation when the ENABLE_TABLE is invoked.
La configuration des colonnes pour chaque table se trouve dans la colonne INCLUDED_COLUMNS de la vue CONFIGURED_TABLES. Pour modifier la liste des colonnes ingérées, vous devez d’abord désactiver la table concernée. Si le filtrage des colonnes est configuré pour une table, vous pouvez activer la table uniquement à l’aide de la procédure ENABLE_TABLE. Vous ne pouvez pas utiliser ENABLE_TABLES, qui accepte une liste de tables comme argument.
Les vues aplaties ne comprennent que les colonnes spécifiées lors de l’activation de la table. Elles sont mises à jour chaque fois que la liste des colonnes incluses est modifiée. Si le filtrage de colonnes n’est pas configuré, les vues contiennent toutes les colonnes disponibles.
Note
Le changement de configuration n’affecte pas les données précédemment ingérées. Le filtrage des colonnes ne s’applique qu’aux enregistrements nouvellement ingérés. Pour appliquer le filtre aux données précédemment ingérées, il faut que la table soit rechargée.
Enable a single table by using row filtering¶
Vous pouvez exclure l’ingestion de données pour certaines lignes d’une table ServiceNow® en spécifiant une condition de filtre. Par exemple, pour exclure les lignes qui incluent des données sensibles que vous ne souhaitez pas dans Snowflake ou pour exclure les lignes qui incluent des données inutiles afin de réduire les coûts.
Pour activer l’ingestion de tables avec le filtre de lignes spécifié, exécutez la commande suivante :
CALL ENABLE_TABLE('<table_to_enable>', <table_config>);
Où :
table_to_enableSpécifie un nom de table ServiceNow®.
table_configObjet comprenant la propriété
row_filteravec une expression de filtre, qui est une chaîne valide.Les opérateurs de filtre actuellement pris en charge sont les suivants :
Opérateur
Description
Exemple
ANDOpérateur logique permettant de joindre des conditions, où les deux conditions doivent être remplies.
active = "true" AND impact = "2"OROpérateur logique permettant de joindre des conditions, où au moins l’une des conditions doit être remplie.
Important
A priorité sur l’opérateur
AND. Voir les exemples ci-dessous.tablename = "incident" OR tablename = "problem"=Renvoie
truesi les valeurs sont égales.priority = "1"!=Renvoie
truesi les valeurs ne sont pas égales.state != "7"LIKERenvoie
truesi la valeur contient la séquence de caractères spécifiée. [1]newvalue LIKE "privacy"NOT LIKERenvoie
truesi la valeur ne contient pas de séquence de caractères spécifiée. [1]description NOT LIKE "test"STARTSWITHRenvoie
truesi la valeur commence par la séquence de caractères spécifiée. [1]description STARTSWITH "important"ENDSWITHRenvoie
truesi la valeur se termine par la séquence de caractères spécifiée. [1]description ENDSWITH "important"INRenvoie
truesi la valeur est égale à l’une des listes de valeurs. [2]tablename IN ("incident", "task", "cmdb_ci")NOT INRenvoie
truesi la valeur n’est égale à aucune des valeurs de la liste. [2]status NOT IN ("in progress", "on hold", "cancelled")
[1] - les champs doivent posséder le type de données string.
[2] - les champs de sélection doivent contenir des chaînes.
Règles et limitations des expressions de filtre :
deux expressions de filtre, quelles qu’elles soient, doivent être jointes à l’aide de l’opérateur
ANDouOR.Les opérateurs doivent être séparés par un espace et en majuscules.
Les expressions de valeur doivent être placées entre guillemets doubles.
Les expressions sont sensibles à la casse.
L’expression ne peut pas fonctionner sur une colonne
sys_id,sys_updated_onousys_created_on.
Note
Les modifications de configuration n’affectent pas les données précédemment ingérées. Le filtrage de lignes ne s’applique qu’aux nouveaux enregistrements ingérés. Pour appliquer le filtre aux données déjà ingérées, il faut que la table soit rechargée.
Exemples¶
Pour activer l’ingestion de la table
sys_audit, mais synchroniser uniquement les lignes associées aux incidents de confidentialité dans la tableINCIDENT, exécutez :
CALL ENABLE_TABLE('sys_audit', {
'row_filter': 'tablename = "incident" AND fieldname = "cause" AND newvalue LIKE "privacy"'
});
Pour activer l’ingestion de la table
incident, mais synchroniser uniquement les lignes dans des conditions telles que :le champ
activeest égal àtrue,le champ
sys_created_bycommence parsupportou se termine paradmin,le champ
categoryestNetworkouCloud Management,
exécutez :
CALL ENABLE_TABLE('incident', {
'row_filter': 'active = "true" AND sys_created_by STARTSWITH "support" OR sys_created_by ENDSWITH "admin" AND category IN ("Network", "Cloud Management")'
});
Pour activer l’ingestion de la table
incident, mais ingérer uniquement les lignes à l’état d’incident spécifié et uniquement les colonnes données, exécutez :
CALL ENABLE_TABLE('incident', {
'row_filter': 'incident_state IN ("1", "2", "3")', -- "New", "In Progress", "On Hold"
'include_columns': ['incident_state', 'description']
});
Specify the synchronization schedule¶
Snowflake Connector for ServiceNow® synchronise les données de toutes les tables ServiceNow® avec Snowflake selon une planification spécifiée. Par défaut, toutes les tables sont synchronisées une fois par heure (1h).
Pour modifier le calendrier de synchronisation par défaut pour toutes les tables, appelez la procédure stockée CONFIGURE_DATA_INGESTION_SCHEDULE avec les arguments suivants :
CALL CONFIGURE_DATA_INGESTION_SCHEDULE(<schedule>);
Où :
scheduleSpécifie la fréquence de la synchronisation. Vous pouvez spécifier l’une des valeurs JSON suivantes :
{ 'type': 'continuous' }, qui est une planification d’ingestion en quasi-temps réel. Une table avec ce calendrier de synchronisation utilise un travail dédié pour ingérer des données et ne compte pas dans le nombre maximum de tables pouvant être synchronisées en parallèle. Pour plus d’informations, voir Adaptation de la taille du connecteur. Vous pouvez configurer jusqu’à 20 tables avec une planification continue.Avertissement
Les tables avec une planification continue provoquent une charge accrue sur une instance ServiceNow®. En outre, l’entrepôt du connecteur est constamment utilisé, ce qui augmente la consommation de crédit de l’entrepôt. Snowflake recommande d’utiliser les planifications continues avec précaution et uniquement pour les tables qui nécessitent des données en temps quasi réel dans Snowflake. Pour éviter la surcharge d’une instance ServiceNow®, le connecteur met en œuvre un mécanisme de détection capable de désactiver automatiquement les tables qui échouent avec une planification continue. Pour plus d’informations, voir Table avec planification continue désactivée par le connecteur.
{ 'type': 'interval', 'value': '<valeur_intervalle>' }, oùinterval_valueest l’une des valeurs de chaîne suivantes :
'30m'
'1h'
'3h'
'6h'
'12h'
'1d'
{ 'type': 'custom', 'value': { 'hour': <heure>, 'day_of_week': '<day_of_week>' } }oùhourspécifie l’heure dans le fuseau horaire UTC à laquelle l’ingestion doit commencer, etday_of_weekspécifie le jour de la semaine où l’ingestion doit être effectuée. Il est possible d’utiliser des expressions spéciales comme jours de la semaine :
'*'pour exécuter l’intégration tous les jours.
'1-3'pour exécuter l’intégration du lundi au mercredi.
'0,5,6'pour exécuter l’intégration le vendredi, le samedi et le dimanche.Les valeurs possibles pouvant être utilisées dans l’expression pour la configuration
day_of_weeksont :
'0'- Dimanche
'1'- Lundi
'2'- Mardi
'3'- Mercredi
'4'- Jeudi
'5'- Vendredi
'6'- SamediLes autres valeurs non numériques telles que
'5L'indiquant le dernier vendredi d’un mois ou'FRI-SUN'indiquant la plage du vendredi au dimanche ne sont pas prises en charge.
Il est possible de configurer la planification d’ingestion d’une table spécifique lors de son activation. Pour activer une seule table et définir sa planification d’ingestion, appelez la procédure stockée ENABLE_TABLE avec les arguments suivants :
CALL ENABLE_TABLE('<table_name>', <table_config>);
Où :
table_nameSpécifie un nom de table ServiceNow® à activer.
table_configObjet incluant la propriété
schedule, qui spécifie la configuration de la synchronisation de la table. Pour des informations détaillées, voirschedulede la procédure stockéeCONFIGURE_DATA_INGESTION_SCHEDULE.
Par exemple, pour activer l’ingestion de la table table_1 et synchroniser les données toutes les 3 heures, appelez la procédure stockée suivante :
CALL ENABLE_TABLE('table_1', { 'schedule': { 'type': 'interval', 'value': '3h' } });
Le connecteur vous permet également de spécifier un calendrier différent pour chaque table dont la synchronisation est activée. Pour modifier le calendrier de synchronisation pour un ensemble sélectionné de tables, appelez la procédure stockée CONFIGURE_TABLES_SCHEDULE avec les arguments suivants :
CALL CONFIGURE_TABLES_SCHEDULE(<table_names>, <schedule>);
Où :
table_namesSpécifie un tableau de noms de tables pour lesquelles vous souhaitez configurer le calendrier de synchronisation.
scheduleSpécifie la fréquence de la synchronisation. Pour des informations détaillées, voir
schedulede la procédure stockéeCONFIGURE_DATA_INGESTION_SCHEDULE.
Par exemple, pour ingérer les tables table_1 et table_2 chaque samedi et dimanche à 11:00 PM UTC, appelez la procédure stockée suivante :
CALL CONFIGURE_TABLES_SCHEDULE(['table_1', 'table_2'], { 'type': 'custom', 'value': { 'hour': 23, 'day_of_week': '0,6' } });
Par défaut, le connecteur tente de démarrer l’ingestion dans une fenêtre temporelle de trois heures à partir de l’heure de démarrage planifiée. S’il n’est pas possible de démarrer l’ingestion dans ce délai, par exemple lorsque le connecteur ingère d’autres tables, l’exécution planifiée actuelle n’est pas exécutée. Le connecteur tente d’exécuter l’ingestion à la prochaine période planifiée. Il est possible de modifier la durée de la période en appelant la procédure stockée CONFIGURE_CUSTOM_SCHEDULE_START_INGESTION_WINDOW :
CALL CONFIGURE_CUSTOM_SCHEDULE_START_INGESTION_WINDOW(<window_length>);
où window_length est la durée de la fenêtre au format de durée ISO 8601. La durée doit être arrondie à l’heure entière suivante et doit être d’au moins une heure. Par exemple, la valeur 'PT12H' indique une fenêtre qui dure 12 heures, et 'P2D' indique une fenêtre qui dure deux jours.
Si vous n’activez que des tables avec des planifications personnalisées, cette configuration n’affecte que le temps nécessaire à la création et à l’actualisation des vues aplaties pour les tables configurées. Les vues aplaties sont créées lors du premier cycle d’ingestion lorsque les conditions suivantes sont remplies :
L’ingestion des tables de métadonnées est terminée
L’ingestion de la table configurée a commencé.
Si les alertes par e-mail sont activées, Snowflake recommande de remplacer la fréquence des alertes par Once per day lors de l’utilisation de la planification personnalisée.
Specify whether deletions should be synchronized¶
Vous pouvez spécifier si le connecteur doit synchroniser les suppressions de ServiceNow® vers Snowflake. Par défaut, le connecteur synchronise les suppressions si une table de journal est configurée. Cependant, vous pouvez souhaiter désactiver la synchronisation des suppressions d’une table spécifique et ne pas modifier la configuration globale.
Pour activer l’ingestion de tables avec les paramètres de synchronisation des suppressions spécifiés, exécutez la commande suivante :
CALL ENABLE_TABLE('<table_to_enable>', <table_config>);
Où :
table_to_enableSpécifie un nom de table ServiceNow®.
table_configObjet comprenant la propriété booléenne
sync_deletions. Si la valeur est définie surtrue, le connecteur synchronise les suppressions pour la table ; si la valeur est définie surfalse, le connecteur ne synchronise pas les suppressions pour la table.
Par exemple, pour activer l’ingestion de la table incident mais ne pas synchroniser les suppressions, exécutez la commande suivante :
CALL ENABLE_TABLE('incident', { 'sync_deletions': false });
Note
Si vous souhaitez utiliser la configuration par défaut, ne fournissez pas la propriété sync_deletions dans l’objet de configuration. Si la table du journal n’est pas configurée, le connecteur ne synchronise pas les suppressions, quelle que soit la configuration fournie.
Specify whether display values should be fetched¶
Le connecteur peut extraire les valeurs d’affichage pour tous les types de champs pris en charge dans ServiceNow®. Les valeurs d’affichage sont des valeurs lisibles qui correspondent aux valeurs réelles stockées dans la base de données. Par exemple, un champ dont la valeur est 1 peut avoir une valeur d’affichage High. Pour en savoir plus sur les valeurs d’affichage, consultez la documentation ServiceNow®.
La valeur résolue est affichée dans une vue aplatie dans une colonne séparée avec le suffixe __DISPLAY_VALUE. Le connecteur crée des colonnes de texte et booléennes avec les types Snowflake, mais pour d’autres types, par exemple différents formats possibles de valeurs de nombres ou de dates, les valeurs d’affichage sont stockées en tant que variantes.
Avertissement
Les tables de métadonnées ne sont pas prises en charge pour l’extraction de valeurs d’affichage.
Note
Les modifications de configuration n’affectent pas les données précédemment ingérées. L’extraction de valeurs d’affichage ne s’applique qu’aux nouveaux enregistrements ingérés. Pour extraire les valeurs d’affichage des données déjà ingérées, la table doit être rechargée.
Extraction des valeurs d’affichage par table¶
Pour permettre l’extraction des valeurs d’affichage pour une table spécifique, appelez la procédure stockée ENABLE_TABLE avec les arguments suivants :
CALL ENABLE_TABLE('<table_to_enable>', <table_config>);
Où :
table_to_enableSpécifie un nom de table ServiceNow®.
table_configObjet comprenant la propriété booléenne
fetch_display_values. Si la valeur est définie surtrue, le connecteur extrait les valeurs d’affichage pour la table ; si la valeur est définie surfalse(par défaut), le connecteur n’extrait pas les valeurs d’affichage pour la table.
Par exemple, pour activer l’ingestion de la table incident et en extraire les valeurs d’affichage, exécutez la commande suivante :
CALL ENABLE_TABLE('incident', { 'fetch_display_values': true });
Note
La configuration par table n’est pas affectée par la configuration globale.
Configure default display values fetching setting for all tables¶
Pour permettre l’extraction des valeurs d’affichage pour toutes les tables, appelez la procédure stockée CONFIGURE_DISPLAY_VALUE_FETCHING avec les arguments suivants :
CALL CONFIGURE_DISPLAY_VALUE_FETCHING(<fetch_display_values>);
Où :
fetch_display_valuesSpécifie une valeur booléenne. Si la valeur est définie sur
true, le connecteur extrait les valeurs d’affichage pour toutes les tables ; si la valeur est définie surfalse(par défaut), le connecteur n’extrait pas les valeurs d’affichage des tables par défaut.
Par exemple, pour activer l’extraction des valeurs d’affichage pour toutes les tables, exécutez la commande suivante :
CALL CONFIGURE_DISPLAY_VALUE_FETCHING(true);
Specify the data range start time¶
Par défaut, Snowflake Connector for ServiceNow® synchronise tous les enregistrements des tables ServiceNow® correspondantes. Pour les tables comportant des colonnes sys_updated_on ou sys_created_on (désormais appelées colonnes de temps), il est possible de restreindre la plage de données synchronisées en définissant une heure de début de la plage de données, c’est-à-dire une limite inférieure pour la valeur de la colonne de temps correspondante des enregistrements.
With such a configuration, records with the corresponding time column value older than the data range start timestamp are not ingested. The corresponding time column used by this procedure is determined in the same way as for the incremental updates .
Pour modifier la valeur de l’heure de début de la plage de données, appelez la procédure stockée CONFIGURE_TABLES_RANGE_START avec les arguments suivants :
CALL CONFIGURE_TABLES_RANGE_START(<table_names>, <range_start>);
Où :
table_namesSpécifie un tableau de noms de tables pour lesquelles vous souhaitez configurer l’heure de début de la plage de données.
range_startHorodatage spécifiant l”heure de début de la plage de données au format TIMESTAMP_TZ ou NULL pour annuler la valeur actuelle.
Note
Vous ne pouvez pas définir l’heure de début de la plage de données pour les tables ne comportant ni la colonne sys_updated_on ni la colonne sys_created_on.
Si l’ingestion de la table n’a pas encore commencé, la valeur de l’heure de début de la plage de données est prise en compte lors de la première ingestion.
Si l’ingestion de la table a déjà commencé (par exemple, un rechargement est en cours), la valeur de l’heure de début de la plage de données est ignorée et un (autre) rechargement de la (des) table(s) est nécessaire pour filtrer les enregistrements dont la valeur de la colonne de temps correspondante est trop ancienne.
Il est donc recommandé de définir l’heure de début de la plage de données avant de commencer la première ingestion d’une table (et donc aussi avant de l’activer).
Par exemple, si les tables table1 et table2 ont les colonnes d’heure requises, pour définir l”heure de début de la plage de données à 2022-11-23 07:00:00 UTC pour ces deux tables, exécutez la commande suivante :
CALL CONFIGURE_TABLES_RANGE_START(['table1', 'table2'], TO_TIMESTAMP_TZ('2022-11-23 07:00:00 +00:00'));
Ensuite :
for table
table1, for example, if its ingestion has not started yet, all records with a corresponding time column value before 2022-11-23 07:00:00 are not ingested.for table
table2, for example, if its ingestion has already started, the data range time start value is ignored in all data synchronizations until reloading this table. During the reload, all records with a corresponding time column value before 2022-11-23 07:00:00 are not ingested.
Il est également possible de désactiver l”heure de début de la plage de données. Par exemple, pour la désactiver pour la table table1, exécutez la commande suivante :
CALL CONFIGURE_TABLES_RANGE_START(['table1'], NULL);
Là encore, si une ingestion de la table table1 a déjà été lancée, le rechargement de cette table est nécessaire pour ingérer tous les enregistrements provenant de ServiceNow®.
Note
Loading data with the data range start time may take longer than loading all historical data because of lower performance of incremental updates.
Reload data in a table¶
Le connecteur vous permet de recharger les données d’une table. Cela est utile lorsque vous souhaitez appliquer les modifications de la configuration aux données déjà ingérées ou lorsque vous souhaitez vous assurer que les données sont à jour par rapport à la source.
Il existe deux types de rechargements : complets pour un remplacement complet des données et filtrés pour n’affecter qu’une partie des données en spécifiant les conditions du rechargement.
Note
Chaque rechargement prend en compte la configuration actuelle de la table rechargée. Par exemple, cela peut restreindre les enregistrements ingérés.
Pour voir la configuration de la table principale, consultez la vue
CONFIGURED_TABLES.Pour voir la configuration résultant de la table rechargée, consultez la vue
RELOADED_TABLES.
Full reload¶
Pour recharger les données d’une table particulière, appelez la procédure stockée RELOAD_TABLE :
CALL RELOAD_TABLE('<table_name>');
Où :
table_nameSpécifie le nom de la table à recharger.
Lorsque vous appelez la procédure stockée RELOAD_TABLE, le connecteur exécute ce qui suit :
Le connecteur suspend temporairement la table d’origine pour l’ingestion.
Note
Pendant que la table est rechargée, vous ne pouvez pas réactiver la table pour l’ingestion.
Le connecteur crée une table temporaire distincte pour l’ingestion.
Le connecteur ingère les données dans cette nouvelle table temporaire. Cette table est visible dans la vue CONNECTOR_STATS sous la forme d’une table nommée avec un suffixe
__tmp.Une fois les données ingérées, le connecteur remplace les données de la table d’origine par les données de la table temporaire.
Le connecteur supprime la table temporaire.
Le connecteur réactive la table d’origine pour l’ingestion.
Pendant ce processus, vous pouvez continuer à interroger les données existantes dans la table d’origine. Cependant, les modifications apportées aux données de la table ServiceNow® ne seront pas répercutées dans la table Snowflake tant que le processus d’ingestion ne sera pas terminé.
Rechargement filtré¶
Pour ne recharger qu’une partie des données d’une table particulière, appelez la procédure stockée RELOAD_TABLE avec un paramètre d’objet de configuration :
CALL RELOAD_TABLE('<table_name>', <config>);
Où :
table_nameSpécifie le nom de la table à recharger.
configSpécifie la configuration du rechargement. L’objet de configuration peut inclure les propriétés suivantes :
sys_ids: Un tableau d’identificateurs d’enregistrements ServiceNow® (sys_id) à recharger.data_reload_range_start_timeetdata_reload_range_end_time: Valeurs d’horodatage spécifiant la plage de données au format TIMESTAMP_TZ. Selon le type d’ingestion de table donné, uniquement les enregistrements avecsys_updated_onousys_created_ondans la période spécifiée sont rechargés.conditions: Une expression de chaîne qui spécifie les conditions sur les champs d’une table ServiceNow®. Seuls les enregistrements qui remplissent les conditions sont rechargés.La syntaxe de l’expression est la même que pour le filtrage des lignes. Si le filtrage des lignes est configuré sur la table ordinaire, il est également appliqué aux conditions.
Contrairement au rechargement complet, le rechargement filtré ne remplace pas les données de la table d’origine, mais modifie uniquement les enregistrements sélectionnés.
Astuce
Juste après avoir activé une grande table pour l’ingestion pour la première fois, vous pouvez rapidement ingérer un petit sous-ensemble d’enregistrements qui vous intéresse sans attendre que le chargement initial soit terminé en utilisant le rechargement filtré.
Note
Les périodes:code:data_reload_range_start_time et data_reload_range_end_time et le filtre conditions peuvent être utilisés simultanément. Les enregistrements qui remplissent les deux conditions sont rechargés.
sys_ids est exclusif par rapport à d’autres propriétés de configuration.
Par exemple, pour recharger uniquement les enregistrements avec les valeurs sys_id de 1, 2 et 3 dans la table incident, exécutez la commande suivante :
CALL RELOAD_TABLE('incident', { 'sys_ids': ['1', '2', '3'] });
Pour recharger uniquement les enregistrements avec les valeurs sys_updated_on comprises entre 2022-11-23 07:00:00 et 2022-11-23 08:00:00 UTCet qui sont toujours actives dans la table incident, exécutez la commande suivante :
CALL RELOAD_TABLE('incident', {
'data_reload_range_start_time': TO_TIMESTAMP_TZ('2022-11-23 07:00:00 +00:00'),
'data_reload_range_end_time': TO_TIMESTAMP_TZ('2022-11-23 08:00:00 +00:00'),
'conditions': 'active = "true"'
});
Cancel table reload¶
Pour annuler le processus de rechargement des données d’une table, utilisez la procédure stockée CANCEL_RELOAD_TABLE comme indiqué dans l’exemple suivant :
CALL CANCEL_RELOAD_TABLE('<table_name>');
Où :
table_nameSpécifie le nom de la table dont vous souhaitez annuler le rechargement.
Lorsque vous annulez le rechargement, le connecteur supprime tous les objets temporaires créés pendant le rechargement. La table est alors disponible pour l’ingestion dans le cadre du programme de synchronisation normal.
Configure the use of read replicas¶
Pour configurer le connecteur afin qu’il utilise des réplicas en lecture dans votre ServiceNow®, vous pouvez définir une catégorie de requêtes personnalisée. Cette configuration permet au connecteur de diriger les requêtes d’API pour qu’elles lisent les réplicas au lieu de l’instance principale, ce qui peut aider à répartir la charge et à améliorer les performances.
Pour configurer une catégorie de requêtes personnalisée pour l’utilisation des réplicas en lecture, appelez la procédure stockée CONFIGURE_QUERY_CATEGORY avec l’argument suivant :
CALL CONFIGURE_QUERY_CATEGORY('<query_category>');
Où :
query_categorySpécifie l’identificateur de catégorie de requêtes qui sera ajouté aux requêtes d’API ServiceNow®.
Une fois configuré, le connecteur ajoutera le paramètre sysparm_query_category=<query_category> pour toutes les requêtes d’API ServiceNow®, autorisant ServiceNow® à acheminer ces requêtes vers les réplicas en lecture appropriées en fonction de la configuration de votre instance.
La valeur de la catégorie de requête par défaut définie lors de l’installation du connecteur est list.
Par exemple, pour configurer le connecteur afin qu’il utilise une catégorie de requêtes nommée connector_replica, exécutez la commande suivante :
CALL CONFIGURE_QUERY_CATEGORY('connector_replica');
Configure the size of a single page fetch for a table¶
Le connecteur récupère les données d’une table en les divisant en morceaux plus petits appelés pages. Chaque requête d’API auprès de ServiceNow® permet de récupérer une page.
Pour en tenir compte, le connecteur limite le nombre de lignes extraites au cours d’une seule requête API. Cette limite correspond à la taille de la page.
Le connecteur utilise le processus suivant pour déterminer la taille de la page :
Initialement, la taille de page par défaut est fixée à 10 000 lignes.
Si la demande d’extraction échoue pendant l’ingestion parce que la taille de la réponse est dépassée, la taille de la page est progressivement réduite de 1 000, 100, 10 et 1 jusqu’à ce que la demande aboutisse ou que la taille finale de la page soit définie sur 1.
La taille de page obtenue est enregistrée dans l’état du connecteur et cette valeur est utilisée par les demandes suivantes.
La taille de page actuelle d’une table est disponible dans la vue TABLES_STATE. Pour connaître la taille de la page, exécutez la commande suivante :
SELECT PAGE_SIZE FROM TABLES_STATE WHERE TABLE_NAME = '<table_name>';
Où :
table_nameSpécifie le nom de la table ServiceNow® en cours d’ingestion.
Le processus utilisé par le connecteur pour déterminer la taille de la page peut être source d’inefficacité. Ce processus ne fait que réduire la taille de la page. Il n’augmente pas la taille de la page. Cela peut se produire lorsqu’une table comporte une seule ligne importante qui entraîne la définition d’une valeur inférieure pour la taille de la page.
Pour éviter cette situation, vous pouvez définir manuellement la taille de la page en appelant la procédure stockée RESET_PAGE_SIZE comme le montrent les exemples suivants :
CALL RESET_PAGE_SIZE('<table_name>');
ou
CALL RESET_PAGE_SIZE('<table_name>', <page_size>);
Où :
table_nameSpécifie le nom de la table ServiceNow® en cours d’ingestion.
page_size(Facultatif) Spécifie le nombre de lignes à extraire dans une seule page. Si elle n’est pas fournie, la valeur par défaut indiquée dans la configuration du connecteur est utilisée. La valeur par défaut et recommandée est 10 000. La valeur minimale est de 1 et la valeur maximale de 25 000.
Note
La taille de la page peut également être paramétrée pour une table de journal configurée, généralement sys_audit_delete. Si des échecs se produisent lors de l’ingestion de suppressions à partir d’une table de journal peu performante, vous pouvez réduire la taille de la page pour éviter d’autres échecs.
Notez que la table du journal ne doit pas être explicitement activée pour l’ingestion afin que le connecteur synchronise les lignes supprimées.
Cycle d’ingestion¶
Les cycles d’ingestion pour une table donnée sont déclenchés selon le calendrier configuré. Un cycle télécharge en boucle toutes les lignes pertinentes divisées en pages mentionnées dans le paragraphe précédent à partir de la table source.
Chargement initial et mises à jour
Dès qu’une page de données est récupérée, elle est insérée dans la table correspondante du journal des événements. À ce stade, les modifications récemment récupérées ne sont pas encore disponibles dans la table de synchronisation ou dans les vues aplaties. Lorsque c’est fait, la demande suivante avec des critères mis à jour est émise tant que des données sont renvoyées. Lorsque le cycle d’ingestion est terminé et qu’il n’y a plus de données à récupérer dans la table source, une tâche de fusion asynchrone est déclenchée, qui prend toutes les modifications du journal des événements insérées depuis la dernière fusion et les applique à la table de synchronisation. Une fois terminé, les données sont disponibles sous forme de tables de synchronisation et de vues aplaties.
Tronquer et charger
En mode Tronquer et charger, une table temporaire est créée pour chaque cycle d’ingestion. Chaque page de lignes récupérée est d’abord insérée dans cette table temporaire (cette table existe dans le schéma interne du connecteur et n’est pas accessible aux utilisateurs du connecteur). À ce stade, les modifications récemment récupérées ne sont pas encore disponibles dans la table de synchronisation ou dans les vues aplaties ; elles affichent toujours les données récupérées lors de l’exécution précédente. Lorsque le cycle d’ingestion est terminé et qu’il n’y a plus de données disponibles dans la table source, les données de la table temporaire remplacent les données existantes dans la table de synchronisation. Toutes les lignes extraites sont également ajoutées au journal des événements. À la fin, la table temporaire est supprimée.
Suivi des progrès
Pour vérifier le statut d’un cycle d’ingestion en cours ou passé, vous pouvez effectuer une requête dans la vue CONNECTOR_STATS. Elle est visible dans la colonne STATUS. La valeur DONE n’est attribuée que si les données ont été récupérées avec succès et que toutes les modifications ont été appliquées à la table de synchronisation. Lorsque l’ingestion est en cours ou que la fusion vers la table de synchronisation/le remplacement des lignes dans la table de synchronisation n’est pas encore terminé, le statut est RUNNING.
Prochaines étapes¶
Après avoir configuré l’ingestion, exécutez les étapes décrites à la section Access the ServiceNow® data in Snowflake pour afficher les données ServiceNow® et y accéder.