Catégories :

Fonctions de table

ICEBERG_TABLE_FILES

Renvoie des informations sur les fichiers de données enregistrés dans une table Apache Iceberg™ gérée en externe à un moment donné.

Voir aussi :

Tables Apache Iceberg™, Métadonnées et conservation des tables Apache Iceberg™, ALTER ICEBERG TABLE … REFRESH

Syntaxe

ICEBERG_TABLE_FILES(
  TABLE_NAME => '<table_name>'
  [, AT => '<timestamp_ltz>']
)
Copy

Arguments

Nécessaire

TABLE_NAME => 'table_name'

Le nom de la table Iceberg gérée en externe pour laquelle vous souhaitez récupérer les informations du fichier de données.

Facultatif

AT => 'timestamp_ltz'

Spécifie une date et une heure exactes à utiliser pour récupérer les informations sur le fichier. La valeur doit être explicitement convertie en type de données TIMESTAMP_LTZ. Pour plus d’informations, voir Types de données de date et heure.

Si elle n’est pas spécifiée, la fonction renvoie des informations sur les fichiers de table pour l’instantané actuel.

Sortie

La fonction renvoie les colonnes suivantes :

Nom de la colonne

Type de données

Description

REGISTERED_ON

TIMESTAMP_LTZ

Horodatage de l’enregistrement du fichier Parquet.

FILE_NAME

TEXT

Chemin complet vers le fichier enregistré.

FILE_SIZE

NUMBER

Taille du fichier (en octets).

ROW_COUNT

NUMBER

Nombre de lignes dans le fichier.

ROW_COUNT_GROUP

NUMBER

Nombre de groupes de lignes dans le fichier.

MD5

HEX

Somme de contrôle MD5 du fichier.

ETAG

HEX

En-tête ETag pour le fichier.

LAST_MODIFIED_ON

TIMESTAMP_LTZ

Horodatage de la dernière mise à jour du fichier.

Exemples

Récupérer des informations sur les fichiers de données Parquet pour l”instantané actuel enregistré dans une table Iceberg gérée en externe nommée my_iceberg_table :

SELECT *
  FROM TABLE(
    INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
      TABLE_NAME => 'my_iceberg_table'
    )
  );
Copy

Sortie :

+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+
| FILE_NAME                                             | REGISTERED_ON                  | FILE_SIZE  | LAST_MODIFIED_ON               | ROW_COUNT  | ROW_GROUP_COUNT  | ETAG                              | MD5                              |
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet  | 1969-12-31 16:00:00.000 -0800  | 27136      | 2024-12-09 11:00:41.000 -0800  | 30000      | 1                | 5cae923b13581f87cf6397ec491fb5d5  | 5cae923b13581f87cf6397ec491fb5d5 |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet  | 1969-12-31 16:00:00.000 -0800  | 45568      | 2024-12-09 11:00:41.000 -0800  | 45000      | 1                | 3659cb341fec3a57309480d2e1bb7fc3  | 3659cb341fec3a57309480d2e1bb7fc3 |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet  | 1969-12-31 16:00:00.000 -0800  | 45056      | 2024-12-09 11:00:41.000 -0800  | 45000      | 1                | 5bee899fa8ee60fa668329acae0ed215  | 5bee899fa8ee60fa668329acae0ed215 |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet  | 1969-12-31 16:00:00.000 -0800  | 27136      | 2024-12-09 11:00:41.000 -0800  | 30000      | 1                | 43a489e450831c717d909a5c79ab9388  | 43a489e450831c717d909a5c79ab9388 |
+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+

Récupérer des informations sur les fichiers de données Parquet pour une table nommée my_iceberg_table à une heure et un jour donnés :

SELECT file_name, file_size, row_count, row_group_count, etag, md5
  FROM TABLE(
    INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
      TABLE_NAME => 'my_iceberg_table',
      AT => CAST('2024-12-09 11:02:00' AS TIMESTAMP_LTZ)
    )
  );
Copy

Sortie :

+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
| FILE_NAME                                            | FILE_SIZE | ROW_COUNT | ROW_GROUP_COUNT | ETAG                             | MD5                              |
|------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------|
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet |     27136 |     30000 |               1 | 5cae923b13581f87cf6397ec491fb5d5 | 5cae923b13581f87cf6397ec491fb5d5 |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet |     45568 |     45000 |               1 | 3659cb341fec3a57309480d2e1bb7fc3 | 3659cb341fec3a57309480d2e1bb7fc3 |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet |     45056 |     45000 |               1 | 5bee899fa8ee60fa668329acae0ed215 | 5bee899fa8ee60fa668329acae0ed215 |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet |     27136 |     30000 |               1 | 43a489e450831c717d909a5c79ab9388 | 43a489e450831c717d909a5c79ab9388 |
+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
4 Row(s) produced. Time Elapsed: 1.502s