Types de données numériques

Cette rubrique décrit les types de données numériques pris en charge dans Snowflake, ainsi que les formats pris en charge pour les constantes/littéraux numériques.

Dans ce chapitre :

Types de données pour les numéros à virgule fixe

Snowflake prend en charge les types de données suivants pour les nombres à virgule fixe.

NUMBER

Nombres jusqu’à 38 chiffres, avec une précision et une échelle facultatives :

Précision

Nombre total de chiffres permis.

Échelle

Nombre de chiffres autorisés à droite de la virgule décimale.

Par défaut, la précision est 38 et l’échelle est 0 (c.-à-d. NUMBER(38, 0)). Notez que la précision limite la plage des valeurs qui peuvent être insérées (ou converties et insérées) dans les colonnes d’un type donné. Par exemple, la valeur 999 correspond à NUMBER(38,0) mais pas à NUMBER(2,0).

L’échelle maximale (nombre de chiffres à droite du séparateur décimal) est 37. Les nombres qui ont moins de 38 chiffres significatifs, mais dont le chiffre le moins significatif se trouve au-delà de la 37e décimale, par exemple 0,0000000000000000000000000000000000000012 (1,2e -39), ne peuvent pas être représentés sans perdre quelques chiffres de précision.

Note

Si les données sont converties dans un autre type de données avec une précision moindre, puis de nouveau dans la forme de précision plus élevée, les données peuvent perdre en précision. Par exemple, vous perdez en précision si vous convertissez une valeur NUMBER(38,37) en DOUBLE (qui a une précision d’environ 15 chiffres décimaux), puis en NUMBER.

Snowflake prend également en charge le type de données FLOAT , qui permet une plus grande plage de valeurs, mais avec moins de précision.

DECIMAL , DEC , NUMERIC

Synonyme de NUMBER.

INT , INTEGER , BIGINT , SMALLINT , TINYINT , BYTEINT

Synonymes de NUMBER, sauf que la précision et l’échelle ne peuvent pas être spécifiées (c’est-à-dire que la valeur par défaut est toujours NUMBER(38, 0)). Par conséquent, pour tous les types de données INTEGER, la plage de valeurs comprend toutes les valeurs entières de -99999999999999999999999999999999999999 à +99999999999999999999999999999999999999 (inclus).

Les différents noms (TINYINT, etc.) visent à simplifier le portage à partir d’autres systèmes et à suggérer la plage de valeurs attendue pour une colonne du type spécifié.

Impact de la précision et de l’échelle sur la taille de stockage

La précision (nombre total de chiffres) n’a pas d’incidence sur le stockage. En d’autres termes, les exigences de stockage pour le même nombre de colonnes dans des colonnes de précision différente, telles que NUMBER(2,0) et NUMBER(38,0), sont identiques. Pour chaque micro-partition, Snowflake détermine les valeurs minimales et maximales pour une colonne donnée et utilise ces informations pour déterminer la taille de stockage de toutes les valeurs pour cette colonne dans la partition. Par exemple :

  • Si une colonne ne contient que des valeurs comprises entre -128 et +127, chacune de ces valeurs consomme 1 octet (non compressé).

  • Si la plus grande valeur de la colonne est 10000000, alors chacune des valeurs consomme 4 octets (non compressés).

Cependant, l’échelle (nombre de chiffres après la virgule décimale) a un impact sur le stockage. Par exemple, la même valeur stockée dans une colonne de type NUMBER(10,5) consomme plus d’espace que NUMBER(5,0). De plus, le traitement de valeurs ayant une plus grande échelle pourrait être légèrement plus lent et consommer plus de mémoire.

Pour économiser de l’espace, Snowflake compresse les valeurs avant de les écrire dans le stockage. Le degré de compression dépend de la valeur des données et d’autres facteurs.

Exemples de types de données à point fixe dans une table

CREATE OR REPLACE TABLE test_fixed(num NUMBER,
                                    num10 NUMBER(10,1),
                                    dec DECIMAL(20,2),
                                    numeric NUMERIC(30,3),
                                    int INT,
                                    integer INTEGER
                                    );

DESC TABLE test_fixed;

+---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------+
| name    | type         | kind   | null? | default | primary key | unique key | check | expression | comment |
|---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------|
| NUM     | NUMBER(38,0) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| NUM10   | NUMBER(10,1) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| DEC     | NUMBER(20,2) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| NUMERIC | NUMBER(30,3) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| INT     | NUMBER(38,0) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| INTEGER | NUMBER(38,0) | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
+---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------+
Copy

Types de données pour les numéros en virgule flottante

Snowflake prend en charge les types de données suivants pour les nombres à virgule flottante.

FLOAT , FLOAT4 , FLOAT8

Les noms FLOAT, FLOAT4 et FLOAT8 sont utilisés à des fins de compatibilité avec d’autres systèmes ; Snowflake les traite tous les trois comme des nombres à virgule flottante de 64 bits.

Précision

Snowflake utilise des nombres à virgule flottante de double précision (bit64) IEEE 754.

La précision est d’environ 15 chiffres. Par exemple, pour les entiers, la plage est de -9007199254740991 à +9007199254740991 (-253 + 1 à +253 - 1). Les valeurs à virgule flottante peuvent aller d’environ 10-308 à 10+308. (Les valeurs plus extrêmes entre environ 10-324 et 10-308 peuvent être représentées avec moins de précision). Pour plus de détails, voir l’article de Wikipédia sur les numéros à double précision.

Snowflake prend en charge le type de données à point fixe NUMBER, qui permet une plus grande précision, bien que la gamme des exposants soit plus petite.

Valeurs spéciales

Snowflake prend en charge les valeurs spéciales suivantes pour FLOAT :

  • 'NaN' (Pas un nombre).

  • 'inf' (infini).

  • '-inf' (infini négatif).

Les symboles 'NaN', 'inf' et '-inf' doivent être entre guillemets simples et sont sensibles à la casse.

La sémantique de comparaison pour 'NaN' diffère de la norme IEEE 754 des manières suivantes :

Condition

Snowflake

IEEE 754

Commentaire

'NaN' = 'NaN'

TRUE

FALSE

Dans Snowflake, les valeurs 'NaN' sont toutes égales.

'NaN' > X .X est une valeur FLOAT, y compris un infini . (autre que NaN lui-même).

TRUE

FALSE

Snowflake considère 'NaN' comme un . supérieur à toute autre valeur FLOAT, . y compris l’infini.

Erreurs d’arrondi

Les opérations en virgule flottante peuvent présenter de petites erreurs d’arrondi dans le ou les chiffres les moins significatifs. Les erreurs d’arrondi peuvent se produire dans tout type de traitement à virgule flottante, y compris les fonctions trigonométriques, statistiques et géospatiales.

Les erreurs peuvent varier à chaque exécution de la requête.

Les erreurs peuvent être plus importantes lorsque les opérandes ont une précision ou une échelle différente.

Les erreurs peuvent s’accumuler, en particulier lorsque des fonctions agrégées, par exemple SUM() ou AVG(), traitent un grand nombre de lignes. Le fait d’utiliser un type de données à point fixe avant l’agrégation peut réduire ou éliminer ces erreurs.

Les erreurs d’arrondi peuvent se produire non seulement lors de l’utilisation de SQL, mais aussi lors de l’utilisation d’un autre code (par ex. Java, JavaScript, ou Python) qui s’exécute dans Snowflake (par exemple dans les UDFs et les procédures stockées).

Lorsque vous comparez deux nombres à virgule flottante, Snowflake recommande d’effectuer une comparaison pour une égalité approximative plutôt qu’une égalité exacte.

DOUBLE , DOUBLE PRECISION , REAL

Synonyme de FLOAT.

Exemples de types de données à point flottant dans une table

CREATE OR REPLACE TABLE test_float(d DOUBLE,
                                   f FLOAT,
                                   dp DOUBLE PRECISION,
                                   r REAL
                                   );

DESC TABLE test_float;

+---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------+
| name    | type         | kind   | null? | default | primary key | unique key | check | expression | comment |
|---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------|
| D       | FLOAT        | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| F       | FLOAT        | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| DP      | FLOAT        | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
| R       | FLOAT        | COLUMN | Y     | NULL    | N           | N          | NULL  | NULL       | NULL    |
+---------+--------------+--------+-------+---------+-------------+------------+-------+------------+---------+
Copy

Note

La colonne « type » de la commande DESCRIBE TABLE affiche le type de données « FLOAT » non seulement pour FLOAT, mais aussi pour les synonymes de FLOAT (par exemple, DOUBLE, DOUBLE PRECISION et REAL).

Constantes numériques

Les constantes (aussi connues sous le nom de litéraux) font référence à des valeurs de données fixes. Les formats suivants sont pris en charge pour les constantes numériques :

[+-][digits][.digits][e[+-]digits]

Où :

  • + ou - indique une valeur positive ou négative. La valeur par défaut est positive.

  • digits est un ou plusieurs chiffres de 0 à 9.

  • e (ou E) indique un exposant dans la notation scientifique. Au moins un chiffre doit suivre le marqueur de l’exposant, s’il est présent.

Les chiffres suivants sont tous des exemples de constantes numériques prises en charge :

15
+1.34
0.2
15e-03
1.234E2
1.234E+2
-1
Copy