Pré-requisitos¶
O tutorial considera o seguinte:
Você tem uma conta Snowflake que está configurada para usar os Amazon Web Services (AWS) e um usuário com uma função que concede os privilégios necessários para criar um banco de dados, tabelas e objetos de warehouse virtual.
Você tem o SnowSQL instalado.
Consulte o Snowflake em 20 minutos para obter instruções para atender a estes requisitos.
O Snowflake fornece amostras de arquivos de dados em um bucket S3 público da Amazon para uso neste tutorial. Mas antes de começar, você precisa criar um banco de dados, tabelas e um warehouse virtual para este tutorial. Estes são os objetos básicos do Snowflake necessários para a maioria das atividades do Snowflake.
Sobre os arquivos de dados de amostra¶
O Snowflake fornece arquivos de dados de amostra preparados em um bucket S3 público.
Nota
Em uso regular, você prepararia seus próprios arquivos de dados usando o Console de gerenciamento da AWS, AWS Command Line Interface ou um aplicativo cliente equivalente. Consulte a documentação da Amazon Web Services para obter instruções.
Os arquivos de dados de amostra incluem informações de contato de amostra nos seguintes formatos:
Arquivos CSV que contêm uma linha de cabeçalho e cinco registros. O delimitador de campo é o caractere de canal (
|
). O exemplo a seguir mostra uma linha de cabeçalho e um registro:ID|lastname|firstname|company|email|workphone|cellphone|streetaddress|city|postalcode 6|Reed|Moses|Neque Corporation|eget.lacus@facilisis.com|1-449-871-0780|1-454-964-5318|Ap #225-4351 Dolor Ave|Titagarh|62631
Um único arquivo no formato JSON que contém uma matriz e três objetos. A seguir, um exemplo de uma matriz que contém um dos objetos:
[ { "customer": { "address": "509 Kings Hwy, Comptche, Missouri, 4848", "phone": "+1 (999) 407-2274", "email": "blankenship.patrick@orbin.ca", "company": "ORBIN", "name": { "last": "Patrick", "first": "Blankenship" }, "_id": "5730864df388f1d653e37e6f" } }, ]
Criação do banco de dados, tabelas e warehouses¶
Execute as seguintes instruções para criar um banco de dados, duas tabelas (para dados csv e json) e um warehouse virtual necessário para este tutorial. Depois de concluir o tutorial, você poderá descartar estes objetos.
CREATE OR REPLACE DATABASE mydatabase;
CREATE OR REPLACE TEMPORARY TABLE mycsvtable (
id INTEGER,
last_name STRING,
first_name STRING,
company STRING,
email STRING,
workphone STRING,
cellphone STRING,
streetaddress STRING,
city STRING,
postalcode STRING);
CREATE OR REPLACE TEMPORARY TABLE myjsontable (
json_data VARIANT);
CREATE OR REPLACE WAREHOUSE mywarehouse WITH
WAREHOUSE_SIZE='X-SMALL'
AUTO_SUSPEND = 120
AUTO_RESUME = TRUE
INITIALLY_SUSPENDED=TRUE;
Observe o seguinte:
A instrução
CREATE DATABASE
cria um banco de dados. O banco de dados inclui automaticamente um esquema chamado “public”.As instruções
CREATE TABLE
criam tabelas de destino para dados CSV e JSON. As tabelas são temporárias, ou seja, elas existem apenas durante a sessão do usuário e não ficam visíveis para os outros usuários.A instrução
CREATE WAREHOUSE
cria um warehouse inicialmente suspenso. A instrução também defineAUTO_RESUME = true
, que inicia automaticamente o warehouse quando você executa instruções SQL que exigem recursos computacionais.