Editando e executando notebooks no Workspaces¶
Definir o contexto de execução¶
Os notebooks no Workspaces não definem automaticamente um banco de dados ou esquema. Para consultar dados, você deve definir o contexto de execução em uma célula usando os seguintes comandos SQL:
USE DATABASE <database>;
USE SCHEMA <schema>;
Para garantir que os notebooks sejam executados de maneira consistente em ambientes e clientes, use nomes totalmente qualificados para tabelas e outros objetos. Por exemplo:
-- Query data objects using a fully qualified name
SELECT * FROM TABLE <database_name.schema_name.table_name>;
-- Create a table using a fully qualified name
WITH filtered_events AS (
SELECT
user_id,
event_type,
event_timestamp
FROM raw_events
WHERE event_timestamp >= '2025-01-01'
)
CREATE OR REPLACE TABLE <database_name.schema_name.table_name> AS
SELECT *
FROM filtered_events;
Uso do seletor de função e warehouse¶
Você pode definir a função e o warehouse ativos usando o seletor no canto superior esquerdo do editor de notebooks ou executando os seguintes comandos SQL:
USE ROLE <role>;
USE WAREHOUSE <warehouse>;
O warehouse de consulta é usado para executar as consultas SQL e a computação de pushdown do Snowpark que o notebook invoca. Ele também é usado para renderizar a grade de dados interativa, mas não há cobrança de crédito por essa operação.
Para saber mais sobre o uso de crédito, consulte Configurando a computação.
Executar células¶
Há quatro opções de execução compatíveis:
Executar todas as células
Executar uma única célula
Executar a célula atual e todas as células acima (pelo menu de reticências da célula)
Executar a célula atual e todas as células abaixo (pelo menu de reticências da célula)
Cancelar a execução da célula¶
Use Stop na parte superior do notebook ou Cancel execution em uma célula.
Ambas as ações param a célula que está em execução e todas as células em fila acionadas por Run all.
Nota
O botão Run all pode mudar temporariamente para Stop quando o notebook está se conectando ou reconectando ao serviço.
Nomes de células¶
Você pode atribuir nomes às células para facilitar a navegação e fornecer rótulos contextuais.
Se um arquivo .ipynb importado já contém metadados de nome ou título, esses valores são usados automaticamente.
Referência de células¶
A referência de células bidirecional de SQL para Python permite reutilizar resultados e variáveis em células em qualquer linguagem, permitindo transições ininterruptas entre fluxos de trabalho SQL e Python.
Você pode passar o cursor do mouse sobre a dica de ferramenta do resultado para ver o nome do DataFrame que você pode usar para referenciar o resultado em Python e SQL.
Fazendo referência a resultados de células SQL¶
Cada célula SQL expõe os resultados como um ponteiro DataFrame do Pandas chamado dataframe_x.
Em SQL, faça referência a ele usando chaves duplas:
{{dataframe_1}}.Em Python, faça referência a ele diretamente como DataFrame do Pandas:
dataframe_1.
Fazendo referência a variáveis Python¶
Para fazer referência a variáveis Python em consultas SQL, coloque-as entre chaves duplas. Por exemplo:
SELECT * FROM {{uploaded_df}} WHERE "price" > 326;
As variáveis DataFrame também são permitidas ao fazer referência a variáveis Python em SQL.
Exemplo de fluxo de trabalho¶
Célula Python
import pandas as pd
uploaded_df = pd.read_csv("../data/diamonds.csv")
uploaded_df
Célula SQL que faz referência à variável Python
SELECT * FROM {{uploaded_df}} WHERE "price" > 326;
Célula SQL que faz referência a resultados de células SQL
O resultado de uma célula SQL fornece um ponteiro DataFrame chamado dataframe_1. Você pode referenciá-lo em outra consulta SQL:
SELECT * FROM {{dataframe_1}} WHERE "carat" < 1.0
UNION ALL
SELECT * FROM {{dataframe_2}} WHERE "carat" >= 1.0;
Grade de dados interativa¶
A grade de dados oferece suporte a:
Rolagem
Pesquisar
Filtragem
Classificação
Criação de gráficos sem código
Construtor de gráficos integrado¶
Fornece uma experiência de usuário consistente para manipulação e visualização de dados em superfícies de edição no Workspaces.
Minimapa e status da célula¶
O minimapa gera um índice de cabeçalhos Markdown e exibe um status abrangente na sessão para cada célula (em execução, com sucesso, com falha e modificado).
Kernel do notebook¶
O kernel do notebook permanecerá ativo enquanto o serviço do notebook estiver no estado RUNNING, permitindo a execução ininterrupta de processos críticos e de longa duração, como trabalhos de treinamento de ML e engenharia de dados.
Ações que não afetam a execução do kernel:
Navegar em outras páginas
Trabalhar em outra área do Snowsight
Fechar o navegador
Desligar o computador
Você pode desligar ou reiniciar o kernel usando o menu suspenso Connected.
Nota
O uso de Shut down kernel ou Restart kernel apagará as variáveis da memória, mas manterá os pacotes instalados pelo usuário. Se quiser um ambiente completamente limpo apenas com os pacotes pré-instalados, você deverá reiniciar o serviço ou criar um novo serviço e conectar-se a ele.
Se o serviço do notebook for suspenso, o kernel do notebook também será desligado. Para obter mais informações, consulte Configurando a computação.
Magics do Jupyter¶
Os notebooks no Workspaces executam o kernel IPython (Interactive Python) e fornecem magics de célula e de linha padrão do Jupyter. Execute %lsmagic para ver os magics disponíveis.
Usando o terminal¶
O terminal pode ser usado para:
Instalar dependências
Gerenciar arquivos
Executar trabalhos paralelos
Monitorar o uso de recursos de computação
Você precisa estar conectado a um serviço de notebook para usar o terminal. Mudar para um serviço diferente reiniciará a sessão do terminal.
Exemplo de instalação e execução de htop para monitorar o uso de recursos de computação em tempo real:
# If installation fails, run `apt update` first
# Install `htop`
apt install htop
# Run `htop`
htop