Editando e executando notebooks no Workspaces

Definir o contexto de execução

Os notebooks no Workspaces não definem automaticamente um banco de dados ou esquema. Para consultar dados, você deve definir o contexto de execução em uma célula usando os seguintes comandos SQL:

USE DATABASE <database>;
USE SCHEMA <schema>;
Copy

Para garantir que os notebooks sejam executados de maneira consistente em ambientes e clientes, use nomes totalmente qualificados para tabelas e outros objetos. Por exemplo:

-- Query data objects using a fully qualified name
SELECT * FROM TABLE <database_name.schema_name.table_name>;

-- Create a table using a fully qualified name
WITH filtered_events AS (
    SELECT
        user_id,
        event_type,
        event_timestamp
    FROM raw_events
    WHERE event_timestamp >= '2025-01-01'
)
CREATE OR REPLACE TABLE <database_name.schema_name.table_name> AS
SELECT *
FROM filtered_events;
Copy

Uso do seletor de função e warehouse

Você pode definir a função e o warehouse ativos usando o seletor no canto superior esquerdo do editor de notebooks ou executando os seguintes comandos SQL:

USE ROLE <role>;
USE WAREHOUSE <warehouse>;
Copy

O warehouse de consulta é usado para executar as consultas SQL e a computação de pushdown do Snowpark que o notebook invoca. Ele também é usado para renderizar a grade de dados interativa, mas não há cobrança de crédito por essa operação.

Para saber mais sobre o uso de crédito, consulte Configurando a computação.

Executar células

Há quatro opções de execução compatíveis:

  • Executar todas as células

  • Executar uma única célula

  • Executar a célula atual e todas as células acima (pelo menu de reticências da célula)

  • Executar a célula atual e todas as células abaixo (pelo menu de reticências da célula)

Cancelar a execução da célula

Use Stop na parte superior do notebook ou Cancel execution em uma célula.

Ambas as ações param a célula que está em execução e todas as células em fila acionadas por Run all.

Nota

O botão Run all pode mudar temporariamente para Stop quando o notebook está se conectando ou reconectando ao serviço.

Nomes de células

Você pode atribuir nomes às células para facilitar a navegação e fornecer rótulos contextuais.

Se um arquivo .ipynb importado já contém metadados de nome ou título, esses valores são usados automaticamente.

Referência de células

A referência de células bidirecional de SQL para Python permite reutilizar resultados e variáveis em células em qualquer linguagem, permitindo transições ininterruptas entre fluxos de trabalho SQL e Python.

Você pode passar o cursor do mouse sobre a dica de ferramenta do resultado para ver o nome do DataFrame que você pode usar para referenciar o resultado em Python e SQL.

Referência de células

Fazendo referência a resultados de células SQL

Cada célula SQL expõe os resultados como um ponteiro DataFrame do Pandas chamado dataframe_x.

  • Em SQL, faça referência a ele usando chaves duplas: {{dataframe_1}}.

  • Em Python, faça referência a ele diretamente como DataFrame do Pandas: dataframe_1.

Fazendo referência a variáveis Python

Para fazer referência a variáveis Python em consultas SQL, coloque-as entre chaves duplas. Por exemplo:

SELECT * FROM {{uploaded_df}} WHERE "price" > 326;
Copy

As variáveis DataFrame também são permitidas ao fazer referência a variáveis Python em SQL.

Exemplo de fluxo de trabalho

Célula Python

import pandas as pd

uploaded_df = pd.read_csv("../data/diamonds.csv")
uploaded_df
Copy

Célula SQL que faz referência à variável Python

SELECT * FROM {{uploaded_df}} WHERE "price" > 326;
Copy

Célula SQL que faz referência a resultados de células SQL

O resultado de uma célula SQL fornece um ponteiro DataFrame chamado dataframe_1. Você pode referenciá-lo em outra consulta SQL:

SELECT * FROM {{dataframe_1}} WHERE "carat" < 1.0
UNION ALL
SELECT * FROM {{dataframe_2}} WHERE "carat" >= 1.0;
Copy

Grade de dados interativa

A grade de dados oferece suporte a:

  • Rolagem

  • Pesquisar

  • Filtragem

  • Classificação

  • Criação de gráficos sem código

Construtor de gráficos integrado

Fornece uma experiência de usuário consistente para manipulação e visualização de dados em superfícies de edição no Workspaces.

Minimapa e status da célula

O minimapa gera um índice de cabeçalhos Markdown e exibe um status abrangente na sessão para cada célula (em execução, com sucesso, com falha e modificado).

Kernel do notebook

O kernel do notebook permanecerá ativo enquanto o serviço do notebook estiver no estado RUNNING, permitindo a execução ininterrupta de processos críticos e de longa duração, como trabalhos de treinamento de ML e engenharia de dados.

Ações que não afetam a execução do kernel:

  • Navegar em outras páginas

  • Trabalhar em outra área do Snowsight

  • Fechar o navegador

  • Desligar o computador

Você pode desligar ou reiniciar o kernel usando o menu suspenso Connected.

Nota

O uso de Shut down kernel ou Restart kernel apagará as variáveis da memória, mas manterá os pacotes instalados pelo usuário. Se quiser um ambiente completamente limpo apenas com os pacotes pré-instalados, você deverá reiniciar o serviço ou criar um novo serviço e conectar-se a ele.

Se o serviço do notebook for suspenso, o kernel do notebook também será desligado. Para obter mais informações, consulte Configurando a computação.

Magics do Jupyter

Os notebooks no Workspaces executam o kernel IPython (Interactive Python) e fornecem magics de célula e de linha padrão do Jupyter. Execute %lsmagic para ver os magics disponíveis.

Usando o terminal

O terminal pode ser usado para:

  • Instalar dependências

  • Gerenciar arquivos

  • Executar trabalhos paralelos

  • Monitorar o uso de recursos de computação

Você precisa estar conectado a um serviço de notebook para usar o terminal. Mudar para um serviço diferente reiniciará a sessão do terminal.

Exemplo de instalação e execução de htop para monitorar o uso de recursos de computação em tempo real:

# If installation fails, run `apt update` first
# Install `htop`
apt install htop

# Run `htop`
htop
Copy