Sobre os notebooks Snowflake

Snowflake Notebooks é uma interface de desenvolvimento unificada no Snowsight que oferece um ambiente de programação interativo e baseado em células para Python, SQL e Markdown. No Notebooks, você pode usar os dados Snowflake para realizar análises exploratórias de dados, desenvolver modelos de aprendizado de máquina e realizar outros fluxos de trabalho de ciência e engenharia de dados, tudo na mesma interface.

  • Explore e experimente dados já existentes no Snowflake ou carregue novos dados para o Snowflake a partir de arquivos locais, armazenamento externo em nuvem ou conjuntos de dados do Snowflake Marketplace.

  • Escreva SQL ou código Python e compare rapidamente os resultados com o desenvolvimento e a execução célula por célula.

  • Visualize seus dados interativamente usando exibições incorporadas do Streamlit e outras bibliotecas como Altair, Matplotlib ou Seaborn.

  • Integre-se ao Git para colaborar com um controle de versão eficaz. Consulte Sincronizar notebooks com um repositório Git.

  • Contextualize os resultados e faça anotações sobre diferentes resultados com células e gráficos Markdown.

  • Execute seu notebook em um cronograma para automatizar pipelines. Consulte Cronograma de execuções do notebook.

  • Utilize o controle de acesso baseado em função e outras funcionalidades de governança de dados disponíveis no Snowflake para permitir que outros usuários com a mesma função visualizem e colaborem no notebook.

  • Crie um notebook privado armazenado em seu banco de dados pessoal, onde é possível desenvolver códigos de forma interativa e fazer experiências com ativos de dados de produção. Consulte Notebooks particulares.

Um exemplo de notebook na UI do Snowsight

Tempos de execução do notebook

O Snowflake Notebooks oferece dois tempos de execução distintos, cada um projetado para cargas de trabalho específicas: Warehouse Runtime e Container Runtime. O Notebooks utiliza recursos de computação de warehouses virtuais (para Warehouse Runtime) ou pools de computação do Snowpark Container Services (para Container Runtime) para executar seu código. Em ambos os tempos de execução, as consultas do SQL e do Snowpark são sempre enviadsa para execução no warehouse para otimizar o desempenho.

O Warehouse Runtime oferece a maneira mais rápida de começar, com um ambiente de warehouse familiar e com disponibilidade geral. O Container Runtime fornece um ambiente mais flexível que pode oferecer suporte a muitos tipos diferentes de cargas de trabalho, incluindo análise SQL e engenharia de dados. Você pode instalar pacotes Python adicionais se o Container Runtime não incluir o que você precisa por padrão. O tempo de execução do contêiner também vem nas versões CPU e GPU, que têm muitos pacotes de ML populares pré-instalados, o que os torna ideais para cargas de trabalho de ML e de aprendizado profundo.

A tabela a seguir mostra os recursos compatíveis com cada tipo de tempo de execução. Você pode usar essa tabela para ajudar a decidir qual tempo de execução é a escolha certa para seu caso de uso.

Recursos compatíveis

Warehouse Runtime

Container Runtime

Computação

O kernel é executado no warehouse do notebook.

O kernel é executado em um nó do pool de computação.

Ambiente

Python 3.9

Python 3.10

Imagem base

Streamlit + Snowpark

Snowflake Container Runtime (imagens de CPU e GPU pré-instaladas com bibliotecas Python).

Bibliotecas Python adicionais

Instalar usando o Snowflake Anaconda ou a partir de um estágio do Snowflake.

Instale usando pip, conda ou a partir de um estágio do Snowflake. | Se necessário, especifique uma versão específica do pacote.

Suporte de edição

Células Python, SQL e Markdown. | Reference outputs from SQL cells in Python cells and vice versa. | Use bibliotecas de visualização como Streamlit.

O mesmo que warehouse

Acesso

É necessária propriedade para acessar e editar notebooks.

O mesmo que warehouse

Recursos do notebook com suporte (ainda em versão preliminar)

Integração do Git (versão preliminar) | Agendamento (versão preliminar)

O mesmo que warehouse

Para obter detalhes sobre como criar, executar e gerenciar notebooks no Container Runtime, consulte Notebooks no Container Runtime para ML.

Exploração do Notebooks

A barra de ferramentas do Snowflake Notebooks fornece os controles usados para gerenciar o notebook e ajustar as configurações de exibição das células.

Controle

Descrição

../../_images/ui-notebooks-packages.png

Package selector: seleciona e instala pacotes para uso no notebook. Consulte Importação de pacotes Python para usar em notebooks.

../../_images/ui-notebooks-start.png

Start: inicia a sessão de Notebooks. Quando a sessão começa, a imagem muda para Active.

../../_images/ui-notebooks-active.png

Active: passe o mouse sobre o botão para exibir detalhes da sessão em tempo real e métricas agregadas de consumo de recursos (métricas de uso de memória e utilização de CPU/GPU são exibidas para notebooks do Container Runtime). Selecione a seta para baixo para acessar as opções para reiniciar ou encerrar a sessão. Selecione Active para encerrar a sessão atual.

../../_images/ui-notebooks-run-all.png

Run All/Stop: executa todas as células ou interrompe a execução da célula. Consulte Execute as células em Snowflake Notebooks.

../../_images/ui-notebooks-scheduler.png

Scheduler: define um cronograma para executar seu notebook como uma tarefa no futuro. Consulte Cronograma de execuções do notebook.

../../_images/ui-notebooks-ellipsis.png

Vertical ellipsis menu: personaliza as configurações do notebook, limpa as saídas de células, duplica, exporta ou exclui o notebook.

Como recolher células em um notebook

Você pode recolher o código em uma célula para ver apenas a saída. Por exemplo, recolha uma célula Python para mostrar apenas as exibições produzidas por seu código ou recolha uma célula SQL para mostrar apenas a tabela de resultados.

  • Para alterar o que está visível, selecione Collapse results.

    O menu suspenso oferece opções para recolher partes específicas da célula.

    Recolha ou expanda a célula.