Sobre os notebooks Snowflake

Snowflake Notebooks é uma interface de desenvolvimento no Snowsight que oferece um ambiente de programação interativo baseado em células para Python e SQL. Com Snowflake Notebooks, você pode executar análises exploratórias de dados, desenvolver modelos de aprendizado de máquina e executar outras tarefas de ciência e engenharia de dados, tudo em um só lugar.

  • Explore e experimente dados já existentes no Snowflake ou carregue novos dados para o Snowflake a partir de arquivos locais, armazenamento externo em nuvem ou conjuntos de dados do Snowflake Marketplace.

  • Escreva SQL ou código Python e compare rapidamente os resultados com o desenvolvimento e a execução célula por célula.

  • Visualize seus dados interativamente usando exibições incorporadas do Streamlit e outras bibliotecas como Altair, Matplotlib ou Seaborn.

  • Contextualize resultados e faça anotações sobre diferentes resultados com células Markdown.

  • Mantenha seus dados atualizados confiando no comportamento padrão para executar uma célula e todas as células modificadas que a precedem ou depure seu notebook executando-o célula por célula.

  • Execute seu notebook seguindo um cronograma. Consulte Como agendar seu notebook Snowflake para ser executado.

  • Utilize o controle de acesso baseado em função e outras funcionalidades de governança de dados disponíveis no Snowflake para permitir que outros usuários com a mesma função visualizem e colaborem no notebook.

Um exemplo de notebook na UI do Snowsight

Tempos de execução do notebook

O Snowflake Notebooks oferece dois tipos de tempos de execução, warehouse runtime e container runtime. O Notebooks depende de warehouses virtuais e/ou pools de computação Snowpark Container Services para fornecer o recurso de computação. Para ambas as arquiteturas, as consultas SQL e do Snowpark são sempre enviadas para execução no warehouse para desempenho otimizado.

O warehouse runtime oferece a maneira mais rápida de começar, com um ambiente de warehouse familiar que está geralmente disponível. O container runtime fornece um ambiente mais flexível que pode oferecer suporte a muitos tipos diferentes de cargas de trabalho, incluindo análise SQL e engenharia de dados. Você pode instalar pacotes Python adicionais se o container runtime não incluir o que você precisa por padrão. O container runtime também vem em versões de CPU e GPU que têm muitos pacotes ML populares pré-instalados, tornando-os ideais para cargas de trabalho de ML e aprendizado profundo.

A tabela a seguir mostra os recursos compatíveis com cada tipo de tempo de execução. Você pode usar essa tabela para ajudar a decidir qual tempo de execução é a escolha certa para seu caso de uso.

Recursos aceitos

Warehouse Runtime

Container Runtime

Computação

O kernel é executado no warehouse padrão gerenciado pelo Snowflake.

O kernel é executado no nó Compute Pool;

Ambiente

Python 3.9

Python 3.10

Imagem base

Streamlit + Snowpark

Snowflake container runtime. Imagens de CPU e GPU são pré-instaladas com um conjunto de bibliotecas Python.

Bibliotecas Python adicionais

Instalar usando o Snowflake Anaconda ou a partir de um estágio do Snowflake.

Instalar usando pip ou a partir de um estágio Snowflake.

Suporte de edição

  • Python, SQL e células Markdown.

  • Referência gerada a partir de células SQL em células Python e vice-versa.

  • Use bibliotecas de visualização como Streamlit.

O mesmo que warehouse

Acesso

É necessária propriedade para acessar e editar notebooks.

O mesmo que warehouse

Recursos de notebook compatíveis

  • Integração com Git

  • Edição de vários arquivos

  • Agendamento

O mesmo que warehouse

Introdução aos Snowflake Notebooks

Para começar a experimentar com o Snowflake Notebooks, entre no Snowsight, configure sua conta para usar notebooks e selecione Notebooks no painel Projects. Uma lista de notebooks aos quais você tem acesso na sua conta é exibida. Você pode criar um novo notebook do zero ou carregar um arquivo .ipynb existente.

A tabela a seguir mostra os tópicos a serem revisados se você for novo em Snowflake Notebooks:

Guias de introdução

Configuração do notebook Snowflake

Configuração dos notebooks Snowflake

Instruções para desenvolvedores e administradores antes de usar o notebook.

Criação de notebook Snowflake

Crie um notebook Snowflake

Crie um novo notebook do zero ou a partir de um arquivo existente.

Desenvolvimento e execução de código no notebook Snowflake

Desenvolvimento e execução de código no notebook Snowflake

Crie, edite e execute Python, SQL e células Markdown.

Guias do desenvolvedor

Guia

Descrição

Contexto de sessão nos notebooks

Acessando e modificando o contexto de sessão.

Salvamento dos resultados nos notebooks

Salvamento de notebooks e resultados durante a sessão.

Importação de pacotes Python para usar em notebooks

Importação de pacote Python do canal Anaconda.

Visualização e interação com seus dados no notebook

Visualização de dados com Matplotlib, Plotly, Altair e desenvolvimento de um aplicativo de dados com Streamlit.

Referência de células e variáveis no notebook

Referência da saída da célula SQL e os valores das variáveis Python.

Atalhos de teclado para notebooks

Aproveite os atalhos de teclado para navegar e otimizar a experiência de edição.

Aprimorando os fluxos de trabalho com notebooks

Guia

Descrição

Sincronização dos notebooks Snowflake com Git

Realize o controle de versão do seu notebook para colaboração e desenvolvimento.

Trabalho com arquivos no notebook

Gerenciamento e trabalho com arquivos em seu ambiente de notebook.

Cronograma de execuções de notebook

Cronograma de notebooks para execução e execução de código dentro do Snowflake.

Experimente o Snowflake com notebooks

Aproveite outros recursos do Snowflake dentro dos Snowflake Notebooks.

Solução de erros nos Snowflake Notebooks

Solução de erros que você pode encontrar ao usar os Snowflake Notebooks.

Guias de início rápido

Casos de uso em destaque

Confira os casos de uso em destaque para ciência de dados, engenharia de dados e ML/AI em Github.

Engenharia de dados no notebook Snowflake

Engenharia de dados

Desenvolva, gerencie, agende e execute pipelines de dados escaláveis com SQL e Snowpark.

Ciência de dados usando notebook Snowflake

Ciência de dados

Explore, visualize e analise seus dados com Python e SQL.

Aprendizado de máquina usando notebook Snowflake

Aprendizado de máquina e AI

Engenharia de recursos, treinamento de modelos e desenvolvimento com ML do Cortex e Snowpark.

Nota

Elas são exibidas apenas como exemplos e segui-las pode exigir direitos adicionais sobre dados, produtos ou serviços de terceiros que não são de propriedade ou fornecidos pela Snowflake. A Snowflake não garante a precisão desses exemplos.

Recursos adicionais

  • Para demonstrações de notebooks, tutoriais e exemplos, consulte a coleção de demonstrações de Snowflake Notebooks em Github.

  • Para assistir a tutoriais em vídeo, consulte a Snowflake Notebooks playlist do Youtube.

  • Para aprender sobre comandos SQL para criar, executar e mostrar notebooks, consulte referência de API dos Snowflake Notebooks.

  • Procurando arquiteturas de referência, casos de uso específicos do setor e práticas recomendadas de soluções usando notebooks? Consulte Exemplos de notebooks no Snowflake Solution Center.