Guia do desenvolvedor de Snowpark para Python¶
A biblioteca do Snowpark fornece uma API intuitiva para consulta e processamento de dados em um pipeline de dados. Usando a biblioteca Snowpark, é possível criar aplicativos que processam dados no Snowflake sem mover os dados para o sistema em que o código do aplicativo é executado. Você também pode automatizar a transformação e o processamento de dados escrevendo procedimentos armazenados e programando esses procedimentos como tarefas no Snowflake.
Introdução¶
Você pode escrever o código Python do Snowpark em um ambiente de desenvolvimento local ou em uma planilha Python em Snowsight.
Se você precisar escrever um aplicativo de cliente, crie um ambiente de desenvolvimento local, fazendo o seguinte:
Configure seu ambiente de desenvolvimento preferido para criar aplicativos Snowpark. Consulte Configuração do seu ambiente de desenvolvimento para o Snowpark Python.
Estabeleça uma sessão para interagir com o banco de dados Snowflake. Consulte Como criar uma sessão para o Snowpark Python.
Se você quiser escrever um procedimento armazenado para automatizar tarefas no Snowflake, use as planilhas Python em Snowsight. Consulte Como escrever o código Snowpark nas planilhas Python.
Escrever código Python do Snowpark¶
Você pode consultar, processar e transformar dados de várias maneiras usando o Snowpark Python.
Consulte e processe dados com um objeto
DataFrame
. Consulte Como trabalhar com DataFrames no Snowpark Python.Converta lambdas e funções personalizadas em funções definidas pelo usuário (UDFs) que você pode chamar para processar dados. Consulte Criação de funções definidas pelo usuário (UDFs) para DataFrames em Python.
Escreva uma função tabular definida pelo usuário (UDTF) que processa dados e retorna dados em um conjunto de linhas com uma ou mais colunas. Consulte Criação de funções de tabela definidas pelo usuário (UDTFs) para DataFrames em Python.
Escreva um procedimento armazenado que você possa chamar para processar dados, ou automatizar com uma tarefa para criar um pipeline de dados. Consulte Criação de procedimentos armazenados para DataFrames em Python.
Realizar tarefas de machine learning¶
Você pode usar o Snowpark Python para realizar tarefas de machine learning como modelos de treinamento:
Treinar modelos de machine learning através da escrita de procedimentos armazenados. Consulte Treinamento dos modelos de machine learning com Snowpark Python.
Treinar, classificar e ajustar os modelos de machine learning usando os procedimentos armazenados no Snowpark Python e implementar os modelos treinados com funções definidas pelo usuário. Consulte Machine learning com o Snowpark Python - Previsão de aprovação de cartão de crédito (Guias de início rápido Snowflake).
Solução de problemas do código Python do Snowpark¶
Solucione o problema de seus códigos com as instruções de registro e visualizando o SQL subjacente. Consulte Solução de problemas com o Snowpark Python.
Como registrar e analisar dados sobre a execução de códigos¶
É possível registrar mensagens de log e eventos de rastreamento em uma tabela de eventos para análise posterior. Para obter mais informações, consulte Visão geral do registro e do rastreamento.
Referência de API¶
A referência Snowpark para API Python contém detalhes sobre as classes e métodos disponíveis. Consulte Referência da API da biblioteca Snowpark Python
Para ver a lista de alterações na API entre as versões, consulte Notas de versão da biblioteca Snowpark para Python.