Configuração do seu ambiente de desenvolvimento para o Snowpark Python¶
Configure seu ambiente de desenvolvimento local preferido para criar aplicativos do cliente com o Snowpark Python.
Se você estiver escrevendo um procedimento armazenado com o Snowpark Python, considere a possibilidade de criar uma planilha Python em vez disso.
Neste tópico:
Pré-requisitos¶
A API Snowpark requer a versão de Python 3.8.
Você pode criar um ambiente virtual de Python 3.8 usando ferramentas como Anaconda, Miniconda, ou virtualenv.
Por exemplo, para usar o conda para criar um ambiente virtual Python 3.8, adicione o canal Snowflake conda e instale os pacotes numpy e pandas, digite:
conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas
Recomendamos criar um novo ambiente conda localmente com o canal do Snowflake para ter a melhor experiência ao usar UDFs. Para obter mais informações, consulte Desenvolvimento local e testes.
Nota
Há um problema conhecido com a execução do Snowpark Python em chips M1 da Apple devido ao manuseio da memória em pyOpenSSL. A mensagem de erro exibida é, “Cannot allocate write+execute memory for ffi.callback()”.
Como alternativa, crie um ambiente virtual que utilize x86 Python usando estes comandos:
CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64
Em seguida, instale o Snowpark dentro deste ambiente, conforme descrito na próxima seção.
Pré-requisitos para o uso de Pandas DataFrames¶
A API do Snowpark fornece meios para escrever dados de e para Pandas DataFrames. Pandas é uma biblioteca para análise de dados. Com o Pandas, você usa uma estrutura de dados chamada DataFrame para analisar e manipular dados bidimensionais.
Estes métodos exigem as seguintes bibliotecas:
Pandas 1.0.0 (ou superior).
Biblioteca PyArrow versão 8.0.0.
Nota
Se você não tiver PyArrow instalado, não precisa fazer isso; a instalação do Snowpark instala automaticamente a versão apropriada de PyArrow.
Se você já tiver instalado qualquer versão da biblioteca PyArrow diferente da versão recomendada listada acima, desinstale PyArrow antes de instalar o Snowpark.
Não reinstale uma versão diferente de PyArrow após a instalação do Snowpark.
Instruções de instalação¶
Nota
Antes de executar os comandos nesta seção, certifique-se de estar em um ambiente Python 3.8. Você pode verificar isto digitando o comando python -V
. Se a versão exibida não for Python 3.8, consulte a seção anterior.
Instale o pacote Snowpark Python no ambiente virtual Python 3.8 usando conda
ou pip
.
conda install snowflake-snowpark-python
-ou-
pip install snowflake-snowpark-python
Opcionalmente, especifique os pacotes que você deseja instalar no ambiente como, por exemplo, o pacote de análise de dados Pandas:
conda install snowflake-snowpark-python pandas
-ou-
pip install "snowflake-snowpark-python[pandas]"
Você pode ver a descrição do projeto Snowpark Python no repositório Python Package Index (PyPi).
Como configurar um Jupyter Notebook para o Snowpark¶
Para começar a usar o Snowpark com Jupyter Notebooks, faça o seguinte:
Instalação dos Jupyter Notebooks:
pip install notebook
Inicialização de um Jupyter Notebook:
jupyter notebook
No canto superior direito da página da web que foi aberta, selecione New » Python 3 Notebook.
Em uma célula, crie uma sessão. Para obter mais informações, consulte Como criar uma sessão.
Como configurar um IDE para o Snowpark¶
Você pode usar o Snowpark com um ambiente de desenvolvimento integrado (IDE).
Para usar o Snowpark com o Microsoft Visual Studio Code, instale a extensão de Python e depois especifique o ambiente de Python a usar.
Importante
Você deve selecionar manualmente o ambiente Python 3.8 que você criou ao configurar seu ambiente de desenvolvimento. Para isso, use o comando Python: Select Interpreter
do comando Command Palette
. Para obter mais informações, consulte Using Python environments in VS Code na documentação do Microsoft Visual Studio.
Módulos de importação¶
As principais classes para a API do Snowpark estão no módulo snowflake.snowpark
.
Para importar nomes particulares de um módulo, especifique os nomes. Por exemplo:
>>> from snowflake.snowpark.functions import avg