Snowpark Python을 위한 개발 환경 설정하기

Snowpark Python으로 클라이언트 애플리케이션을 빌드하려면 원하는 로컬 개발 환경을 설정하십시오.

Snowpark Python으로 저장 프로시저를 작성할 경우 대신 Python 워크시트 를 설정해 보십시오.

이 항목의 내용:

전제 조건

지원되는 Python 버전은 다음과 같습니다.

  • 3.8

  • 3.9

  • 3.10

  • 3.11

참고

Python 3.9는 Snowpark 클라이언트 버전 1.5.0에 종속됩니다. Python 3.10은 Snowpark 클라이언트 버전 1.5.1에 종속됩니다. Python 3.11은 Snowpark 클라이언트 버전 1.9.0에 종속됩니다.

Anaconda, Miniconda 또는 virtualenv 와 같은 도구를 사용하여 특정 Python 버전에 대한 Python 가상 환경을 만들 수 있습니다.

예를 들어, conda를 사용하여 Python 3.8 가상 환경을 만들고 Snowflake conda 채널을 추가하고 numpy 및 pandas 패키지를 설치하려면 다음을 입력하십시오.

conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas pyarrow
Copy

UDF를 사용할 때 최상의 경험을 얻으려면 Snowflake 채널을 사용하여 새 conda 환경을 로컬 위치에 만드는 것이 좋습니다. 자세한 내용은 로컬 개발 및 테스트 섹션을 참조하십시오.

참고

pyOpenSSL의 메모리 처리로 인해 Apple M1 칩에서 Snowpark Python 실행과 관련해 알려진 문제가 있습니다. 표시되는 오류 메시지는 “Cannot allocate write+execute memory for ffi.callback()”입니다.

해결 방법은 다음 명령을 사용하여 x86 Python을 사용하는 가상 환경을 설정하는 것입니다.

CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas pyarrow --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64
Copy

그런 후, 다음 섹션의 설명에 따라 이 환경 내에 Snowpark를 설치합니다.

Pandas DataFrames 사용의 전제 조건

Snowpark API는 Pandas DataFrames와의 관계에서 데이터를 작성하는 방법을 제공합니다. Pandas 는 데이터 분석을 위한 라이브러리입니다. Pandas 사용 시에는 DataFrame이라는 데이터 구조를 사용하여 2차원 데이터를 분석하고 조작합니다.

이러한 방법에는 다음 라이브러리가 필요합니다.

참고

PyArrow를 설치하지 않은 경우에는 PyArrow를 설치할 필요가 없습니다. Snowpark를 설치하면 PyArrow의 적절한 버전이 자동으로 설치됩니다.

위에 나열된 권장 버전 이외의 PyArrow 라이브러리 버전을 이미 설치했다면 PyArrow를 제거한 후에 Snowpark를 설치하십시오.

Snowpark를 설치한 후 다른 버전의 PyArrow를 다시 설치하지는 마십시오.

설치 지침

참고

이 섹션의 명령을 실행하기 전에 지원되는 Python 버전에 적합한 Python 환경에 있는지 확인하십시오. python -V 명령을 입력하여 이를 확인할 수 있습니다. 표시된 버전이 지원되는 버전이 아닌 경우 이전 섹션을 참조하십시오.

conda 또는 pip 를 사용하여 Snowpark Python 패키지를 Python 가상 환경에 설치합니다.

conda install snowflake-snowpark-python
Copy

-또는-

pip install snowflake-snowpark-python
Copy

예를 들어 Pandas 데이터 분석 패키지와 같은 환경에 설치하려는 패키지를 선택적으로 지정합니다.

conda install snowflake-snowpark-python pandas pyarrow
Copy

-또는-

pip install "snowflake-snowpark-python[pandas]"
Copy

PyPi(Python Package Index) 리포지토리 에서 Snowpark Python 프로젝트 설명을 볼 수 있습니다.

Snowpark용 Jupyter 노트북 설정

Jupyter Notebook과 함께 Snowpark를 사용하려면 다음을 수행하십시오.

  1. Jupyter Notebook 설치:

    pip install notebook
    
    Copy
  2. Jupyter Notebook 시작:

    jupyter notebook
    
    Copy
  3. 열린 웹 페이지의 오른쪽 상단에서 New » Python 3 Notebook 을 선택합니다.

  4. 셀에서 세션을 만듭니다. 자세한 내용은 세션 만들기 섹션을 참조하십시오.

Snowpark용 IDE 설정하기

통합 개발 환경(IDE)에서 Snowpark를 사용할 수 있습니다.

Microsoft Visual Studio Code와 함께 Snowpark를 사용하려면 Python 확장 프로그램을 설치한 다음 사용할 Python 환경을 지정하십시오.

VS Code에서 Snowpark Python 저장 프로시저를 작성하고 디버깅하는 기능을 사용하려면 Snowflake Extension for Visual Studio Code 을 설치하십시오. 확장 프로그램을 사용하면 Snowflake에 연결하고 VS Code에서 직접 SQL 문을 실행할 수 있습니다.

중요

개발 환경을 설정할 때 만든 Python 환경을 수동으로 선택해야 합니다. 이렇게 하려면 Command Palette 에서 Python: Select Interpreter 명령을 사용하십시오. 자세한 내용은 Microsoft Visual Studio 설명서의 VS 코드에서 Python 환경 사용하기 를 참조하십시오.

모듈 가져오기

Snowpark API의 주 클래스는 snowflake.snowpark 모듈에 있습니다.

모듈에서 특정 이름을 가져오려면 이름을 지정하십시오. 예:

>>> from snowflake.snowpark.functions import avg
Copy