Python용 Snowpark 개발자 가이드¶
Snowpark 라이브러리 는 데이터 파이프라인에서 데이터를 쿼리하고 처리하기 위한 직관적인 API를 제공합니다. Snowpark 라이브러리를 사용하면 사용자는 애플리케이션 코드가 실행되는 시스템으로 데이터를 옮기지 않고도 Snowflake에서 데이터를 처리하는 애플리케이션을 빌드할 수 있습니다. 저장 프로시저를 작성하고 Snowflake에서 해당 프로시저를 작업으로 예약하여 데이터 변환과 처리를 자동화할 수도 있습니다.
시작하기¶
로컬 개발 환경 또는 Snowsight 의 Python 워크시트에서 Snowpark Python 코드를 작성할 수 있습니다.
클라이언트 애플리케이션을 작성해야 하는 경우 다음을 수행하여 로컬 개발 환경을 설정하십시오.
Snowpark 앱을 빌드하기 위해 원하는 개발 환경을 설정합니다. Snowpark Python을 위한 개발 환경 설정하기 섹션을 참조하십시오.
Snowflake 데이터베이스와 상호 작용할 세션을 설정합니다. Snowpark Python 세션 만들기 섹션을 참조하십시오.
Snowflake에서 작업을 자동화하는 저장 프로시저를 작성하려면 Snowsight 에서 Python 워크시트를 사용하십시오. Python 워크시트에 Snowpark 코드 작성하기 섹션을 참조하십시오.
Snowpark Python 코드 작성¶
Snowpark Python을 사용하여 다양한 방식으로 데이터를 쿼리, 처리, 변환할 수 있습니다.
DataFrame
오브젝트로 데이터를 쿼리하고 처리합니다. Snowpark Python에서 DataFrame으로 작업하기 섹션을 참조하십시오.사용자 지정 람다 및 함수를 데이터 처리를 위해 호출할 수 있는 사용자 정의 함수(UDF)로 변환합니다. Python에서 DataFrame용 사용자 정의 함수(UDF) 만들기 섹션을 참조하십시오.
하나 이상의 열이 있는 행 세트에서 데이터를 처리하고 반환하는 사용자 정의 테이블 형식 함수(UDTF)를 작성합니다. Python에서 DataFrame용 사용자 정의 테이블 함수(UDTF) 만들기 섹션을 참조하십시오.
데이터를 처리하기 위해 호출할 수 있는 저장 프로시저를 작성하거나 데이터 파이프라인을 구축하는 작업으로 자동화합니다. Python으로 DataFrames용 저장 프로시저 만들기 섹션을 참조하십시오.
머신 러닝 작업 수행¶
Snowpark Python을 사용하여 모델 학습과 같은 머신 러닝 작업을 수행할 수 있습니다.
저장 프로시저를 작성하여 머신 러닝 모델을 학습시킵니다. Snowpark Python으로 머신 러닝 모델 학습시키기 섹션을 참조하십시오.
Snowpark Python 저장 프로시저를 사용하여 머신 러닝 모델의 학습, 점수 매기기, 조정을 수행하고 사용자 정의 함수로 학습된 모델을 배포합니다. Snowpark Python을 사용한 머신 러닝 - 신용 카드 승인 예측 (Snowflake 빠른 시작)을 참조하십시오.
Snowpark Python 코드 문제 해결¶
로깅 문을 사용하고 기본 SQL을 확인하여 코드 문제를 해결합니다. Snowpark Python으로 문제 해결하기 섹션을 참조하십시오.
코드 실행에 대한 데이터 기록 및 분석하기¶
나중에 분석하기 위해 이벤트 테이블에 로그 메시지와 추적 이벤트를 기록할 수 있습니다. 자세한 내용은 로깅 및 추적 개요 섹션을 참조하십시오.
API 참조¶
Snowpark for Python API 참조에는 사용 가능한 클래스와 메서드에 대한 광범위한 세부 정보가 있습니다. Snowpark Library for Python API 참조 를 확인해 보십시오.
버전 간 API의 변경 목록을 보려면 Python용 Snowpark 라이브러리 릴리스 정보 섹션을 참조하십시오.