2025년 Python용 Snowpark 라이브러리 릴리스 정보

이 문서에는 Snowpark Library for Python 에 대한 릴리스 정보가 있는데, 해당되는 경우 다음을 포함합니다.

  • 동작 변경 사항

  • 새로운 기능

  • 고객이 직면한 버그 수정

Snowflake는 Snowpark Library for Python 업데이트에 의미 체계 버전 관리를 사용합니다.

설명서는 Python용 Snowpark 개발자 가이드 섹션을 참조하십시오.

경고:

Python 3.8이 EoL(End of Life) 에 도달함에 따라, Python 3.8에서 snowpark-python을 사용할 때 지원 중단 경고가 트리거됩니다. 자세한 내용은 Snowflake Python 런타임 지원 섹션을 참조하십시오. Snowpark 1.24.0은 Anaconda의 정책 에 따라 Python 3.8을 지원하는 마지막 클라이언트 및 서버 버전이 될 것입니다. 기존 Python 3.8 오브젝트를 Python 3.9 이상으로 업그레이드하십시오.

버전 1.27.0(2025-02-05)

새로운 기능

functions.py 에서 다음 함수에 대한 지원을 추가했습니다.

  • array_reverse

  • divnull

  • map_cat

  • map_contains_key

  • map_keys

  • nullifzero

  • snowflake_cortex_sentiment

  • acosh

  • asinh

  • atanh

  • bit_length

  • bitmap_bit_position

  • bitmap_bucket_number

  • bitmap_construct_agg

  • cbrt

  • equal_null

  • from_json

  • ifnull

  • localtimestamp

  • max_by

  • min_by

  • nth_value

  • nvl

  • octet_length

  • position

  • regr_avgx

  • regr_avgy

  • regr_count

  • regr_intercept

  • regr_r2

  • regr_slope

  • regr_sxx

  • regr_sxy

  • regr_syy

  • try_to_binary

  • base64

  • base64_decode_string

  • base64_encode

  • editdistance

  • hex

  • hex_encode

  • instr

  • log1p

  • log2

  • log10

  • percentile_approx

  • unbase64

  • DataFrame.create_dataframe 을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.

  • DataFrameWriter.insert_into/insertInto 를 지원하는 기능이 추가되었습니다. 이 방법은 로컬 테스트 모드도 지원합니다.

  • 임시 뷰를 만들기 위한 DataFrame.create_temp_view 지원을 추가했습니다. 뷰가 이미 존재하면 실패합니다.

  • map_catmap_concat 함수에서 여러 열에 대한 지원을 추가했습니다.

  • DataFrame.with_columnDataFrame.with_columns 에서 원래 열 순서를 유지하기 위한 옵션 keep_column_order 를 추가했습니다.

  • StructType 열의 필드 이름을 바꾸거나 필드를 추가할 수 있는 열 캐스트에 옵션을 추가했습니다.

  • contains_null parameter 에 대한 지원을 ArrayType 에 추가했습니다.

  • 스테이지에서 파일을 읽어 만든 DataFrame 에서 DataFrame.create_or_replace_temp_view 를 통해 임시 뷰를 생성하는 기능을 추가했습니다.

  • MapTypevalue_contains_null 매개 변수에 대한 지원을 추가했습니다.

  • 현재 환경이 대화형 환경인지 여부를 나타내는 원격 분석에 대화형 기능을 추가했습니다.

  • Native App에서 session.file.get 이 현재 버전에서 /로 시작하는 파일 경로를 읽을 수 있도록 허용합니다.

  • DataFrame.pivot 이후 여러 집계 함수에 대한 지원을 추가했습니다.

실험적 기능

  • Snowflake 오브젝트를 관리하는 Catalog 클래스를 추가했습니다. Session.catalog 를 통해 액세스할 수 있습니다.

    • snowflake.core 는 이 기능에 필요한 종속성입니다.

  • 스테이지에서 JSON 파일을 읽을 때 사용자 입력 스키마를 허용합니다.

  • DataFrame.create_dataframe 을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.

개선 사항

  • cosign 을 사용하여 패키지 서명을 확인하는 방법에 대한 지침을 포함하도록 README.md ` 를 업데이트했습니다.

버그 수정 사항

  • 로컬 테스트 모드에서 열에 0이 포함되어야 하는데 None이 포함되는 버그를 수정했습니다.

  • StructField.from_json ` 에서 tzinfo ` 를 포함한 TimestampTypes ` 가 올바르게 구문 분석되지 않는 버그를 수정했습니다.

  • 입력 열이 날짜 유형 또는 타임스탬프 유형일 때 오류를 발생시키는 function date_format 버그를 수정했습니다.

  • DataFrame 에서 null이 아닌 열에 null 값을 삽입할 수 있는 버그를 수정했습니다.

  • 열 식 오브젝트를 전달할 때 유형 힌트 어설션 오류가 발생하던 replace 및 lit의 버그를 수정했습니다.

  • pandas_udf ` 및 pandas_udtf ` 에서 세션 매개 변수가 잘못 무시되던 버그를 수정했습니다.

  • session.call 을 통해 호출되는 시스템 함수에 대해 잘못된 유형 변환 오류가 발생하던 버그를 수정했습니다.

Snowpark pandas API 업데이트

새로운 기능

  • Series.str.ljustSeries.str.rjust 에 대한 지원이 추가되었습니다.

  • Series.str.center 를 지원하는 기능이 추가되었습니다.

  • Series.str.pad 를 지원하는 기능이 추가되었습니다.

  • Snowpark Python 함수 snowflake_cortex_sentiment 적용 지원을 추가했습니다.

  • DataFrame.map 를 지원하는 기능이 추가되었습니다.

  • DataFrame.from_dictDataFrame.from_records 에 대한 지원을 추가했습니다.

  • 구조체 유형 열에서 대/소문자 혼합 필드 이름에 대한 지원을 추가했습니다.

  • SeriesGroupBy.unique 에 대한 지원을 추가했습니다.

  • 다음 지시문을 사용하여 Series.dt.strftime 에 대한 지원을 추가했습니다.

    • %d: 앞에 0을 붙인 10진수 숫자로 표시되는 월의 날짜입니다.

    • %m: 앞에 0을 붙인 10진수 숫자로 표시되는 월입니다.

    • %Y: 세기가 10진수 숫자로 표시되는 연도입니다.

    • %H: 앞에 0을 붙인 10진수 숫자로 표시되는 시간(24시간 시계)입니다.

    • %M: 앞에 0을 붙인 10진수 숫자로 표시되는 분입니다.

    • %S: 앞에 0을 붙인 10진수 숫자로 표시되는 초입니다.

    • %f: 6자리까지 앞에 0을 붙인 10진수 숫자로 표시되는 마이크로초입니다.

    • %j: 앞에 0을 붙인 10진수 숫자로 연중 며칠째인지 표시되는 날입니다.

    • %X: 로캘의 적절한 시간 표현입니다.

    • %%: 리터럴 ‘%’ 문자입니다.

  • Series.between 를 지원하는 기능이 추가되었습니다.

  • DataFrameGroupBy.apply 에서 include_groups=False 에 대한 지원을 추가했습니다.

  • Series.str.split 에서 expand=True 에 대한 지원을 추가했습니다.

  • DataFrame.popSeries.pop 에 대한 지원이 추가되었습니다.

  • DataFrameGroupBy.aggSeriesGroupBy.agg 에서 firstlast 을 위한 지원을 추가했습니다.

  • Index.drop_duplicates 를 지원하는 기능이 추가되었습니다.

  • pd.pivot_table(), DataFrame.pivot_table(), pd.crosstab() 에서 "count", "median", np.median, "skew", "std", np.std "var", np.var 에 대한 집계 지원을 추가했습니다.

개선 사항

  • 가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여 DataFrame.map, Series.applySeries.map 메서드의 성능을 개선합니다.

  • DataFrame.map 에 대한 설명서를 추가했습니다.

  • 가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여 DataFrame.apply 의 성능을 개선합니다.

  • Snowpark pandas와 scikit-learn의 상호 운용성 범위에 대한 설명서를 추가했습니다.

  • 유형 힌트가 제공되지 않은 경우 Series.map, Series.applyDataFrame.map 에서 함수의 반환 유형을 유추합니다.

  • 교환 프로토콜 호출을 포함한 메서드 호출을 계산하는 원격 분석에 call_count 를 추가했습니다.