2025년 Python용 Snowpark 라이브러리 릴리스 정보¶
이 문서에는 Snowpark Library for Python 에 대한 릴리스 정보가 있는데, 해당되는 경우 다음을 포함합니다.
동작 변경 사항
새로운 기능
고객이 직면한 버그 수정
Snowflake는 Snowpark Library for Python 업데이트에 의미 체계 버전 관리를 사용합니다.
설명서는 Python용 Snowpark 개발자 가이드 섹션을 참조하십시오.
- 경고:
Python 3.8이 EoL(End of Life) 에 도달함에 따라, Python 3.8에서 snowpark-python을 사용할 때 지원 중단 경고가 트리거됩니다. 자세한 내용은 Snowflake Python 런타임 지원 섹션을 참조하십시오. Snowpark 1.24.0은 Anaconda의 정책 에 따라 Python 3.8을 지원하는 마지막 클라이언트 및 서버 버전이 될 것입니다. 기존 Python 3.8 오브젝트를 Python 3.9 이상으로 업그레이드하십시오.
버전 1.27.0(2025-02-05)¶
새로운 기능¶
functions.py
에서 다음 함수에 대한 지원을 추가했습니다.
array_reverse
divnull
map_cat
map_contains_key
map_keys
nullifzero
snowflake_cortex_sentiment
acosh
asinh
atanh
bit_length
bitmap_bit_position
bitmap_bucket_number
bitmap_construct_agg
cbrt
equal_null
from_json
ifnull
localtimestamp
max_by
min_by
nth_value
nvl
octet_length
position
regr_avgx
regr_avgy
regr_count
regr_intercept
regr_r2
regr_slope
regr_sxx
regr_sxy
regr_syy
try_to_binary
base64
base64_decode_string
base64_encode
editdistance
hex
hex_encode
instr
log1p
log2
log10
percentile_approx
unbase64
DataFrame.create_dataframe
을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.DataFrameWriter.insert_into/insertInto
를 지원하는 기능이 추가되었습니다. 이 방법은 로컬 테스트 모드도 지원합니다.임시 뷰를 만들기 위한
DataFrame.create_temp_view
지원을 추가했습니다. 뷰가 이미 존재하면 실패합니다.map_cat
및map_concat
함수에서 여러 열에 대한 지원을 추가했습니다.DataFrame.with_column
및DataFrame.with_columns
에서 원래 열 순서를 유지하기 위한 옵션keep_column_order
를 추가했습니다.StructType
열의 필드 이름을 바꾸거나 필드를 추가할 수 있는 열 캐스트에 옵션을 추가했습니다.contains_null parameter
에 대한 지원을ArrayType
에 추가했습니다.스테이지에서 파일을 읽어 만든 DataFrame 에서
DataFrame.create_or_replace_temp_view
를 통해 임시 뷰를 생성하는 기능을 추가했습니다.MapType
에value_contains_null
매개 변수에 대한 지원을 추가했습니다.현재 환경이 대화형 환경인지 여부를 나타내는 원격 분석에 대화형 기능을 추가했습니다.
Native App에서
session.file.get
이 현재 버전에서 /로 시작하는 파일 경로를 읽을 수 있도록 허용합니다.DataFrame.pivot
이후 여러 집계 함수에 대한 지원을 추가했습니다.
실험적 기능¶
Snowflake 오브젝트를 관리하는 Catalog 클래스를 추가했습니다.
Session.catalog
를 통해 액세스할 수 있습니다.snowflake.core
는 이 기능에 필요한 종속성입니다.
스테이지에서 JSON 파일을 읽을 때 사용자 입력 스키마를 허용합니다.
DataFrame.create_dataframe
을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.
개선 사항¶
cosign
을 사용하여 패키지 서명을 확인하는 방법에 대한 지침을 포함하도록README.md
` 를 업데이트했습니다.
버그 수정 사항¶
로컬 테스트 모드에서 열에 0이 포함되어야 하는데 None이 포함되는 버그를 수정했습니다.
StructField.from_json
` 에서tzinfo
` 를 포함한TimestampTypes
` 가 올바르게 구문 분석되지 않는 버그를 수정했습니다.입력 열이 날짜 유형 또는 타임스탬프 유형일 때 오류를 발생시키는
function date_format
버그를 수정했습니다.DataFrame 에서 null이 아닌 열에 null 값을 삽입할 수 있는 버그를 수정했습니다.
열 식 오브젝트를 전달할 때 유형 힌트 어설션 오류가 발생하던 replace 및 lit의 버그를 수정했습니다.
pandas_udf
` 및pandas_udtf
` 에서 세션 매개 변수가 잘못 무시되던 버그를 수정했습니다.session.call
을 통해 호출되는 시스템 함수에 대해 잘못된 유형 변환 오류가 발생하던 버그를 수정했습니다.
Snowpark pandas API 업데이트¶
새로운 기능¶
Series.str.ljust
및Series.str.rjust
에 대한 지원이 추가되었습니다.Series.str.center
를 지원하는 기능이 추가되었습니다.Series.str.pad
를 지원하는 기능이 추가되었습니다.Snowpark Python 함수
snowflake_cortex_sentiment
적용 지원을 추가했습니다.DataFrame.map
를 지원하는 기능이 추가되었습니다.DataFrame.from_dict
및DataFrame.from_records
에 대한 지원을 추가했습니다.구조체 유형 열에서 대/소문자 혼합 필드 이름에 대한 지원을 추가했습니다.
SeriesGroupBy.unique
에 대한 지원을 추가했습니다.다음 지시문을 사용하여
Series.dt.strftime
에 대한 지원을 추가했습니다.%d: 앞에 0을 붙인 10진수 숫자로 표시되는 월의 날짜입니다.
%m: 앞에 0을 붙인 10진수 숫자로 표시되는 월입니다.
%Y: 세기가 10진수 숫자로 표시되는 연도입니다.
%H: 앞에 0을 붙인 10진수 숫자로 표시되는 시간(24시간 시계)입니다.
%M: 앞에 0을 붙인 10진수 숫자로 표시되는 분입니다.
%S: 앞에 0을 붙인 10진수 숫자로 표시되는 초입니다.
%f: 6자리까지 앞에 0을 붙인 10진수 숫자로 표시되는 마이크로초입니다.
%j: 앞에 0을 붙인 10진수 숫자로 연중 며칠째인지 표시되는 날입니다.
%X: 로캘의 적절한 시간 표현입니다.
%%: 리터럴 ‘%’ 문자입니다.
Series.between
를 지원하는 기능이 추가되었습니다.DataFrameGroupBy.apply
에서include_groups=False
에 대한 지원을 추가했습니다.Series.str.split
에서expand=True
에 대한 지원을 추가했습니다.DataFrame.pop
및Series.pop
에 대한 지원이 추가되었습니다.DataFrameGroupBy.agg
및SeriesGroupBy.agg
에서first
및last
을 위한 지원을 추가했습니다.Index.drop_duplicates
를 지원하는 기능이 추가되었습니다.pd.pivot_table()
,DataFrame.pivot_table()
,pd.crosstab()
에서"count"
,"median"
,np.median
,"skew"
,"std"
,np.std
"var"
,np.var
에 대한 집계 지원을 추가했습니다.
개선 사항¶
가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여
DataFrame.map
,Series.apply
및Series.map
메서드의 성능을 개선합니다.DataFrame.map
에 대한 설명서를 추가했습니다.가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여
DataFrame.apply
의 성능을 개선합니다.Snowpark pandas와 scikit-learn의 상호 운용성 범위에 대한 설명서를 추가했습니다.
유형 힌트가 제공되지 않은 경우
Series.map
,Series.apply
및DataFrame.map
에서 함수의 반환 유형을 유추합니다.교환 프로토콜 호출을 포함한 메서드 호출을 계산하는 원격 분석에
call_count
를 추가했습니다.