2025년 Python용 Snowpark 라이브러리 릴리스 정보¶
이 문서에는 Snowpark Library for Python 에 대한 릴리스 정보가 있는데, 해당되는 경우 다음을 포함합니다.
동작 변경 사항
새로운 기능
고객이 직면한 버그 수정
Snowflake는 Snowpark Library for Python 업데이트에 의미 체계 버전 관리를 사용합니다.
설명서는 Python용 Snowpark 개발자 가이드 섹션을 참조하십시오.
경고
Python 3.8이 EoL(End of Life) 에 도달함에 따라, Python 3.8에서 snowpark-python을 사용할 때 지원 중단 경고가 트리거됩니다. 자세한 내용은 Snowflake Python 런타임 지원 섹션을 참조하십시오. Snowpark 1.24.0은 Anaconda의 정책 에 따라 Python 3.8을 지원하는 마지막 클라이언트 및 서버 버전이 될 것입니다. 기존 Python 3.8 오브젝트를 Python 3.9 이상으로 업그레이드하십시오.
버전 1.32.0(2025-05-15)¶
개선 사항¶
Snowflake 시스템 프로시저를 호출해도 프로시저의 반환 유형을 확인하기 위한
describe procedure
호출이 추가로 호출되지 않습니다.스테이지 URL 및
FILE
데이터 타입으로Session.create_dataframe()
지원이 추가되었습니다.session.read.option('mode', <mode>), option('rowTag', <tag_name>).xml(<stage_file_path>)
를 사용하여 XML 파일을 읽을 때 손상된 XML 레코드를 처리하기 위한 다양한 모드 지원이 추가되었습니다. 현재는PERMISSIVE
및FAILFAST
가 지원됩니다.파일에서 지정된
ROWTAG
를 찾을 수 없을 때 XML 리더의 오류 메시지가 표시되는 문제를 개선했습니다.Dataframe.drop
에서 삭제된 열을 제외하기 위해SELECT * EXCLUDE ()
를 사용하도록 쿼리 생성을 개선했습니다. 이 기능을 활성화하려면session.conf.set("use_simplified_query_generation", True)
를 설정합니다.VariantType
에 대한 지원을StructType.from_json
에 추가했습니다.
버그 수정 사항¶
DataFrameWriter.dbapi
(비공개 미리 보기)에서 외부 데이터베이스의 Unicode 또는 큰따옴표로 묶인 열 이름이 올바르게 인용되지 않아 오류가 발생하는 버그가 수정되었습니다.중첩된
OBJECT
데이터의 명명된 필드에 공백이 포함될 때 오류가 발생할 수 있는 버그가 수정되었습니다.
Snowpark 로컬 테스트 업데이트¶
버그 수정 사항¶
snowflake.snowpark.functions.rank
가 정렬 방향을 따르지 않는 버그를 수정했습니다.필터링된 데이터에서 잘못된 결과를 초래하는
snowflake.snowpark.functions.to_timestamp_*
버그를 수정했습니다.
Snowpark pandas API 업데이트¶
새로운 기능¶
Series.str.get
,Series.str.slice
,Series.str.__getitem__
(` Series.str[…] `)의 딕셔너리 값에 대한 지원이 추가되었습니다.DataFrame.to_html
를 지원하는 기능이 추가되었습니다.DataFrame.to_string
및Series.to_string
에 대한 지원이 추가되었습니다.pd.read_csv
를 사용하여 S3 버킷에서 파일 읽기 지원이 추가되었습니다.
개선 사항¶
iceberg_config
를DataFrame.to_iceberg
및Series.to_iceberg
의 필수 매개 변수로 설정합니다.
버전 1.31.0 (2025-04-24)¶
새로운 기능¶
StoredProcedure.register():code:
에서execute_as
인자의restricted caller
권한에 대한 지원을 추가했습니다.DataFrame.to_pandas()
에서 비선택 문에 대한 지원이 추가되었습니다.Session.add_packages
,Session.add_requirements
,Session.get_packages
,Session.remove_package
,Session.clear_packages
에artifact_repository
매개 변수에 대한 지원이 추가되었습니다.session.read.option('rowTag', <tag_name>).xml(<stage_file_path>)
(실험적) 를 사용하여 XML 파일의 행 태그를 읽는 기능이 추가되었습니다.각 XML 레코드는 별도의 행으로 추출됩니다.
해당 레코드 내의 각 필드는
VARIANT
유형의 별도 열이 되며,col(a.b.c)
와 같은 점 표기법을 사용하여 추가로 쿼리할 수 있습니다.
DataFrameReader.dbapi
(PrPr)에 업데이트가 추가되었습니다.여러 개의 가져온 데이터를 1개의 Parquet 파일로 병합하여 성능을 최적화하는
fetch_merge_count
매개 변수를 추가했습니다.Databricks에 대한 지원이 추가되었습니다.
Snowflake UDTF 를 통한 수집 지원을 추가했습니다.
functions.py
(비공개 미리 보기)에서 다음 AI 기반 함수에 대한 지원이 추가되었습니다.prompt
ai_filter
(prompt()
함수 및 이미지 파일 지원 추가, 두 번째 인자 이름을expr
에서file
로 변경했습니다.)ai_classify
개선 사항¶
DataFrame.to_snowpark_pandas
에 대해relaxed_ordering
매개 변수의 이름을enforce_ordering
으로 변경했습니다. 또한 새로운 기본값은enforce_ordering=False
로 이전 기본값인relaxed_ordering=False
와 반대 효과를 갖습니다.기본
fetch_size
매개 변수 값을 1000으로 설정하여DataFrameReader.dbapi
(PrPr) 읽기 성능을 개선했습니다.잠재적으로 일치할 수 있는 식별자를 제안하여 잘못된 식별자 SQL 오류에 대한 오류 메시지를 개선합니다.
session.table
을 사용하여 Snowflake 테이블에서 DataFrame 을 생성할 때 발행되는 설명 쿼리 수를 줄였습니다.DataFrameAnalyticsFunctions.time_series_agg()
의 성능 및 정확도가 개선되었습니다.
버그 수정 사항¶
피벗 열과 집계 열이 동일한 경우
DataFrame.group_by().pivot().agg
의 버그를 수정했습니다.DataFrameReader.dbapi
(PrPr)에서create_connection
이 지원되지 않는 드라이버 유형의 연결 오브젝트를 반환할 때TypeError
가 발생하던 버그를 수정했습니다.df.limit(0)
호출이 올바르게 적용되지 않는 버그를 수정했습니다.추가 모드를 사용할 때 예약된 이름이 오류를 throw하는 버그가
DataFrameWriter.save_as_table
에서 수정되었습니다.
사용 중단¶
Python3.8에 대한 지원이 중단되었습니다.
DataFrameAnalyticsFunctions.time_series_agg()
에서sliding_interval
인자가 더 이상 사용되지 않습니다.
Snowpark 로컬 테스트 업데이트¶
새로운 기능¶
Window.range_between
에 간격 식에 대한 지원이 추가되었습니다.array_construct
함수에 대한 지원이 추가되었습니다.
버그 수정 사항¶
가져오기를 통해 저장 프로시저를 실행하는 동안 일시적인
__pycache__
디렉터리가 실수로 복사되는 로컬 테스트의 버그가 수정되었습니다.Column.like
호출에 대해 잘못된 결과를 생성하는 로컬 테스트의 버그를 수정했습니다.로컬 테스트에서
Column.getItem
및snowpark.snowflake.functions.get
이null
을 반환하지 않고IndexError
를 발생시키는 버그를 수정했습니다.로컬 테스트에서
df.limit(0)
호출이 올바르게 적용되지 않는 버그가 수정되었습니다.로컬 테스트에서 빈 테이블에
Table.merge
를 입력하면 예외가 발생하던 버그가 수정되었습니다.
Snowpark pandas API 업데이트¶
종속성 업데이트¶
modin
을 0.30.1에서 0.32.0으로 업데이트했습니다.numpy
2.0 이상에 대한 지원이 추가되었습니다.
새로운 기능¶
DataFrame.create_or_replace_view
및Series.create_or_replace_view
에 대한 지원이 추가되었습니다.DataFrame.create_or_replace_dynamic_table
및Series.create_or_replace_dynamic_table
에 대한 지원이 추가되었습니다.DataFrame.to_view
및Series.to_view
에 대한 지원이 추가되었습니다.DataFrame.to_dynamic_table
및Series.to_dynamic_table
에 대한 지원이 추가되었습니다.max
,mean
,median
,min
,sum
에 대한DataFrame.groupby.resample
지원이 추가되었습니다.다음을 사용하여 스테이징된 파일 읽기 지원이 추가되었습니다.
pd.read_excel
pd.read_html
pd.read_pickle
pd.read_sas
pd.read_xml
DataFrame.to_iceberg
및Series.to_iceberg
에 대한 지원이 추가되었습니다.Series.str.len
에서 딕셔너리 값에 대한 지원이 추가되었습니다.
개선 사항¶
비용이 많이 드는 피벗 단계를 피하여
DataFrame.groupby.apply
및Series.groupby.apply
의 성능을 개선합니다.더 나은 엔진 변환을 위해 행 수 상한에 대한 추정치를
OrderedDataFrame
에 추가했습니다. 이로 인해 잠재적으로 쿼리 수가 증가할 수 있습니다.enforce_ordering
에서relaxed_ordering
매개 변수의 이름을pd.read_snowflake
로 변경했습니다. 또한 새로운 기본값은enforce_ordering=False
로, 이전 기본값인relaxed_ordering=False
와 반대 효과를 갖습니다.
버그 수정 사항¶
Iceberg 테이블 및
pd.read_snowflake
를 읽을 때enforce_ordering=True
의 버그를 수정했습니다.
버전 1.30.0(2025-03-27)¶
새로운 기능¶
relaxed_ordering
매개 변수를 도입하여Dataframe.to_snowpark_pandas
에서 완화된 일관성 및 주문 보증을 지원합니다.DataFrameReader.dbapi
(미리 보기)는 이제session_init_statement
매개 변수에 대한 문자열 목록을 허용하여 세션 초기화 중에 여러 개의 SQL 문을 실행할 수 있습니다.
개선 사항¶
Dataframe.stat.sample_by
가fractions
에서 각 키에 대해 UNION ALL 하위 쿼리를 생성하는 기존 방식에 비해 대규모fractions
사전과 잘 어울리는 단일 플랫 쿼리를 생성하도록 쿼리 생성을 개선했습니다. 이 기능을 활성화하려면session.conf.set("use_simplified_query_generation", True)
를 설정합니다.Parquet 파일을 테이블에 복사본으로 복사할 때 벡터화 옵션을 활성화하여
DataFrameReader.dbapi
의 성능을 개선했습니다.DataFrame.random_split
에 대한 쿼리 생성이 다음과 같은 방식으로 개선되었습니다.session.conf.set("use_simplified_query_generation", True)
를 설정하여 활성화할 수 있습니다.입력 데이터프레임의 내부 구현에서
cache_result
를 제거하여 순수한 지연 데이터프레임 작업을 수행할 필요가 없어졌습니다.이제
seed
인자는 여러 호출과 세션에서 반복 가능한 결과를 제공하는 예상대로 작동합니다.
DataFrame.fillna
및DataFrame.replace
는 이제include_decimal
이True
로 설정된 경우int
및float
를Decimal
열에 맞추는 기능을 지원합니다.다음 UDF 및
files.py
의 저장 프로시저 함수에 대한 설명서를 일반 공급에 따라 추가했습니다.SnowflakeFile.write
SnowflakeFile.writelines
SnowflakeFile.writeable
SnowflakeFile
및SnowflakeFile.open()
에 대한 설명서가 일부 변경되었습니다.
버그 수정 사항¶
오류를 발생시키는 다음 함수의 버그를 수정했습니다.
.cast()
가 출력에 적용됩니다.from_json
size
Snowpark 로컬 테스트 업데이트¶
버그 수정 사항¶
집계에서 빈 그룹이 여전히 행을 생성하는 버그를 수정했습니다.
Dataframe.except_
에서 행이 잘못 삭제되는 버그를 수정했습니다.필터링된 열을 형 변환할 때
to_timestamp
가 실패하는 버그를 수정했습니다.
Snowpark pandas API 업데이트¶
새로운 기능¶
Series.str.__getitem__
(Series.str[...]
) 에서 목록 값에 대한 지원을 추가했습니다.GROUP BY 작업에서
pd.Grouper
오브젝트에 대한 지원이 추가되었습니다.freq
가 지정되면sort
,closed
,label
,convention
인자의 기본값이 지원되며,origin
이 지정되면start
또는start_day
가 지원됩니다.새로운 매개 변수
relaxed_ordering
을 도입하여 명명된 데이터 원본(예: 테이블 및 뷰)과 쿼리 데이터 원본 모두에 대해pd.read_snowflake
에서 완화된 일관성 및 순서 보장에 대한 지원이 추가되었습니다.
개선 사항¶
QUOTED_IDENTIFIERS_IGNORE_CASE
가 설정된 것으로 확인될 때마다 경고를 표시하고 사용자에게 설정을 해제하도록 요청합니다.DataFrame.to_snowflake
및Series.to_snowflake
에서 누락된index_label
이index=True
에서 처리되는 방식을 개선했습니다. 대ValueError
가 발생하는 대신, 시스템 정의 레이블이 인덱스 열에 사용됩니다.함수 이름이 지원되지 않는 경우
groupby
,DataFrame
,Series.agg
에 대한 오류 메시지가 개선되었습니다.
Snowpark 로컬 테스트 업데이트¶
개선 사항¶
QUOTED_IDENTIFIERS_IGNORE_CASE
가 설정된 것으로 확인될 때마다 경고를 표시하고 사용자에게 설정을 해제하도록 요청합니다.DataFrame.to_snowflake
및Series.to_snowflake
에서 누락된index_label
이index=True
에서 처리되는 방식을 개선했습니다. 대ValueError
가 발생하는 대신, 시스템 정의 레이블이 인덱스 열에 사용됩니다.함수 이름이 지원되지 않는 경우
groupby or DataFrame or Series.agg
에 대한 오류 메시지가 개선되었습니다.
버전 1.29.1(2025-03-12)¶
버그 수정 사항¶
저장 프로시저 및 Snowbooks에서 사용할 수 없는
DataFrameReader.dbapi
(비공개 미리 보기)의 버그가 수정되었습니다.
버전 1.29.0(2025-03-05)¶
새로운 기능¶
functions.py
(비공개 미리 보기)에서 다음 AI 기반 함수에 대한 지원이 추가되었습니다.ai_filter
ai_agg
summarize_agg
새로운 FILE SQL 유형에 대한 지원이 추가되었으며
functions.py
(비공개 미리 보기)에 다음과 같은 관련 함수가 추가되었습니다.
fl_get_content_type
fl_get_etag
fl_get_file_type
fl_get_last_modified
fl_get_relative_path
fl_get_scoped_file_url
fl_get_size
fl_get_stage
fl_get_stage_file_url
fl_is_audio
fl_is_compressed
fl_is_document
fl_is_image
fl_is_video
아티팩트 저장소(비공개 미리 보기)를 사용하여 PyPi 에서 서드 파티 패키지를 가져오는 기능이 추가되었습니다.
저장 프로시저 또는 사용자 정의 함수를 등록할 때 키워드 인자
artifact_repository
및artifact_repository_packages
를 사용하여 아티팩트 저장소와 패키지를 각각 지정하십시오.지원되는 APIs 는 다음과 같습니다.
Session.sproc.register
Session.udf.register
Session.udaf.register
Session.udtf.register
functions.sproc
functions.udf
functions.udaf
functions.udtf
functions.pandas_udf
functions.pandas_udtf
개선 사항¶
저장 프로시저 등록 시
snowflake-snowpark-python
패키지 호환성에 대한 버전 유효성 검사 경고가 개선되었습니다. 이제 메이저 또는 마이너 버전이 일치하지 않는 경우에만 경고가 트리거되며, 버그 수정 버전 차이로 인해 더 이상 경고가 생성되지 않습니다.이전 버전 외에
cloudpickle==3.0.0
도 지원하도록 클라우드피클 종속성을 변경했습니다.
버그 수정 사항¶
스레드 안전 세션이 비활성화된 경우 많은 수의 값이 있는 데이터프레임을 생성하면
Unsupported feature 'SCOPED_TEMPORARY'.
오류가 발생하는 버그를 수정했습니다.스테이지 파일을 읽어 DataFrame 을 생성하고 CTE 최적화가 활성화된 경우
df.describe
가 내부 SQL 실행 오류를 발생시키는 버그를 수정했습니다.
session.conf.set("use_simplified_query_generation", True)
를 사용하여 간소화된 쿼리 생성이 활성화된 경우df.order_by(A).select(B).distinct()
가 잘못된 SQL 을 생성하는 버그를 수정했습니다.
기본적으로 단순화된 쿼리 생성을 비활성화합니다.
Snowpark pandas API 업데이트¶
개선 사항¶
테이블이 존재하지 않을 때
pd.to_snowflake
,DataFrame.to_snowflake
,Series.to_snowflake
에 대한 오류 메시지를 개선했습니다.
pd.to_snowflake
,DataFrame.to_snowflake
,Series.to_snowflake
에서if_exists
매개 변수에 대한 문서 문자열의 가독성을 개선했습니다.UDFs 를 사용하는 모든 Pandas 함수에 대한 오류 메시지와 Snowpark 오브젝트를 개선했습니다.
버그 수정 사항¶
Series.rename_axis
에서AttributeError
가 발생하던 버그를 수정했습니다.
pd.get_dummies
가 기본적으로 NULL/NaN 값을 무시하지 않던 버그를 수정했습니다.
pd.get_dummies
를 반복적으로 호출하면 ‘중복된 열 이름 오류’가 발생하는 버그가 수정되었습니다.
pd.get_dummies
에서 열 목록을 전달하면 출력 DataFrame 에서 잘못된 열 레이블이 생성되던 버그를 수정했습니다.
pd.get_dummies
를 업데이트하여 int 대신 부울 값을 반환합니다.
Snowpark 로컬 테스트 업데이트¶
새로운 기능¶
range_between
윈도우 함수에 리터럴 값에 대한 지원이 추가되었습니다.
버전 1.28.0(2025-02-20)¶
새로운 기능¶
functions.py
에서 다음 함수에 대한 지원을 추가했습니다.normal
randn
Dataframe.union_by_name
및Dataframe.union_all_by_name
에allow_missing_columns
매개 변수에 대한 지원을 추가했습니다.
개선 사항¶
충돌을 방지하기 위해 무작위 오브젝트 이름 생성을 개선했습니다.
Dataframe.distinct
쿼리 생성이 GROUP BY all columns 을 사용하여 SELECT 대신 SELECT DISTINCT 를 생성하도록 개선되었습니다. 이 기능을 비활성화하려면session.conf.set("use_simplified_query_generation", False)
로 설정하십시오.
사용 중단¶
사용되지 않는 Snowpark Python 함수
snowflake_cortex_summarize
. 사용자는snowflake-ml-python
을 설치하고 대신snowflake.cortex.summarize
함수를 사용할 수 있습니다.사용되지 않는 Snowpark Python 함수
snowflake_cortex_sentiment
. 사용자는snowflake-ml-python
을 설치하고 대신snowflake.cortex.sentiment
함수를 사용할 수 있습니다.
버그 수정 사항¶
여러 쿼리를 생성하는 DataFrames 에 대한 스택 추적에 의해 세션 수준 쿼리 태그를 덮어쓰는 버그를 수정했습니다. 이제 쿼리 태그는
session.conf.set("collect_stacktrace_in_query_tag", True)
경우에만 스택트레이스로 설정됩니다.Session._write_pandas
에서 Snowpark Pandas 오브젝트를 작성할 때use_logical_type
매개 변수를Session._write_modin_pandas_helper
로 잘못 전달하던 버그를 수정했습니다.여러 값의 형식이 잘못 지정될 수 있는 SQL 생성 옵션의 버그를 수정했습니다.
데이터베이스 또는 스키마의 빈 문자열이 올바르게 처리되지 않고 잘못된 SQL 문을 생성하는 버그가
Session.catalog
에서 수정되었습니다.
실험적 기능¶
Snowflake 테이블에 파이로우 테이블 쓰기 지원이 추가되었습니다.
Snowpark pandas API 업데이트¶
새로운 기능¶
Snowflake Cortex 함수
Summarize
및Sentiment
적용 지원 추가.Series.str.get
에서 목록 값에 대한 지원을 추가했습니다.
버그 수정 사항¶
apply
에서 kwargs가 적용된 함수에 올바르게 전달되지 않던 버그를 수정했습니다.
Snowpark 로컬 테스트 업데이트¶
새로운 기능¶
- 다음 함수에 대한 지원이 추가되었습니다
hour
minute
CSV 리더에 NULL_IF 매개 변수에 대한 지원이 추가되었습니다.
CSVs 로딩 시
date_format
,datetime_format
,timestamp_format
옵션에 대한 지원이 추가되었습니다.
버그 수정 사항¶
DataFrame.join
에서 열에 잘못된 입력이 발생하는 버그가 수정되었습니다.otherwise
절에서 잘못된 결과를 유발하는when
문의 버그를 수정했습니다.
버전 1.27.0(2025-02-05)¶
새로운 기능¶
functions.py
에서 다음 함수에 대한 지원을 추가했습니다.
array_reverse
divnull
map_cat
map_contains_key
map_keys
nullifzero
snowflake_cortex_sentiment
acosh
asinh
atanh
bit_length
bitmap_bit_position
bitmap_bucket_number
bitmap_construct_agg
cbrt
equal_null
from_json
ifnull
localtimestamp
max_by
min_by
nth_value
nvl
octet_length
position
regr_avgx
regr_avgy
regr_count
regr_intercept
regr_r2
regr_slope
regr_sxx
regr_sxy
regr_syy
try_to_binary
base64
base64_decode_string
base64_encode
editdistance
hex
hex_encode
instr
log1p
log2
log10
percentile_approx
unbase64
DataFrame.create_dataframe
을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.DataFrameWriter.insert_into/insertInto
를 지원하는 기능이 추가되었습니다. 이 방법은 로컬 테스트 모드도 지원합니다.임시 뷰를 만들기 위한
DataFrame.create_temp_view
지원을 추가했습니다. 뷰가 이미 존재하면 실패합니다.map_cat
및map_concat
함수에서 여러 열에 대한 지원을 추가했습니다.DataFrame.with_column
및DataFrame.with_columns
에서 원래 열 순서를 유지하기 위한 옵션keep_column_order
를 추가했습니다.StructType
열의 필드 이름을 바꾸거나 필드를 추가할 수 있는 열 캐스트에 옵션을 추가했습니다.contains_null parameter
에 대한 지원을ArrayType
에 추가했습니다.스테이지에서 파일을 읽어 만든 DataFrame 에서
DataFrame.create_or_replace_temp_view
를 통해 임시 뷰를 생성하는 기능을 추가했습니다.MapType
에value_contains_null
매개 변수에 대한 지원을 추가했습니다.현재 환경이 대화형 환경인지 여부를 나타내는 원격 분석에 대화형 기능을 추가했습니다.
Native App에서
session.file.get
이 현재 버전에서 /로 시작하는 파일 경로를 읽을 수 있도록 허용합니다.DataFrame.pivot
이후 여러 집계 함수에 대한 지원을 추가했습니다.
실험적 기능¶
Snowflake 오브젝트를 관리하는
Session.catalog
클래스를 추가했습니다.Session.catalog
를 통해 액세스할 수 있습니다.snowflake.core
는 이 기능에 필요한 종속성입니다.
스테이지에서 JSON 파일을 읽을 때 사용자 입력 스키마 또는 사용자 입력 스키마를 허용합니다.
DataFrame.create_dataframe
을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.
개선 사항¶
cosign
을 사용하여 패키지 서명을 확인하는 방법에 대한 지침을 포함하도록README.md
를 업데이트했습니다.
버그 수정 사항¶
로컬 테스트 모드에서 열에 0이 포함되어야 하는데 None이 포함되는 버그를 수정했습니다.
StructField.from_json
에서tzinfo
를 포함한TimestampTypes
가 올바르게 구문 분석되지 않는 버그를 수정했습니다.입력 열이 날짜 유형 또는 타임스탬프 유형일 때 오류를 발생시키는
function date_format
버그를 수정했습니다.Null이 아닌 열에 null 값을 삽입할 수 있는 DataFrame 버그를 수정했습니다.
열 식 오브젝트를 전달할 때 유형 힌트 어설션 오류가 발생하던
replace
및lit
함수의 버그를 수정했습니다.pandas_udf
및pandas_udtf
에서 세션 매개 변수가 잘못 무시되던 버그를 수정했습니다.session.call
을 통해 호출되는 시스템 함수에 대해 잘못된 유형 변환 오류가 발생하던 버그를 수정했습니다.
Snowpark pandas API 업데이트¶
새로운 기능¶
Series.str.ljust
및Series.str.rjust
에 대한 지원이 추가되었습니다.Series.str.center
를 지원하는 기능이 추가되었습니다.Series.str.pad
를 지원하는 기능이 추가되었습니다.Snowpark Python 함수
snowflake_cortex_sentiment
적용 지원을 추가했습니다.DataFrame.map
를 지원하는 기능이 추가되었습니다.DataFrame.from_dict
및DataFrame.from_records
에 대한 지원이 추가되었습니다.구조체 유형 열에서 대/소문자 혼합 필드 이름에 대한 지원을 추가했습니다.
SeriesGroupBy.unique
에 대한 지원을 추가했습니다.다음 지시문을 사용하여
Series.dt.strftime
에 대한 지원을 추가했습니다.%d: 앞에 0을 붙인 10진수 숫자로 표시되는 월의 날짜입니다.
%m: 앞에 0을 붙인 10진수 숫자로 표시되는 월입니다.
%Y: 세기가 10진수 숫자로 표시되는 연도입니다.
%H: 앞에 0을 붙인 10진수 숫자로 표시되는 시간(24시간 시계)입니다.
%M: 앞에 0을 붙인 10진수 숫자로 표시되는 분입니다.
%S: 앞에 0을 붙인 10진수 숫자로 표시되는 초입니다.
%f: 6자리까지 앞에 0을 붙인 10진수 숫자로 표시되는 마이크로초입니다.
%j: 앞에 0을 붙인 10진수 숫자로 연중 며칠째인지 표시되는 날입니다.
%X: 로캘의 적절한 시간 표현입니다.
%%: 리터럴 ‘%’ 문자입니다.
Series.between
를 지원하는 기능이 추가되었습니다.DataFrameGroupBy.apply
에서include_groups=False
에 대한 지원을 추가했습니다.Series.str.split
에서expand=True
에 대한 지원을 추가했습니다.DataFrame.pop
및Series.pop
에 대한 지원이 추가되었습니다.DataFrameGroupBy.agg
및SeriesGroupBy.agg
에서first
및last
을 위한 지원을 추가했습니다.Index.drop_duplicates
를 지원하는 기능이 추가되었습니다.pd.pivot_table()
,DataFrame.pivot_table()
,pd.crosstab()
에서"count"
,"median"
,np.median
,"skew"
,"std"
,np.std
"var"
,np.var
에 대한 집계 지원을 추가했습니다.
개선 사항¶
DataFrame.map
및Series.map
메서드의 성능을 개선하여 가능한 경우 numpy 함수를 Snowpark 함수에 매핑합니다.DataFrame.map
에 대한 설명서를 추가했습니다.가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여
DataFrame.apply
의 성능을 개선했습니다.Snowpark pandas와 scikit-learn의 상호 운용성 범위에 대한 설명서를 추가했습니다.
유형 힌트가 제공되지 않은 경우
Series.map
,Series.apply
및DataFrame.map
에서 함수의 반환 유형을 유추합니다.교환 프로토콜 호출을 포함한 메서드 호출을 계산하는 원격 분석에
call_count
를 추가했습니다.