2025년 Python용 Snowpark 라이브러리 릴리스 정보

이 문서에는 Snowpark Library for Python 에 대한 릴리스 정보가 있는데, 해당되는 경우 다음을 포함합니다.

  • 동작 변경 사항

  • 새로운 기능

  • 고객이 직면한 버그 수정

Snowflake는 Snowpark Library for Python 업데이트에 의미 체계 버전 관리를 사용합니다.

설명서는 Python용 Snowpark 개발자 가이드 섹션을 참조하십시오.

경고

Python 3.8이 EoL(End of Life) 에 도달함에 따라, Python 3.8에서 snowpark-python을 사용할 때 지원 중단 경고가 트리거됩니다. 자세한 내용은 Snowflake Python 런타임 지원 섹션을 참조하십시오. Snowpark 1.24.0은 Anaconda의 정책 에 따라 Python 3.8을 지원하는 마지막 클라이언트 및 서버 버전이 될 것입니다. 기존 Python 3.8 오브젝트를 Python 3.9 이상으로 업그레이드하십시오.

버전 1.32.0(2025-05-15)

개선 사항

  • Snowflake 시스템 프로시저를 호출해도 프로시저의 반환 유형을 확인하기 위한 describe procedure 호출이 추가로 호출되지 않습니다.

  • 스테이지 URL 및 FILE 데이터 타입으로 Session.create_dataframe() 지원이 추가되었습니다.

  • session.read.option('mode', <mode>), option('rowTag', <tag_name>).xml(<stage_file_path>) 를 사용하여 XML 파일을 읽을 때 손상된 XML 레코드를 처리하기 위한 다양한 모드 지원이 추가되었습니다. 현재는 PERMISSIVEFAILFAST 가 지원됩니다.

  • 파일에서 지정된 ROWTAG 를 찾을 수 없을 때 XML 리더의 오류 메시지가 표시되는 문제를 개선했습니다.

  • Dataframe.drop 에서 삭제된 열을 제외하기 위해 SELECT * EXCLUDE () 를 사용하도록 쿼리 생성을 개선했습니다. 이 기능을 활성화하려면 session.conf.set("use_simplified_query_generation", True) 를 설정합니다.

  • VariantType 에 대한 지원을 StructType.from_json 에 추가했습니다.

버그 수정 사항

  • DataFrameWriter.dbapi (비공개 미리 보기)에서 외부 데이터베이스의 Unicode 또는 큰따옴표로 묶인 열 이름이 올바르게 인용되지 않아 오류가 발생하는 버그가 수정되었습니다.

  • 중첩된 OBJECT 데이터의 명명된 필드에 공백이 포함될 때 오류가 발생할 수 있는 버그가 수정되었습니다.

Snowpark 로컬 테스트 업데이트

버그 수정 사항

  • snowflake.snowpark.functions.rank 가 정렬 방향을 따르지 않는 버그를 수정했습니다.

  • 필터링된 데이터에서 잘못된 결과를 초래하는 snowflake.snowpark.functions.to_timestamp_* 버그를 수정했습니다.

Snowpark pandas API 업데이트

새로운 기능

  • Series.str.get, Series.str.slice, Series.str.__getitem__ (` Series.str[…] `)의 딕셔너리 값에 대한 지원이 추가되었습니다.

  • DataFrame.to_html 를 지원하는 기능이 추가되었습니다.

  • DataFrame.to_stringSeries.to_string 에 대한 지원이 추가되었습니다.

  • pd.read_csv 를 사용하여 S3 버킷에서 파일 읽기 지원이 추가되었습니다.

개선 사항

  • iceberg_configDataFrame.to_icebergSeries.to_iceberg 의 필수 매개 변수로 설정합니다.

버전 1.31.0 (2025-04-24)

새로운 기능

  • StoredProcedure.register():code: 에서 execute_as 인자의 restricted caller 권한에 대한 지원을 추가했습니다.

  • DataFrame.to_pandas() 에서 비선택 문에 대한 지원이 추가되었습니다.

  • Session.add_packages, Session.add_requirements, Session.get_packages, Session.remove_package, Session.clear_packagesartifact_repository 매개 변수에 대한 지원이 추가되었습니다.

  • session.read.option('rowTag', <tag_name>).xml(<stage_file_path>) (실험적) 를 사용하여 XML 파일의 행 태그를 읽는 기능이 추가되었습니다.

    • 각 XML 레코드는 별도의 행으로 추출됩니다.

    • 해당 레코드 내의 각 필드는 VARIANT 유형의 별도 열이 되며, col(a.b.c) 와 같은 점 표기법을 사용하여 추가로 쿼리할 수 있습니다.

  • DataFrameReader.dbapi (PrPr)에 업데이트가 추가되었습니다.

    • 여러 개의 가져온 데이터를 1개의 Parquet 파일로 병합하여 성능을 최적화하는 fetch_merge_count 매개 변수를 추가했습니다.

    • Databricks에 대한 지원이 추가되었습니다.

    • Snowflake UDTF 를 통한 수집 지원을 추가했습니다.

  • functions.py (비공개 미리 보기)에서 다음 AI 기반 함수에 대한 지원이 추가되었습니다.

    • prompt

    • ai_filter (prompt() 함수 및 이미지 파일 지원 추가, 두 번째 인자 이름을 expr 에서 file 로 변경했습니다.)

    • ai_classify

개선 사항

  • DataFrame.to_snowpark_pandas 에 대해 relaxed_ordering 매개 변수의 이름을 enforce_ordering 으로 변경했습니다. 또한 새로운 기본값은 enforce_ordering=False 로 이전 기본값인 relaxed_ordering=False 와 반대 효과를 갖습니다.

  • 기본 fetch_size 매개 변수 값을 1000으로 설정하여 DataFrameReader.dbapi (PrPr) 읽기 성능을 개선했습니다.

  • 잠재적으로 일치할 수 있는 식별자를 제안하여 잘못된 식별자 SQL 오류에 대한 오류 메시지를 개선합니다.

  • session.table 을 사용하여 Snowflake 테이블에서 DataFrame 을 생성할 때 발행되는 설명 쿼리 수를 줄였습니다.

  • DataFrameAnalyticsFunctions.time_series_agg() 의 성능 및 정확도가 개선되었습니다.

버그 수정 사항

  • 피벗 열과 집계 열이 동일한 경우 DataFrame.group_by().pivot().agg 의 버그를 수정했습니다.

  • DataFrameReader.dbapi (PrPr)에서 create_connection 이 지원되지 않는 드라이버 유형의 연결 오브젝트를 반환할 때 TypeError 가 발생하던 버그를 수정했습니다.

  • df.limit(0) 호출이 올바르게 적용되지 않는 버그를 수정했습니다.

  • 추가 모드를 사용할 때 예약된 이름이 오류를 throw하는 버그가 DataFrameWriter.save_as_table 에서 수정되었습니다.

사용 중단

  • Python3.8에 대한 지원이 중단되었습니다.

  • DataFrameAnalyticsFunctions.time_series_agg() 에서 sliding_interval 인자가 더 이상 사용되지 않습니다.

Snowpark 로컬 테스트 업데이트

새로운 기능

  • Window.range_between 에 간격 식에 대한 지원이 추가되었습니다.

  • array_construct 함수에 대한 지원이 추가되었습니다.

버그 수정 사항

  • 가져오기를 통해 저장 프로시저를 실행하는 동안 일시적인 __pycache__ 디렉터리가 실수로 복사되는 로컬 테스트의 버그가 수정되었습니다.

  • Column.like 호출에 대해 잘못된 결과를 생성하는 로컬 테스트의 버그를 수정했습니다.

  • 로컬 테스트에서 Column.getItemsnowpark.snowflake.functions.getnull 을 반환하지 않고 IndexError 를 발생시키는 버그를 수정했습니다.

  • 로컬 테스트에서 df.limit(0) 호출이 올바르게 적용되지 않는 버그가 수정되었습니다.

  • 로컬 테스트에서 빈 테이블에 Table.merge 를 입력하면 예외가 발생하던 버그가 수정되었습니다.

Snowpark pandas API 업데이트

종속성 업데이트

  • modin 을 0.30.1에서 0.32.0으로 업데이트했습니다.

  • numpy 2.0 이상에 대한 지원이 추가되었습니다.

새로운 기능

  • DataFrame.create_or_replace_viewSeries.create_or_replace_view 에 대한 지원이 추가되었습니다.

  • DataFrame.create_or_replace_dynamic_tableSeries.create_or_replace_dynamic_table 에 대한 지원이 추가되었습니다.

  • DataFrame.to_viewSeries.to_view 에 대한 지원이 추가되었습니다.

  • DataFrame.to_dynamic_tableSeries.to_dynamic_table 에 대한 지원이 추가되었습니다.

  • max, mean, median, min, sum 에 대한 DataFrame.groupby.resample 지원이 추가되었습니다.

  • 다음을 사용하여 스테이징된 파일 읽기 지원이 추가되었습니다.

    • pd.read_excel

    • pd.read_html

    • pd.read_pickle

    • pd.read_sas

    • pd.read_xml

  • DataFrame.to_icebergSeries.to_iceberg 에 대한 지원이 추가되었습니다.

  • Series.str.len 에서 딕셔너리 값에 대한 지원이 추가되었습니다.

개선 사항

  • 비용이 많이 드는 피벗 단계를 피하여 DataFrame.groupby.applySeries.groupby.apply 의 성능을 개선합니다.

  • 더 나은 엔진 변환을 위해 행 수 상한에 대한 추정치를 OrderedDataFrame 에 추가했습니다. 이로 인해 잠재적으로 쿼리 수가 증가할 수 있습니다.

  • enforce_ordering 에서 relaxed_ordering 매개 변수의 이름을 pd.read_snowflake 로 변경했습니다. 또한 새로운 기본값은 enforce_ordering=False 로, 이전 기본값인 relaxed_ordering=False 와 반대 효과를 갖습니다.

버그 수정 사항

  • Iceberg 테이블 및 pd.read_snowflake 를 읽을 때 enforce_ordering=True 의 버그를 수정했습니다.

버전 1.30.0(2025-03-27)

새로운 기능

  • relaxed_ordering 매개 변수를 도입하여 Dataframe.to_snowpark_pandas 에서 완화된 일관성 및 주문 보증을 지원합니다.

  • DataFrameReader.dbapi (미리 보기)는 이제 session_init_statement 매개 변수에 대한 문자열 목록을 허용하여 세션 초기화 중에 여러 개의 SQL 문을 실행할 수 있습니다.

개선 사항

  • Dataframe.stat.sample_byfractions 에서 각 키에 대해 UNION ALL 하위 쿼리를 생성하는 기존 방식에 비해 대규모 fractions 사전과 잘 어울리는 단일 플랫 쿼리를 생성하도록 쿼리 생성을 개선했습니다. 이 기능을 활성화하려면 session.conf.set("use_simplified_query_generation", True) 를 설정합니다.

  • Parquet 파일을 테이블에 복사본으로 복사할 때 벡터화 옵션을 활성화하여 DataFrameReader.dbapi 의 성능을 개선했습니다.

  • DataFrame.random_split 에 대한 쿼리 생성이 다음과 같은 방식으로 개선되었습니다. session.conf.set("use_simplified_query_generation", True) 를 설정하여 활성화할 수 있습니다.

    • 입력 데이터프레임의 내부 구현에서 cache_result 를 제거하여 순수한 지연 데이터프레임 작업을 수행할 필요가 없어졌습니다.

    • 이제 seed 인자는 여러 호출과 세션에서 반복 가능한 결과를 제공하는 예상대로 작동합니다.

  • DataFrame.fillnaDataFrame.replace 는 이제 include_decimalTrue 로 설정된 경우 intfloatDecimal 열에 맞추는 기능을 지원합니다.

  • 다음 UDF 및 files.py 의 저장 프로시저 함수에 대한 설명서를 일반 공급에 따라 추가했습니다.

    • SnowflakeFile.write

    • SnowflakeFile.writelines

    • SnowflakeFile.writeable

  • SnowflakeFileSnowflakeFile.open() 에 대한 설명서가 일부 변경되었습니다.

버그 수정 사항

  • 오류를 발생시키는 다음 함수의 버그를 수정했습니다. .cast() 가 출력에 적용됩니다.

    • from_json

    • size

Snowpark 로컬 테스트 업데이트

버그 수정 사항

  • 집계에서 빈 그룹이 여전히 행을 생성하는 버그를 수정했습니다.

  • Dataframe.except_ 에서 행이 잘못 삭제되는 버그를 수정했습니다.

  • 필터링된 열을 형 변환할 때 to_timestamp 가 실패하는 버그를 수정했습니다.

Snowpark pandas API 업데이트

새로운 기능

  • Series.str.__getitem__ (Series.str[...]) 에서 목록 값에 대한 지원을 추가했습니다.

  • GROUP BY 작업에서 pd.Grouper 오브젝트에 대한 지원이 추가되었습니다. freq 가 지정되면 sort, closed, label, convention 인자의 기본값이 지원되며, origin 이 지정되면 start 또는 start_day 가 지원됩니다.

  • 새로운 매개 변수 relaxed_ordering 을 도입하여 명명된 데이터 원본(예: 테이블 및 뷰)과 쿼리 데이터 원본 모두에 대해 pd.read_snowflake 에서 완화된 일관성 및 순서 보장에 대한 지원이 추가되었습니다.

개선 사항

  • QUOTED_IDENTIFIERS_IGNORE_CASE 가 설정된 것으로 확인될 때마다 경고를 표시하고 사용자에게 설정을 해제하도록 요청합니다.

  • DataFrame.to_snowflakeSeries.to_snowflake 에서 누락된 index_labelindex=True 에서 처리되는 방식을 개선했습니다. 대 ValueError 가 발생하는 대신, 시스템 정의 레이블이 인덱스 열에 사용됩니다.

  • 함수 이름이 지원되지 않는 경우 groupby, DataFrame, Series.agg 에 대한 오류 메시지가 개선되었습니다.

Snowpark 로컬 테스트 업데이트

개선 사항

  • QUOTED_IDENTIFIERS_IGNORE_CASE 가 설정된 것으로 확인될 때마다 경고를 표시하고 사용자에게 설정을 해제하도록 요청합니다.

  • DataFrame.to_snowflakeSeries.to_snowflake 에서 누락된 index_labelindex=True 에서 처리되는 방식을 개선했습니다. 대 ValueError 가 발생하는 대신, 시스템 정의 레이블이 인덱스 열에 사용됩니다.

  • 함수 이름이 지원되지 않는 경우 groupby or DataFrame or Series.agg 에 대한 오류 메시지가 개선되었습니다.

버전 1.29.1(2025-03-12)

버그 수정 사항

  • 저장 프로시저 및 Snowbooks에서 사용할 수 없는 DataFrameReader.dbapi (비공개 미리 보기)의 버그가 수정되었습니다.

버전 1.29.0(2025-03-05)

새로운 기능

  • functions.py (비공개 미리 보기)에서 다음 AI 기반 함수에 대한 지원이 추가되었습니다.

    • ai_filter

    • ai_agg

    • summarize_agg

  • 새로운 FILE SQL 유형에 대한 지원이 추가되었으며 functions.py (비공개 미리 보기)에 다음과 같은 관련 함수가 추가되었습니다.

    • fl_get_content_type

    • fl_get_etag

    • fl_get_file_type

    • fl_get_last_modified

    • fl_get_relative_path

    • fl_get_scoped_file_url

    • fl_get_size

    • fl_get_stage

    • fl_get_stage_file_url

    • fl_is_audio

    • fl_is_compressed

    • fl_is_document

    • fl_is_image

    • fl_is_video

  • 아티팩트 저장소(비공개 미리 보기)를 사용하여 PyPi 에서 서드 파티 패키지를 가져오는 기능이 추가되었습니다.

    • 저장 프로시저 또는 사용자 정의 함수를 등록할 때 키워드 인자 artifact_repositoryartifact_repository_packages 를 사용하여 아티팩트 저장소와 패키지를 각각 지정하십시오.

    • 지원되는 APIs 는 다음과 같습니다.

      • Session.sproc.register

      • Session.udf.register

      • Session.udaf.register

      • Session.udtf.register

      • functions.sproc

      • functions.udf

      • functions.udaf

      • functions.udtf

      • functions.pandas_udf

      • functions.pandas_udtf

개선 사항

  • 저장 프로시저 등록 시 snowflake-snowpark-python 패키지 호환성에 대한 버전 유효성 검사 경고가 개선되었습니다. 이제 메이저 또는 마이너 버전이 일치하지 않는 경우에만 경고가 트리거되며, 버그 수정 버전 차이로 인해 더 이상 경고가 생성되지 않습니다.

  • 이전 버전 외에 cloudpickle==3.0.0 도 지원하도록 클라우드피클 종속성을 변경했습니다.

버그 수정 사항

  • 스레드 안전 세션이 비활성화된 경우 많은 수의 값이 있는 데이터프레임을 생성하면 Unsupported feature 'SCOPED_TEMPORARY'. 오류가 발생하는 버그를 수정했습니다.

  • 스테이지 파일을 읽어 DataFrame 을 생성하고 CTE 최적화가 활성화된 경우 df.describe 가 내부 SQL 실행 오류를 발생시키는 버그를 수정했습니다.

  • session.conf.set("use_simplified_query_generation", True) 를 사용하여 간소화된 쿼리 생성이 활성화된 경우 df.order_by(A).select(B).distinct() 가 잘못된 SQL 을 생성하는 버그를 수정했습니다.

    • 기본적으로 단순화된 쿼리 생성을 비활성화합니다.

Snowpark pandas API 업데이트

개선 사항

  • 테이블이 존재하지 않을 때 pd.to_snowflake, DataFrame.to_snowflake, Series.to_snowflake 에 대한 오류 메시지를 개선했습니다.

  • pd.to_snowflake, DataFrame.to_snowflake, Series.to_snowflake 에서 if_exists 매개 변수에 대한 문서 문자열의 가독성을 개선했습니다.

  • UDFs 를 사용하는 모든 Pandas 함수에 대한 오류 메시지와 Snowpark 오브젝트를 개선했습니다.

버그 수정 사항

  • Series.rename_axis 에서 AttributeError 가 발생하던 버그를 수정했습니다.

  • pd.get_dummies 가 기본적으로 NULL/NaN 값을 무시하지 않던 버그를 수정했습니다.

  • pd.get_dummies 를 반복적으로 호출하면 ‘중복된 열 이름 오류’가 발생하는 버그가 수정되었습니다.

  • pd.get_dummies 에서 열 목록을 전달하면 출력 DataFrame 에서 잘못된 열 레이블이 생성되던 버그를 수정했습니다.

  • pd.get_dummies 를 업데이트하여 int 대신 부울 값을 반환합니다.

Snowpark 로컬 테스트 업데이트

새로운 기능

  • range_between 윈도우 함수에 리터럴 값에 대한 지원이 추가되었습니다.

버전 1.28.0(2025-02-20)

새로운 기능

  • functions.py 에서 다음 함수에 대한 지원을 추가했습니다.

    • normal

    • randn

  • Dataframe.union_by_nameDataframe.union_all_by_nameallow_missing_columns 매개 변수에 대한 지원을 추가했습니다.

개선 사항

  • 충돌을 방지하기 위해 무작위 오브젝트 이름 생성을 개선했습니다.

  • Dataframe.distinct 쿼리 생성이 GROUP BY all columns 을 사용하여 SELECT 대신 SELECT DISTINCT 를 생성하도록 개선되었습니다. 이 기능을 비활성화하려면 session.conf.set("use_simplified_query_generation", False) 로 설정하십시오.

사용 중단

  • 사용되지 않는 Snowpark Python 함수 snowflake_cortex_summarize. 사용자는 snowflake-ml-python 을 설치하고 대신 snowflake.cortex.summarize 함수를 사용할 수 있습니다.

  • 사용되지 않는 Snowpark Python 함수 snowflake_cortex_sentiment. 사용자는 snowflake-ml-python 을 설치하고 대신 snowflake.cortex.sentiment 함수를 사용할 수 있습니다.

버그 수정 사항

  • 여러 쿼리를 생성하는 DataFrames 에 대한 스택 추적에 의해 세션 수준 쿼리 태그를 덮어쓰는 버그를 수정했습니다. 이제 쿼리 태그는 session.conf.set("collect_stacktrace_in_query_tag", True) 경우에만 스택트레이스로 설정됩니다.

  • Session._write_pandas 에서 Snowpark Pandas 오브젝트를 작성할 때 use_logical_type 매개 변수를 Session._write_modin_pandas_helper 로 잘못 전달하던 버그를 수정했습니다.

  • 여러 값의 형식이 잘못 지정될 수 있는 SQL 생성 옵션의 버그를 수정했습니다.

  • 데이터베이스 또는 스키마의 빈 문자열이 올바르게 처리되지 않고 잘못된 SQL 문을 생성하는 버그가 Session.catalog 에서 수정되었습니다.

실험적 기능

  • Snowflake 테이블에 파이로우 테이블 쓰기 지원이 추가되었습니다.

Snowpark pandas API 업데이트

새로운 기능

  • Snowflake Cortex 함수 SummarizeSentiment 적용 지원 추가.

  • Series.str.get 에서 목록 값에 대한 지원을 추가했습니다.

버그 수정 사항

  • apply 에서 kwargs가 적용된 함수에 올바르게 전달되지 않던 버그를 수정했습니다.

Snowpark 로컬 테스트 업데이트

새로운 기능

  • 다음 함수에 대한 지원이 추가되었습니다
    • hour

    • minute

  • CSV 리더에 NULL_IF 매개 변수에 대한 지원이 추가되었습니다.

  • CSVs 로딩 시 date_format, datetime_format, timestamp_format 옵션에 대한 지원이 추가되었습니다.

버그 수정 사항

  • DataFrame.join 에서 열에 잘못된 입력이 발생하는 버그가 수정되었습니다.

  • otherwise 절에서 잘못된 결과를 유발하는 when 문의 버그를 수정했습니다.

버전 1.27.0(2025-02-05)

새로운 기능

functions.py 에서 다음 함수에 대한 지원을 추가했습니다.

  • array_reverse

  • divnull

  • map_cat

  • map_contains_key

  • map_keys

  • nullifzero

  • snowflake_cortex_sentiment

  • acosh

  • asinh

  • atanh

  • bit_length

  • bitmap_bit_position

  • bitmap_bucket_number

  • bitmap_construct_agg

  • cbrt

  • equal_null

  • from_json

  • ifnull

  • localtimestamp

  • max_by

  • min_by

  • nth_value

  • nvl

  • octet_length

  • position

  • regr_avgx

  • regr_avgy

  • regr_count

  • regr_intercept

  • regr_r2

  • regr_slope

  • regr_sxx

  • regr_sxy

  • regr_syy

  • try_to_binary

  • base64

  • base64_decode_string

  • base64_encode

  • editdistance

  • hex

  • hex_encode

  • instr

  • log1p

  • log2

  • log10

  • percentile_approx

  • unbase64

  • DataFrame.create_dataframe 을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.

  • DataFrameWriter.insert_into/insertInto 를 지원하는 기능이 추가되었습니다. 이 방법은 로컬 테스트 모드도 지원합니다.

  • 임시 뷰를 만들기 위한 DataFrame.create_temp_view 지원을 추가했습니다. 뷰가 이미 존재하면 실패합니다.

  • map_catmap_concat 함수에서 여러 열에 대한 지원을 추가했습니다.

  • DataFrame.with_columnDataFrame.with_columns 에서 원래 열 순서를 유지하기 위한 옵션 keep_column_order 를 추가했습니다.

  • StructType 열의 필드 이름을 바꾸거나 필드를 추가할 수 있는 열 캐스트에 옵션을 추가했습니다.

  • contains_null parameter 에 대한 지원을 ArrayType 에 추가했습니다.

  • 스테이지에서 파일을 읽어 만든 DataFrame 에서 DataFrame.create_or_replace_temp_view 를 통해 임시 뷰를 생성하는 기능을 추가했습니다.

  • MapTypevalue_contains_null 매개 변수에 대한 지원을 추가했습니다.

  • 현재 환경이 대화형 환경인지 여부를 나타내는 원격 분석에 대화형 기능을 추가했습니다.

  • Native App에서 session.file.get 이 현재 버전에서 /로 시작하는 파일 경로를 읽을 수 있도록 허용합니다.

  • DataFrame.pivot 이후 여러 집계 함수에 대한 지원을 추가했습니다.

실험적 기능

  • Snowflake 오브젝트를 관리하는 Session.catalog 클래스를 추가했습니다. Session.catalog 를 통해 액세스할 수 있습니다.

    • snowflake.core 는 이 기능에 필요한 종속성입니다.

  • 스테이지에서 JSON 파일을 읽을 때 사용자 입력 스키마 또는 사용자 입력 스키마를 허용합니다.

  • DataFrame.create_dataframe 을 호출할 때 스키마 문자열(암시적 구조체 구문 포함) 지정에 대한 지원을 추가했습니다.

개선 사항

  • cosign 을 사용하여 패키지 서명을 확인하는 방법에 대한 지침을 포함하도록 README.md 를 업데이트했습니다.

버그 수정 사항

  • 로컬 테스트 모드에서 열에 0이 포함되어야 하는데 None이 포함되는 버그를 수정했습니다.

  • StructField.from_json 에서 tzinfo 를 포함한 TimestampTypes 가 올바르게 구문 분석되지 않는 버그를 수정했습니다.

  • 입력 열이 날짜 유형 또는 타임스탬프 유형일 때 오류를 발생시키는 function date_format 버그를 수정했습니다.

  • Null이 아닌 열에 null 값을 삽입할 수 있는 DataFrame 버그를 수정했습니다.

  • 열 식 오브젝트를 전달할 때 유형 힌트 어설션 오류가 발생하던 replacelit 함수의 버그를 수정했습니다.

  • pandas_udfpandas_udtf 에서 세션 매개 변수가 잘못 무시되던 버그를 수정했습니다.

  • session.call 을 통해 호출되는 시스템 함수에 대해 잘못된 유형 변환 오류가 발생하던 버그를 수정했습니다.

Snowpark pandas API 업데이트

새로운 기능

  • Series.str.ljustSeries.str.rjust 에 대한 지원이 추가되었습니다.

  • Series.str.center 를 지원하는 기능이 추가되었습니다.

  • Series.str.pad 를 지원하는 기능이 추가되었습니다.

  • Snowpark Python 함수 snowflake_cortex_sentiment 적용 지원을 추가했습니다.

  • DataFrame.map 를 지원하는 기능이 추가되었습니다.

  • DataFrame.from_dictDataFrame.from_records 에 대한 지원이 추가되었습니다.

  • 구조체 유형 열에서 대/소문자 혼합 필드 이름에 대한 지원을 추가했습니다.

  • SeriesGroupBy.unique 에 대한 지원을 추가했습니다.

  • 다음 지시문을 사용하여 Series.dt.strftime 에 대한 지원을 추가했습니다.

    • %d: 앞에 0을 붙인 10진수 숫자로 표시되는 월의 날짜입니다.

    • %m: 앞에 0을 붙인 10진수 숫자로 표시되는 월입니다.

    • %Y: 세기가 10진수 숫자로 표시되는 연도입니다.

    • %H: 앞에 0을 붙인 10진수 숫자로 표시되는 시간(24시간 시계)입니다.

    • %M: 앞에 0을 붙인 10진수 숫자로 표시되는 분입니다.

    • %S: 앞에 0을 붙인 10진수 숫자로 표시되는 초입니다.

    • %f: 6자리까지 앞에 0을 붙인 10진수 숫자로 표시되는 마이크로초입니다.

    • %j: 앞에 0을 붙인 10진수 숫자로 연중 며칠째인지 표시되는 날입니다.

    • %X: 로캘의 적절한 시간 표현입니다.

    • %%: 리터럴 ‘%’ 문자입니다.

  • Series.between 를 지원하는 기능이 추가되었습니다.

  • DataFrameGroupBy.apply 에서 include_groups=False 에 대한 지원을 추가했습니다.

  • Series.str.split 에서 expand=True 에 대한 지원을 추가했습니다.

  • DataFrame.popSeries.pop 에 대한 지원이 추가되었습니다.

  • DataFrameGroupBy.aggSeriesGroupBy.agg 에서 firstlast 을 위한 지원을 추가했습니다.

  • Index.drop_duplicates 를 지원하는 기능이 추가되었습니다.

  • pd.pivot_table(), DataFrame.pivot_table(), pd.crosstab() 에서 "count", "median", np.median, "skew", "std", np.std "var", np.var 에 대한 집계 지원을 추가했습니다.

개선 사항

  • DataFrame.mapSeries.map 메서드의 성능을 개선하여 가능한 경우 numpy 함수를 Snowpark 함수에 매핑합니다.

  • DataFrame.map 에 대한 설명서를 추가했습니다.

  • 가능한 경우 numpy 함수를 Snowpark 함수에 매핑하여 DataFrame.apply 의 성능을 개선했습니다.

  • Snowpark pandas와 scikit-learn의 상호 운용성 범위에 대한 설명서를 추가했습니다.

  • 유형 힌트가 제공되지 않은 경우 Series.map, Series.applyDataFrame.map 에서 함수의 반환 유형을 유추합니다.

  • 교환 프로토콜 호출을 포함한 메서드 호출을 계산하는 원격 분석에 call_count 를 추가했습니다.