2024년도 성능 개선 사항

중요

성능 개선은 종종 특정 쿼리 패턴 또는 워크로드를 대상으로 합니다. 이러한 개선 사항은 특정 워크로드에 중대한 영향을 미칠 수도 있고 그렇지 않을 수도 있습니다.

2024년에 도입된 성능 개선 사항은 다음과 같습니다.

출시일

설명

영향

2024년 10월

메타데이터 복제가 개선되었습니다.

서버리스 컴퓨팅 할당을 최적화하여 복제 새로 고침의 SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA 및 SECONDARY_DOWNLOADING_METADATA 단계에 소요되는 시간을 단축합니다. 이 개선 사항은 더 큰 메타데이터 크기로 새로 고침하는 것을 목표로 합니다.

2024년 9월

병렬화를 통해 복제 작업이 개선되었습니다.

특히 광범위한 메타데이터가 있는 데이터베이스와 스키마의 경우 오브젝트를 복제하는 데 걸리는 시간을 줄여줍니다.

2024년 9월

병렬화를 통해 복제 새로 고침이 향상되었습니다.

대량의 데이터를 복제할 때 전반적인 새로 고침 시간이 줄어듭니다.

2024년 8월

LIMIT 쿼리 성능이 개선되었습니다.

LIMIT 절을 사용하여 테이블에서 n 개 행을 반환하는 쿼리의 컴파일 및 실행 시간을 단축합니다. 이 최적화는 스캔하는 파티션을 축소하여 처음 n 개 행만 포함하도록 합니다.

2024년 7월

복제를 위한 테이블 열 동기화가 개선되었습니다.

테이블 열에 대한 새로 고침 작업의 SECONDARY_DOWNLOADING_METADATA 단계에서 소요되는 시간을 줄입니다.

2024년 7월

가상 웨어하우스에서 사용할 수 있는 컴퓨팅 리소스와 비교했을 때, 소량의 마이크로 파티션만 스캔하는 쿼리의 경우 웨어하우스 활용도가 향상됩니다.

BI 및 대시보드 사용 사례에서 흔히 볼 수 있는 소수의 마이크로 파티션에서 데이터를 스캔할 때 비용이 많이 드는 작업이 포함된 쿼리를 더 빠르게 실행할 수 있습니다.

2024년 7월

다음 쿼리 처리 개선됨:

  • LIMIT 절을 ANY_VALUE 함수 이외의 집계를 포함하지 않는 집계 노드로 푸시 다운합니다.

  • 유효성 검사에 의해 PRIMARY KEY 또는 UNIQUE 제약 조건이 적용되거나 RELY 제약 조건 속성이 사용될 때 중복 그룹화 키를 제거합니다.

LIMIT 절과 GROUP BY 문이 포함된 일부 쿼리의 실행 속도가 빨라집니다.

2024년 6월

단일 지침, 다중 데이터(SIMD) 처리가 개선되었습니다.

  • NULL 값이 포함된 열에 액세스하는 쿼리의 쿼리 실행 시간을 단축하고 스캔 성능을 개선합니다.

  • 원격 저장소에서 데이터를 읽을 때 숫자를 더 효율적으로 디코딩하여 더 나은 스캔 성능을 제공합니다.

2024년 5월

자동 클러스터링 의 효율성이 개선되었습니다.

자동 클러스터링은 더 효율적으로 작동하므로 비용이 줄어듭니다.

2024년 5월

오브젝트 복제가 개선되었습니다.

일부 오브젝트의 동기화 및 복제 작업의 권한 부여 메커니즘을 최적화하여 새로 고침 작업의 SECONDARY_UPLOADING_INVENTORY 및 SECONDARY_DOWNLOADING_METADATA 단계에서 소요되는 시간을 단축합니다.

2024년 5월

파일 형식 옵션인 USE_VECTORIZED_SCANNERTRUE 로 설정할 때 대부분의 Parquet 파일 로딩 대기 시간을 최대 50%까지 단축했습니다.

벡터화된 스캐너는 Parquet 파일의 열 형식에 매우 적합하며 선택한 열의 하위 집합과 같이 Parquet 파일의 관련 섹션만 메모리로 다운로드하여 수집 대기 시간을 줄여줍니다.

2024년 5월

집계가 더 많은 중간 조인 트리에서 이루어지도록 집계 평가가 개선되었습니다.

가능한 한 가장 빠른 시점에 처리해야 하는 데이터 양을 줄임으로써 집계가 포함된 복잡한 쿼리의 쿼리 실행 시간을 단축합니다.

2024년 5월

가상 웨어하우스 노드 간 통신에 상당한 시간을 소모하는 쿼리의 쿼리 실행 시간이 개선되었습니다.

웨어하우스 내 컴퓨팅 리소스 간 처리량이 증가되었습니다. 각 웨어하우스는 컴퓨팅 리소스의 클러스터입니다.

2024년 5월

LIMIT 및 ORDER BY 쿼리에 대한 상위 k 정리가 개선되었습니다.

검사되는 파일과 파일 헤더 읽기가 줄어들어 상위 k 쿼리의 실행 시간이 감소되었습니다. 기존 상위 k 개선 사항을 확장하여 ORDER BY 열에서 STRING/BINARY 지원이 포함됩니다. 값 도메인을 기준으로 가장 큰/가장 작은 파일 순서대로 스캔 세트를 정렬하여 정리 효율성이 더욱 개선되었습니다.

2024년 5월

선택도 추정치를 더 세밀하게 계산하여 조인 순서 결정을 개선했습니다.

마이크로 파티션 수준에서 선택도 추정치를 계산하여 컴파일 시간 및 쿼리 실행 시간이 단축되었습니다.

2024년 5월

Python 로딩 시간이 더 빨라졌습니다.

Streamlit in Snowflake 앱(Snowflake Native App 내의 Streamlit 앱 포함), Python 워크시트, Python UDFs 및 Python의 저장 프로시저의 성능이 개선되었습니다.

2024년 4월

잠금/뮤텍스 경합이 감소했습니다.

웨어하우스에서 실행되는 동시 접속자가 많은 쿼리와 같은 다양한 시나리오에서 스캔 성능을 개선하여 쿼리 실행 시간이 단축되었습니다.

2024년 4월

브로드캐스트 조인 결정이 개선되었습니다.

오른쪽 깊은 조인 트리와 같은 시나리오에서 브로드캐스트 조인을 최적화하여 쿼리 실행 시간을 줄이고 메모리 관리를 개선합니다.

2024년 4월

Snowsight 쿼리 결과가 더 빨라졌습니다.

Snowsight 에서 실행할 때 쿼리 결과가 표시되는 데 걸리는 시간이 단축되었습니다. 10,000개 행을 초과하는 대규모 결과 세트를 반환하는 쿼리에서 가장 눈에 띄게 개선되었습니다.

2024년 3월

메타데이터 복제가 개선되었습니다.

메타데이터의 PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA, SECONDARY_UPLOADING_INVENTORY 단계에 소요되는 시간이 감소되었습니다.

2024년 3월

조인 순서를 최적화하기 위해 선택도 추정치를 보다 정확하게 계산하여 쿼리 성능이 개선되었습니다.

파티션 메타데이터와 조인 필터의 실제 카디널리티가 일치하지 않는 경우 실행 시간이 감소했습니다.

2024년 3월

JSON 파일 로딩 성능이 개선되었습니다.

결과적으로 많은 JSON 로딩 시나리오에서 수집 대기 시간이 최대 25%까지 단축됩니다.

2024년 2월

오브젝트 복제가 개선되었습니다.

스냅샷 작업의 일부와 일부 오브젝트가 복제 인벤토리에 추가되는 방식을 최적화하여 새로 고침 작업의 PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA, SECONDARY_UPLOADING_INVENTORY 단계에서 소요되는 시간이 감소했습니다.

2024년 2월

일부 함수에 추가된 upperlower 데이터 정렬 사양을 지원합니다.

일부 함수에 대해 upperlower 데이터 정렬 사양을 설정할 수 있습니다. 일부 사용 사례에서는 upperlower 데이터 정렬 사양이 ci 사양보다 더 나은 성능을 발휘합니다. 이제 CHARINDEX, CONTAINS, ENDSWITH, POSITION, SPLIT, SPLIT_PART, STARTSWITH 함수에 대해 upperlower 데이터 정렬 사양이 지원됩니다. 자세한 내용은 ci 와 upper / lower 의 차이점 섹션을 참조하십시오.

2024년 1월

LIMIT 0 쿼리의 실행 시간을 개선했습니다.

쿼리 결과에 대한 열 제목과 데이터 타입을 반환하기 위해 애플리케이션에서 자주 사용하는 LIMIT 과 함께 0 의 개수를 사용하는 쿼리의 실행 시간을 줄입니다.

2024년 1월

Azure Government 리전을 제외한 Microsoft Azure 리전의 대형 웨어하우스 (5X-LARGE 및 6X-LARGE)를 일반 공급으로 제공합니다.

소규모 웨어하우스에 비해 메모리 집약적인 쿼리에 더 큰 컴퓨팅 리소스를 사용할 수 있습니다.