Snowflake의 모델 추론¶

Snowflake는 두 가지 고유한 컴퓨팅 엔진을 사용합니다.

웨어하우스(SQL 엔진)
Snowpark Container Service

Snowflake Model Registry는 두 엔진 모두에 통합 인터페이스를 제공합니다. 사용 사례에 최적의 환경은 대기 시간, 데이터 타입, 확장 요구 사항에 따라 다릅니다. Snowflake는 추론 워크플로에 대해 다음과 같은 접근 방식을 제공합니다.

실시간 추론(REST API): 대기 시간이 짧은 실시간 사용 사례를 위해 설계되었습니다. 요청은 HTTP를 통해 용이하게 수행되며, 외부 애플리케이션을 구동하는 데 적합합니다.

Snowflake 네이티브 일괄 추론(SQL): Snowflake SQL 생태계와의 통합이 필요한 일괄 워크로드용으로 설계됩니다. 예를 들어 일괄 워크로드는 Dynamic Tables, Snowpark, DBT, User Tasks와 통합할 수 있습니다. SQL 함수를 사용하여 데이터를 이동하거나 외부 인프라를 관리하지 않고도 기존 데이터 파이프라인에 인텔리전스를 직접 포함할 수 있습니다.

작업 기반 일괄 추론: 이 접근 방식은 추론이 독립 실행형 컴퓨팅 스테이지로 처리되는 높은 처리량의 분산 처리를 위해 설계되었습니다. SQL 엔진에서 추론을 분리하여 가격과 성능 모두를 위해 최적화할 수 있습니다. 일괄 추론을 사용하면 대규모 데이터 세트를 처리하거나 복잡한 계산 요구 사항을 탐색하는 데 도움이 될 수 있습니다. 이는 이미지, 비디오, 오디오 등의 파일을 Snowflake 스테이지에서 직접 처리하는 데 적합합니다.

선택 시기¶

다음 테이블을 사용하여 특정 워크로드 요구 사항을 올바른 컴퓨팅 패턴에 맞춥니다.


특징	실시간 추론(SPCS)	네이티브 일괄 추론(SQL)	작업 기반 배치(SPCS)
기본 목표	대화형 응답: 라이브 사용자를 위한 대기 시간이 1초 미만으로 짧은 피드백.	인라인 인텔리전스: SQL데이터 파이프라인에 원활하게 모델 포함.	독립 실행형 처리: 비정형 데이터를 위한 분리된 대규모 컴퓨팅.
적합한 경우	• Web/Mobile app backends. • Real-time user interactions. • High-concurrency request spikes.	• Upstream pipelines (Dynamic Tables, Snowpark). • SQL-first users (Analysts/DEs). • Tools like dbt.	• Processing files (Images, Video, Audio). • Large-scale historical backfills. • Multi-modal data processing.
데이터 원본	HTTP 페이로드를 통해 전달된 작은 입력.	Snowflake 테이블에 있는 데이터.	Snowflake 스테이지에 있는 데이터(파일).
확장성	요청 볼륨을 충족하기 위한 수평적 자동 크기 조정.	가상 웨어하우스를 통한 서버리스 확장.	대량 데이터에 대한 고처리량 분산 처리.
주요 이점	Zero-Ops 복잡성: Snowflake는 컨테이너 오케스트레이션, 수신 및 보안 패치를 자동으로 처리합니다.	제로 인프라: 모델을 네이티브 SQL 함수처럼 취급합니다.	비용 최적화: 고유한 대용량 컴퓨팅 스테이지를 위한 높은 효율성을 제공합니다.