리전 간 추론

추론은 머신 러닝 모델을 사용하여 사용자 입력을 기반으로 출력을 얻는 과정입니다. 예를 들어, SNOWFLAKE.CORTEX.COMPLETE 함수를 호출하는 것은 프롬프트를 입력으로 하여 LLM에 추론을 요청하는 것입니다. Snowflake에서는 CORTEX_ENABLED_CROSS_REGION 매개 변수를 사용하여 리전 간 추론 처리를 허용하도록 계정을 구성할 수 있습니다. 이 매개 변수를 사용하면 기본 리전과 다른 리전에서 추론 요청을 처리할 수 있습니다. 리전 간 추론 매개 변수는 Cortex LLM 함수 등 리전 간 추론이 지원되는 모든 Snowflake 기능의 추론 동작을 결정하는 데 사용됩니다.

활성화된 경우, 기본 리전에서 LLM 또는 기능이 지원되지 않는 경우 리전 간 추론이 수행됩니다.

기본적으로, 매개 변수는 DISABLED로 설정됩니다. 이를 통해 기본 리전에서만 요청을 처리할 수 있습니다. ALTER ACCOUNT 명령을 사용하여 리전 간 추론을 허용할 리전을 지정할 수 있습니다.

이 매개 변수에 대한 자세한 내용은 CORTEX_ENABLED_CROSS_REGION 섹션을 참조하십시오.

액세스 제어 요구 사항

이 매개 변수는 계정 수준에서만 설정할 수 있으며, 사용자 또는 세션 수준에서는 설정할 수 없습니다. ACCOUNTADMIN 역할만 ALTER ACCOUNT 명령을 사용하여 매개 변수를 설정할 수 있습니다.

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US';
Copy

이 매개 변수는 ORGADMIN 역할로 설정할 수 없습니다.

리전 간 추론 매개 변수 사용 방법

기본적으로 이 매개 변수는 DISABLED 로 설정되어 있으며, 이는 추론 요청이 기본 리전에서만 처리됨을 의미합니다. 다음 예제에서는 다양한 사용 사례에 대해 리전 간 매개 변수를 설정하는 방법을 보여줍니다.

모든 리전

리전 간 추론 요청을 지원하는 Snowflake 리전 중 하나에서 요청을 처리하도록 허용하려면 매개 변수를 'ANY_REGION' 로 설정하십시오.

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'ANY_REGION';
Copy

기본 리전만

기본 리전에서만 추론 요청을 처리하려면 이 매개 변수를 'DISABLED' 로 설정합니다.

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'DISABLED';
Copy

리전 지정

지정된 리전에서만 요청을 처리하도록 허용하려면 이 매개 변수를 쉼표로 구분하여 리전으로 설정합니다. 전체 리전 목록은 CORTEX_ENABLED_CROSS_REGION 섹션을 참조하십시오.

다음 예제에서는 추론 요청을 처리할 AWS_USAWS_EU 리전을 지정합니다.

ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'AWS_US,AWS_EU';
Copy

비용 고려 사항

  • LLM 사용에 대한 크레딧은 Snowflake 서비스 사용 테이블 에 표시된 대로 청구됩니다. 크레딧은 요청 리전에서 사용된 것으로 간주됩니다. 예를 들어, us-east-2 리전에서 LLM 함수를 호출하고 요청이 us-west-2 리전에서 처리되면 해당 크레딧은 us-east-2 리전에서 소비된 것으로 간주됩니다.

  • 리전 간 추론을 사용하는 경우 데이터 송신 비용이 부과되지 않습니다.

고려 사항

  • 리전 간 지연 시간은 클라우드 공급자 인프라와 네트워크 상태에 따라 달라집니다. Snowflake는 리전 간 추론을 활성화하여 특정 사용 사례를 테스트할 것을 권장합니다.

  • 리전 간 추론은 미국 SnowGov 리전 에서는 지원되지 않습니다. 즉, SnowGov 리전의 내부 또는 외부로 리전 간 추론을 요청할 수 없습니다.

  • GCP 또는 Azure 리전에서 이 설정을 사용하여 해당 리전에서 지원되지 않는 기능에 대한 추론을 요청할 수 있습니다.

  • 사용자 입력, 서비스에서 생성된 프롬프트 및 출력은 리전 간 추론 중에 저장되거나 캐시되지 않습니다.

  • 추론 요청에 필요한 데이터는 다음과 같이 리전 간에 이동합니다.

    • 소스 리전과 대상 리전이 모두 AWS에 위치한 경우, 데이터는 AWS 전역 네트워크 내에 유지됩니다. 데이터 센터와 리전을 상호 연결하는 AWS 전역 네트워크를 통해 이동하는 모든 데이터는 물리적 계층에서 자동으로 암호화됩니다.

    • 리전들이 서로 다른 클라우드 공급자에 위치하는 경우, 데이터는 상호 전송 계층 보안(mTLS)을 사용하여 공용 인터넷을 통과합니다.

다음 단계

  • 리전 간 추론 매개 변수에 대한 자세한 내용은 SQL 매개 변수 참조의 CORTEX_ENABLED_CROSS_REGION 섹션을 참조하십시오.