AWS PrivateLink 및 Snowflake Open Catalog¶
이 항목에서는 AWS PrivateLink를 구성하여 인바운드 비공개 연결을 사용하여 Snowflake Open Catalog 계정을 쿼리 엔진에 직접 연결하는 방법에 대해 설명합니다.
전제 조건¶
Snowflake Open Catalog 계정이 AWS에서 호스팅됩니다.
Open Catalog 계정에 대해 비공개 연결 URL을 사용하여 AWS DNS 서비스를 구성하는 데 필요한 권한이 있습니다. 지침은 Snowflake 커뮤니티의 PrivateLink를 통해 Snowflake에 액세스하기 위해 AWS DNS 서비스(Route 53)를 구성하는 방법 섹션을 참조하세요.
1단계: AWS PrivateLink 활성화¶
이 절차에서는 Open Catalog 계정에 대해 AWS PrivateLink를 활성화합니다. 이 구성으로 쿼리 엔진이 비공개 연결을 통해 Open Catalog에 연결할 수 있습니다. Amazon Web Services(AWS) 계정의 12자리 식별자 및 페더레이션 사용자에 대한 액세스 자격 증명이 포함된 페더레이션 토큰 값이 필요합니다.
페더레이션 토큰 값을 얻으려면 AWS CLI를 사용하여 다음 명령을 실행하고, 값을 텍스트 편집기에 복사합니다.
aws sts get-federation-token --name sam
Snowflake Open Catalog에 로그인합니다.
탐색 메뉴에서 설정을 선택합니다.
승인을 선택합니다.
Private Link 승인 대화 상자에서 계정에 대한 비공개 연결을 활성화합니다.
ID 필드에서 Amazon Web Services(AWS) 계정의 12자리 식별자를 입력합니다.
페더레이션 토큰에는 텍스트 편집기에 복사한 페더레이션 토큰 값을 입력합니다.
저장을 선택합니다.
3단계: Open Catalog 계정 설정 검색¶
나중에 VPC 엔드포인트와 VPC 네트워크를 만들고 구성하는 데 필요한 이러한 설정을 검색합니다.
Snowflake Open Catalog에 로그인합니다.
탐색 메뉴에서 설정을 선택합니다.
설정 페이지에서 다음 설정의 값을 텍스트 편집기에 복사합니다.
PrivateLink 계정 URL
리전 없는 PrivateLink 계정 URL
PrivateLink OCSP URL
리전 없는 PrivateLink OCSP URL
VPCE 서비스 ID
VPC 엔드포인트(VPCE) 생성 및 구성, VPC 네트워크 구성, AWS PrivateLink를 통해 Open Catalog에 연결 시 이러한 값을 붙여넣습니다.
각 설정에 대한 설명은 Snowflake 설명서의 SYSTEM$GET_PRIVATELINK_CONFIG 시스템 함수의 반환 값 섹션을 참조하세요. 이 항목에서 계정 설정의 이름은 JSON 형식입니다.
참고
해당되는 경우, 설명은 Snowflake 계정을 참조하지만, 사용자의 값은 실제로는 Snowflake Open Catalog 계정에 대한 것임을 기억하세요. 예를 들어, privatelink-account-url
은 Snowflake Open Catalog 계정의 URL입니다.
선택 사항: JSON 형식으로 이러한 값을 검색하려면, Open Catalog에 대한 Snowflake CLI 연결 생성 후, SYSTEM$GET_PRIVATELINK_CONFIG 시스템 함수를 호출하세요.
Snowflake 설명서에서
privatelink-vpce-id
는 Open Catalog의 VPCE 서비스 ID에 해당합니다.
4단계: VPC 엔드포인트 생성 및 구성¶
이 절차에서는 AWS VPC 환경에서 해당 VPC 엔드포인트(VPCE)를 생성하고 구성합니다.
참고
이미 Snowflake 계정에 대한 VPC 엔드포인트를 만들었고 계정이 Open Catalog 계정과 동일한 배포에 있는 경우, Open Catalog 계정에 대한 새로운 VPC 엔드포인트를 생성할 필요는 없습니다. 선택적으로 이 단계를 건너뛸 수 있습니다.
지침은 Snowflake 설명서의 VPC 엔드포인트(VPCE) 생성 및 구성 섹션의 2단계부터 참조하세요.
5단계: VPC 네트워크 구성하기¶
VPC 네트워크를 구성하려면, DNS 서비스에서 CNAME 레코드를 생성하여 비공개 연결을 위한 Open Catalog 계정 설정의 적절한 엔드포인트 값을 VPC 엔드포인트의 DNS 이름으로 해석하도록 설정합니다.
지침은 Snowflake 설명서의 VPC 네트워크 구성 섹션을 참조하세요. 이러한 지침은 Snowflake용 지침이므로, 지침에 언급된 일부 기능은 Open Catalog에 적용되지 않습니다. 예를 들어, regionless-snowsight-privatelink-url
은 Snowsight용으로, Open Catalog에서는 지원되지 않습니다.
DNS 구성과 관련한 추가적인 지원이 필요한 경우 내부 AWS 관리자에게 문의하세요.
6단계: AWS PrivateLink를 통해 Open Catalog에 연결¶
서비스 연결을 등록하고 AWS PrivateLink를 통해 쿼리 엔진을 Snowflake Open Catalog에 연결하려면 코드를 사용합니다.
import pyspark from pyspark.sql import SparkSession spark = SparkSession.builder.appName('iceberg_lab') \ .config('spark.jars.packages', 'org.apache.iceberg:iceberg-spark-runtime-3.5_2.12:1.4.1,<maven_coordinate>') \ .config('spark.sql.extensions', 'org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions') \ .config('spark.sql.defaultCatalog', 'opencatalog') \ .config('spark.sql.catalog.opencatalog', 'org.apache.iceberg.spark.SparkCatalog') \ .config('spark.sql.catalog.opencatalog.type', 'rest') \ .config('spark.sql.catalog.opencatalog.uri','https://<open_catalog_privatelink_account_url>/polaris/api/catalog') \ .config('spark.sql.catalog.opencatalog.header.X-Iceberg-Access-Delegation','vended-credentials') \ .config('spark.sql.catalog.opencatalog.credential','<client_id>:<client_secret>') \ .config('spark.sql.catalog.opencatalog.warehouse','<catalog_name>') \ .config('spark.sql.catalog.opencatalog.scope','PRINCIPAL_ROLE:<principal_role_name>') \ .getOrCreate()
매개 변수¶
참고
DNS 서비스를 <open_catalog_account_identifier>
에 대해 지정한 값과 일치하도록 설정했는지 확인합니다.
매개 변수 |
설명 |
---|---|
|
연결할 카탈로그의 이름을 지정합니다. |
|
외부 클라우드 저장소 공급자에 대한 Maven 좌표를 지정합니다.
|
|
서비스 주체가 사용할 클라이언트 ID를 지정합니다. |
|
서비스 주체가 사용할 클라이언트 시크릿을 지정합니다. |
|
URL을 지정해 AWS PrivateLink 또는 Azure Private Link를 사용하여 Snowflake 계정에 연결합니다.
|
|
서비스 주체에게 부여되는 주체 역할을 지정합니다. |
7단계(선택 사항): Snowflake에 대한 카탈로그 통합 생성¶
Snowflake를 사용하여 Open Catalog에서 관리하는 테이블을 쿼리하는 경우, 비공개 IP 주소를 사용하는 Snowflake용 카탈로그를 생성합니다. 이 카탈로그 통합을 생성하려면 Snowflake 계정이 Open Catalog 계정과 동일한 배포에 있어야 합니다.
예를 보려면 Snowflake 설명서의 예시: 비공개 IP 주소를 사용하는 카탈로그 통합<https://docs.snowflake.com/en/user-guide/tables-iceberg-open-catalog-query#example-catalog-integration-that-uses-a-private-ip-address>
_ 섹션을 참조하세요.
참고
Snowflake Open Catalog UI에 대한 비공개 연결을 구성할 수도 있습니다. 이 구성과 Open Catalog 계정에 대한 비공개 연결 구성을 함께 사용하면, 공용 인터넷이 아닌 비공개 연결을 통해 Open Catalog UI에 액세스할 수 있습니다.
이 액세스를 구성하려면 Snowflake Open Catalog UI용 비공개 연결 구성 섹션을 참조하세요.