Snowflake Data Clean Rooms: 외부 데이터 커넥터 문제 해결¶
이 항목에서는 외부 데이터 오류를 해결하는 방법을 설명합니다. 이는 Amazon Web Services, Microsoft Azure, Google Cloud에 적용됩니다.
외부 데이터 오류를 해결하기 위한 단계¶
URL/URI 경로가 정확한지 확인합니다. 올바른 URL/URI는 관련 항목을 참조하십시오.
버킷이나 Blob 저장소에 최소한 하나의 파일이 있는지 확인합니다.
파일이 Parquet 형식인지 확인합니다.
파켓 파일이 비어 있지 않은지 확인합니다.
Snappy 포맷을 사용하여 Parquet 파일이 압축되지 않았는지 확인합니다.
위의 방법으로도 문제가 해결되지 않으면 다음 스크립트로 디버그합니다.
USE ROLE SAMOOHA_APP_ROLE; USE DATABASE SAMOOHA_BY_SNOWFLAKE_LOCAL_DB; USE SCHEMA PUBLIC; /* Query the stage name from the connector configuration. Use AWS_CONNECTOR_ID for AWS, GCP_CONNECTOR_ID for GCP and AZURE_CONNECTOR_ID for Azure. For example, if you are connecting to AWS, enter: SELECT CONFIGURATION_ID, PARSE_JSON(CONFIGURATION) FROM SAMOOHA_BY_SNOWFLAKE_LOCAL_DB.PUBLIC.CONNECTOR_CONFIGURATION WHERE CONNECTOR_ID = 'AWS_CONNECTOR_ID'; /* Note that the rest of this script relies on the output of this query so you must save the output for use in the rest of the steps. Next, check the storage integration. Replace <CONFIGURATION_ID> from the output of the query. */ DESC STORAGE INTEGRATION SAMOOHA_STORAGE_INT_<CONFIGURATION_ID>; /* List files in the stage. Replace <STAGE_NAME> from the output of the query. */ LIST @<STAGE_NAME>; /* Check if you are able to query the files in the external stage. Replace <STAGE_NAME> from the output of the query. */ SELECT * FROM @<STAGE_NAME> LIMIT 10; /* Check if you are able to infer the schema from the files in the external stage. Replace <STAGE_NAME> from the output of the query. */ SELECT ARRAY_AGG(OBJECT_CONSTRUCT(*)) WITHIN GROUP (ORDER BY order_id) FROM TABLE( INFER_SCHEMA( LOCATION=>'@<STAGE_NAME>', FILE_FORMAT=>'SAMOOHA_BY_SNOWFLAKE_LOCAL_DB.PUBLIC.PAR_FF' ) ); /* Try to create a table from the external stage. Replace <STAGE_NAME> from the output of the query. */ CALL SAMOOHA_BY_SNOWFLAKE_LOCAL_DB.LIBRARY.CREATE_TABLE_FROM_STAGE('<STAGE_NAME>', 'EXT_INT_TEMP_TABLE'); /* Check data in the table. */ SELECT * FROM SAMOOHA_BY_SNOWFLAKE_LOCAL_DB.PUBLIC.EXT_INT_TEMP_TABLE LIMIT 10;