Snowpark를 사용하여 데이터 읽기¶
Snowpark는 데이터가 있는 위치에서 제공됩니다. 데이터가 운영 데이터베이스에 있든, 파일로 제공되든 관계없이 Snowpark는 데이터를 가져와서 DataFrame으로 변환한 후 Snowflake 테이블에 저장하는 Python 우선의 간단한 방법을 제공하므로 컨텍스트 전환 없이 모델링, 변환 및 분석을 계속 수행할 수 있습니다.
Snowpark Python DB-API를 사용하여 외부 데이터 소스에서 데이터 읽기¶
표준 Python DB-API 2.0 드라이버를 사용하여 데이터를 외부 데이터베이스(SQL Server, Oracle, PostgreSQL, MySQL, Databricks)에서 Snowpark DataFrame으로 직접 가져옵니다. Snowpark Python DB-API는 클라이언트(“로컬” 모드)에서 실행하거나 저장 프로시저 또는 노트북(외부 액세스 통합 사용)을 사용하여 Snowflake 내부에서 실행할 수 있습니다. 결과는 Snowflake 테이블을 조인, 변환, 작성하는 데 사용할 수 있는 다른 DataFrame와 마찬가지로 동작합니다. 자세한 내용은 Using the Snowpark Python DB-API 섹션을 참조하십시오.
Snowpark XML RowTag Reader를 사용하여 XML 파일에서 데이터 읽기¶
Snowpark XML을 사용하여 대규모 스테이징 XML 파일을 효율적으로 읽습니다. Reader는 rowTag`에서 파일을 분할하고, 각 일치 항목을 하나의 행으로 로드하고, 하위 요소를 :code:`VARIANT 열에 매핑하여(중첩 구조가 유지됨) Snowpark 또는 SQL로 즉시 쿼리할 수 있습니다. PERMISSIVE`(:code:`_corrupt_record`에서 유효하지 않은 행 격리) 또는 :code:`FAILFAST 동작을 사용하여 XSD에 대해 각 행을 유효성 검사할 수도 있습니다. 출력은 변환하여 테이블로 저장할 수 있는 표준 DataFrame입니다. 자세한 내용은 Snowpark XML RowTag Reader 사용하기 섹션을 참조하십시오.