Usando o Snowpark para ler dados¶
Se os seus dados estão em bancos de dados operacionais ou chegam como arquivos, o Snowpark oferece uma maneira simples, com foco em Python, para importá-los, convertê-los em DataFrame e visualizá-los em tabelas do Snowflake, para que você possa modelar, transformar e analisar sem alternar o contexto.
Leitura de dados de fontes externas usando o Snowpark Python DB-API¶
Use os drivers 2.0 padrão da Python DB-API para extrair dados de bancos de dados externos (SQL Server, Oracle, PostgreSQL, MySQL, Databricks) diretamente para um DataFrame do Snowpark. A Snowpark Python DB-API pode ser executada do seu cliente (modo local) ou dentro do Snowflake usando procedimentos armazenados ou notebooks (com integração de acesso externo). O resultado se comporta como qualquer outro DataFrame que você pode usar para unir, transformar e gravar em tabelas do Snowflake. Para obter mais informações, consulte Utilização do Snowpark Python DB-API.
Lendo os dados de fontes externas por meio do Snowpark Python JDBC¶
Use os drivers JDBC padrão fornecidos por você para extrair dados de bancos de dados externos diretamente para um DataFrame do Snowpark. O Snowpark Python JDBC pode ser executado do seu cliente ou dentro do Snowflake usando procedimentos armazenados ou notebooks. Uma UDTF é criada para ingerir os dados de destino. O comportamento resultante é o mesmo de qualquer outro DataFrame que você pode usar para unir, transformar e gravar em tabelas do Snowflake. Para obter mais informações, consulyte Usando o Snowpark Python JDBC.
Nota
Para usar esse recurso, carregue o driver JDBC em uma área de preparação, configure uma integração de acesso externo e garanta que o Snowflake possa acessar o ponto de extremidade de origem.
Leitura de dados de arquivos XML usando o Snowpark XML RowTag Reader¶
Use o Snowpark XML para ler arquivos XML grandes e preparados de modo eficiente: o leitor divide o arquivo em rowTag, carrega cada correspondência como uma linha e mapeia os elementos filhos em colunas VARIANT (preservando a estrutura aninhada) para consulta imediata com o Snowpark ou SQL. Você também pode validar cada linha em relação a um XSD com comportamento PERMISSIVE (colocar linhas inválidas em quarentena em _corrupt_record) ou FAILFAST. A saída é um DataFrame padrão que você pode transformar e salvar em tabelas. Para obter mais informações, consulte Using the Snowpark XML RowTag Reader.