Conector Snowflake para Spark¶
O conector Snowflake para Spark (“conector Spark”) traz o Snowflake para o ecossistema Apache Spark, permitindo que o Spark leia e grave dados do Snowflake. Da perspectiva do Spark, o Snowflake parece similar a outras fontes de dados Spark (PostgreSQL, HDFS, S3, etc.).
Nota
Como alternativa ao uso do Spark, considere escrever seu código para usar Snowpark API em seu lugar. O Snowpark permite realizar todo o seu trabalho dentro do Snowflake (em vez de em um cluster de computação Spark separado). O Snowpark também suporta o pushdown de todas as operações, incluindo UDFs do Snowflake.
O Snowflake é compatível com várias versões do conector Spark:
Spark Connector 2.x: versões 3.2, 3.3 e 3.4 do Spark.
Há uma versão separada do conector Snowflake para cada versão do Spark. Use a versão correta do conector para sua versão do Spark.
Spark Connector 3.x: versões 3.2, 3.3, 3.4 e 3.5 do Spark.
Cada pacote do Spark Connector 3 é compatível com a maioria das versões do Spark.
O conector funciona como um plugin do Spark e é fornecido como um pacote Spark (spark-snowflake
).
Próximos tópicos: