Notas de lançamento de Snowpark Connect for Spark para 2025

Snowflake usa controle de versão semântico para atualizações de Snowpark Connect for Spark.

Para ver a documentação, consulte Execução de cargas de trabalho do Apache Spark™ no Snowflake com Snowpark Connect for Spark e Execução de cargas de trabalho em lote do Spark de Snowpark Submit.

Versão 1.7.0 (18 de dezembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Suporte adicionado para tipos integrais do Spark.

  • Suporte adicionado para Scala 2.13.

  • Suporte incluído para estouro de tipos integrais por trás da configuração snowpark.connect.handleIntegralOverflow.

  • Configuração adicionada para usar arquivos JAR personalizados em UDFs.

  • Suporte a UDFs do Scala se UDFPacket não tem metadados de tipos de entrada.

  • Permissão de classes case como tipos de entrada e saída na função reduce.

Correções de bugs

  • Correção do tratamento dos tipos lógicos Parquet (TIMESTAMP, DATE, DECIMAL). Antes, os arquivos Parquet eram lidos usando apenas tipos físicos (como LongType para carimbos de data/hora). Os tipos lógicos agora podem ser interpretados retornando tipos adequados como TimestampType, DateType e DecimalType. Você pode habilitar esse recurso definindo a configuração do Spark snowpark.connect.parquet.useLogicalType como true.

  • Uso do esquema de saída ao converter Row do Spark em Variant.

  • Tratamento de JAVA_HOME vazio.

  • Correção da função from_json para MapType.

  • Suporte da configuração spark.sql.parquet.outputTimestampType para o fuso horário NTZ.

Melhorias

Nenhum.

Snowpark Submit

Novos recursos

  • Suporte adicionado para Scala 2.13.

  • Suporte adicionado para o argumento --files.

Correções de bugs

  • Suporte adicionado para --jars para carga de trabalho pyspark.

  • Correção de bug na autenticação com Snowpark Submit JWT.

Versão 1.6.0 (12 de dezembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Suporte a qualquer tipo de entrada ou de saída nas funções map e flatmap do Scala.

  • Suporte a joinWith.

  • Suporte a qualquer tipo de retorno nas UDFs do Scala.

  • Suporte a registerJavaFunction.

Correções de bugs

  • Correção do problema de inferência de esquemas JSON para leitura de JSON do Scala.

  • Alteração dos tipos de retorno das funções que retornam tipos integrais incorretos.

  • Correção do bug nos campos de atualização com tipo struct.

  • Correção do decodificador de entrada ilimitada.

  • Correção da função struct quando o argumento é unresolved_star.

  • Correção do nome da coluna para UDFs do Scala quando o proto não contém nome de função.

  • Adição de suporte para PATTERN no formato Parquet.

  • Processamento dos modos de gravação error e errorIfExists.

Melhorias

Nenhum.

Versão 1.5.0 (4 de dezembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • O snowflake-connector-python foi incrementado para <4.2.0.

  • Adição de suporte básico para mapa de coluna única e operações flatMap em conjuntos de dados do Scala.

  • Suporte de gravação em Iceberg para TargetFileSize e PartitionBy.

Correções de bugs

  • Tornar a inicialização do servidor SAS síncrona.

  • Use snowpark-connect-deps-1==3.56.3.

  • Correção de saveAsTable com colunas input_filename.

  • Remoção da leitura duplicada do cache em UDFs do Scala.

  • Aumento do limite de recursão.

  • Correção de format_number.

  • Correção do esquema de inferência quando a consulta é fornecida como leitura JDBC.

  • Bloqueio da operação dict somente em cache.py para melhorar o desempenho.

  • Correção de testes de dados agrupados.

  • Emissão de erros mais detalhados nas operações de tabela e de leitura/gravação.

Melhorias

Nenhum.

Versão 1.4.0 (25 de novembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Introdução da função «reduzir» para o Scala.

Melhorias

Nenhum.

Correções de bugs

  • Correção da falha na inserção de matriz para elementos que permitem valores nulos.

  • Emissão do erro correto em argumentos não numéricos na covariância.

Versão 1.3.0 (19 de novembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Suporte a filter em um Dataset simples (coluna única).

  • Suporte para análise de URL de esquema do Azure e nome de arquivo de caracteres especiais.

Correções de bugs

  • Correção do erro «Dataframe has no attribute dataframe» na API de catálogo do Scala.

  • Correção de aliases em subconsulta; subconsultas de documentos que não funcionavam.

  • Correção da resolução plan_id após junções.

  • Correção do meta.yaml para versões multi-py.

  • Habilitação de use_vectorized_scanner como tipo de mapa do arquivo parquet que causava erro.

  • CSV para leitura do tipo de dados de especificação da opção inferSchema.

  • Correção do processamento da função substr de comprimento negativo.

  • Uso dos formatos de arquivos em cache no read_parquet.

  • Melhoria no desempenho da relação local.

  • Geração de resumo de _common_metadata para arquivos parquet.

  • Remoção de setSchema, setRole etc. repetitivos para pushdown do Snowflake.

Melhorias

Nenhum.

Versão 1.2.0 (17 de novembro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Flexibilização dos requisitos de versão para grpcio e aiobotocore.

Melhorias

  • Especificação de versão de dependências no meta.yaml.

  • Criação de pacote conda compilado e específico da arquitetura.

  • Garantia de que todos os CloudPickleSerializer.loads não são feitos no TCM.

  • Inclusão de testes SQL OSS que começam com a cláusula WITH.

  • Não carregar jars do Spark durante a execução do servidor para pyt.

  • Atualização da contagem de consultas internas.

Correções de bugs

  • Correção de testes para tcm.

  • Correção da discrepância de nomes de coluna CSV do Spark.

  • Uso do tipo cache para quadros vazios.

  • Resolução de problemas gerais do executor Windows OSS.

Envio do Snowpark

Melhorias

  • Geração de nomes de carga de trabalho exclusivos.

Correções de bugs

  • Corrigida a leitura de arquivos preparados.

Versão 1.0.1 (3 de novembro de 2025)

Nota

Com o lançamento desta versão, a versão 0.24 e as versões anteriores estão obsoletas.

Snowpark Connect for Spark

Novos recursos

  • Adicionar parâmetro para estratégias de criação de exibição.

  • Suporte a intervalo de ano e mês <-> com cadeia de caracteres.

  • Suporte a várias colunas dinâmicas e aliases para valores dinâmicos no Spark SQL.

  • Integração de span e rastreamentos de OpenTelemetry.

Melhorias

Nenhum.

Correções de bugs

  • Adição de uma barra final ao comando de remoção.

  • Problema de GROUP BY inválido com função de agregação e funções nilary.

  • Notebook excede o tamanho máximo de mensagem gRPC.

  • Corrigida a criação de exibição temporária com nomes conflitantes.

  • array_size com argumento nulo.

  • Correção do acesso à matriz JSON $.0 na função get_json_object.

  • Correção das junções automáticas ANTI e SEMI LEFT.

  • Processamento de tipos diferentes no intervalo de funções SQL.

  • Descrição da exibição temporária corrigida.

Versão 1.0.0 (28 de outubro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Adição de rowToInferSchema para leitura de CSV.

  • Suporte a INSERT INTO com o comando CTE SQL.

  • Alterações de E/S para adicionar geração de arquivos e filtragem de arquivos de metadados _SUCCESS.

  • update(submit): Suporte à instalação do Snowpark Connect for Spark no contêiner do cliente Snowpark Submit.

Melhorias

Nenhum.

Correções de bugs

  • Correção da atualização de caminho _SUCCESS.

  • Lançamento de um erro na atualização de falha de remoção.

  • Função de sequência com suporte para entradas de tipos integrais.

  • Correção de tipos em CreateTempViewUsing vazio.

  • Correção do reparticionamento de arquivo Parquet na gravação.

  • Resolução correta de aliases na cláusula ORDER BY.

  • Remoção do parâmetro de sessão temporário de escopo.

  • Correção de várias junções automáticas com a condição de junção.

  • Correção da resolução de nomes de colunas em tabelas dinâmicas.

  • O analisador SQL reconhece o fuso horário da sessão.

  • Coerção do tipo de intervalo com outros tipos.

  • Correção do aninhamento de CTEs.

  • Melhoria na resolução de nomes qualificados no Spark.

Versão 0.33.0 (10 de outubro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Adição de script para execução na saída da ação Git para mesclagem de SQLs.

  • Adição do parâmetro --rebuild-whl ao executor de teste do notebook.

  • Suporte incluído para ambos os qualificadores após a junção.

Melhorias

Nenhum.

Correções de bugs

  • Suporte ao parâmetro de escape em comandos SQL LIKE.

  • Bug de substituição em partições.

  • Validação da contagem de colunas em INSERT.

  • Incompatibilidade do pow com NAN.

  • JOIN cruzado com condição.

  • Lógica de atribuição de colunas em consultas aninhadas.

  • Atualização da mensagem de erro do teste de intervalo.

  • Coerção do tipo de cadeia de caracteres na operação do conjunto UNION e EXCEPT, coerção de NUMERIC, DATE, DATETIME para STRING.

  • Resolução correta das colunas do Snowpark após uma JOIN automática externa completa.

  • Expressão na função de agregação pode ser sem melhoria.

  • Atualização: reversão de «[SCOS GA BUG] string type coercion in set opera»

  • A união DataFrame de colunas do tipo decimal agora é ampliada conforme necessário.

  • Coerção do tipo de cadeia de caracteres na operação do conjunto UNION e EXCEPT, coerção de NUMERIC, DATE, DATETIME para STRING (parte 1).

  • Problema de objeto não existente em TCM.

  • Correção de to_binary(x, 'hex') quando x tem um número ímpar de letras e dígitos.

  • Correção de junções com tabelas vazias.

  • Correção da cláusula HAVING para priorizar o agrupamento de colunas sobre os aliases de agregação com o mesmo nome.

Versão 0.32.0 (17 de outubro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Suporte para RepairTable

  • Torne jdk4py uma dependência opcional de Snowpark Connect for Spark para simplificar a configuração da página inicial do Java para usuários finais.

  • Suporte a mais casos de tipo intervalo.

Melhorias

Nenhum.

Correções de bugs

  • Corrigir problemas de Join ao refatorar qualificadores

  • Corrija percentile_cont para permitir expressões de filtro e ordem de classificação.

  • Corrija histogram_numeric UDAF.

  • Corrija a função COUNT quando chamada com vários argumentos.

Versão 0.31.0 (9 de outubro de 2025)

Snowpark Connect for Spark

Novos recursos

  • Adicione suporte para expressões na cláusula GROUP BY quando a cláusula é explicitamente selecionada.

  • Adicione códigos de erro às mensagens de erro do para uma melhor solução de problemas.

Melhorias

Nenhum.

Correções de bugs

  • Correção do problema de conversão da função de janela sem suporte.