Notas de lançamento do Snowpark Connect for Spark para 2026¶
Snowflake usa controle de versão semântico para atualizações de Snowpark Connect for Spark.
Para ver a documentação, consulte Execução de cargas de trabalho do Apache Spark™ no Snowflake com Snowpark Connect for Spark e Enviando aplicativos Spark.
1.24.0 (April 24, 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Disable
filter_classpath_jarsat server startupSupport UDT cast-to-string and reject invalid UDT casts
Fix DataFrame
describeandsummaryAPIsAdd
SUPPORTED_SCALESguard to skip workloads at unsupported scales
Novos recursos¶
Add Scala 2.13 equivalent JARs to dependency packages
Add Hive partitioning implementation and limitations reference
Remove 29 unused JARs from
snowpark_connect_depspackages (~23 MB)Skip explicit structured cast when server supports implicit cast for Parquet
Bump Snowpark dependency to 1.50.0
1.23.0 (April 22, 2026)¶
Snowpark Connect for Spark¶
Behavior changes¶
Set Parquet
useLogicalTypedefault totrue
Correções de bugs¶
Fix
count()to match Spark SQL behaviorRelax protobuf version constraint from
<6.32.0to<6.34.0Consistently coerce to unstructured types
Replace
snowflake.snowpark_connect.includesimport withpyspark.sqlAlways use vectorized Parquet scanner; remove
useVectorizedScannerconfiguration optionFix
regexp_extractdefaults, inline flags, and PCRE handlingFix SQL operator compatibility gaps
Fix
IN NULLsemantics to match Spark behaviorSupport named persistent external stage read in XML UDTF
Preserve UDT metadata through temp views and
toDFrenamesUse SQL path for catalog table existence checks
Allow star expression in the map columns aggregation
Novos recursos¶
Implement sequence support for timestamp/date and interval types
Add CTE session parameter
Initialize tracking nullability of columns and complex types
Track nullability for built-in functions across multiple expression categories
Track nullable in
SetcommandAdd nullability to
rangeIntroduce performance regression gate in GitHub Actions
1.22.0 (April 18, 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Fix CTE-qualified column refs in ORDER BY/WHERE/GROUP BY
Fix
withColumnon join key after using-style joinFix
fillnaraising immediately for missing subset columnFix case sensitive read of internal stage
Reduce window function boundary materialization
Preserve struct/map/array schema with empty content
Support ON_ERROR=CONTINUE for INFER_SCHEMA in CSV and JSON reads
Fix hex compile-time type dispatch
Avoid redundant temp table creation for
read.parquettosaveAsTablePreserve
StructType/MapTypein strict modeCase-insensitive qualifier comparison in column resolution
Use Snowpark builtin for
CBRTfunctionFix XML
nullValueand whitespace handlingUse Decimal for
DecimalTypein strict modeFix
map_concatbugFix
unionByNameto handle quotes in column names and respect caseSensitive configRemove trailing commas from JSON test resource file
Novos recursos¶
Snowpark Connect Java Client library to support Spark Scala and Java workloads
Use native implementation for
ARRAY_REPEATandMAP_ENTRIESUse
MAP_ENTRIESinmap_castReduce number of queries used for VARIANT inference in
read_parquetAdd cross-request sub-plan cache for
map_relation
1.21.1 (April 10, 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Implement JSON encoding validation
Reduce query size for functions that internally rename columns
Relax py4j version constraints to allow for broader compatibility
Isolate artifacts by spark session
Novos recursos¶
Add default application name for session
Add JSON date/time format conversion
1.21.0 (April 09, 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Handle glob metacharacter escaping in CSV/JSON paths
Fix JSON non-nullable schema to match Spark behavior
Add default column matching case for XML
Fix TEXT
lineSepwith hex encoding for RECORD_DELIMITERFix spark read xml external stage
Empty CSV returns empty DataFrame
Add default idx to
regexp_extractFix CSV non-nullable schema to match Spark behavior
Fix temp stage naming collision under parallel tests
Add fast path to regexp functions
Schema coercion on
storeAssignmentPolicyCSV backslash delimiter double-escape
Optimize
posexplodeCSV
lineSepempty validationFix bug that xml cannot read external stage file
Reduce default log verbosity for users
Novos recursos¶
Added support for DML row counts
Support
overwrite(condition)forDataFrameWriterV2Iceberg
mergeSchemaon write — top-level column evolutionAdded support for partition overwrites in
DataFrameWriterV2Add
app_nameparameter toinit_spark_session
1.20.0 (April 03, 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Fix performance issue
Fix merge schema for JSON
Fix
arrays_zipfor complex typesFix LCAs in implicit aggregations
Novos recursos¶
Cache result of JSON file format
Resolve known types from
map_unresolved_functionwithout typerSupport hive partitioning for JSON copy into mode
Add SCOS session registration on server initialization
Modify warmup query with distinct string for filtering
1.19.0 (26 de março de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Correção do acesso ao campo struct a partir da matriz via getItem
Correção dos nomes para acesso a elementos de matriz
Adição de compactação ausente para o formato TEXT
Redução do tamanho da consulta em
DataFrame.replace, na criação de UDTFs e em:code:read_parquetEmulação de tipos na criação de exibição [temp]
Correção da conversão de tipos estruturados para
Correção da validação do tipo de gravação de texto
Suporte para leitura paralela de diretórios XML
Otimização do uso da função
convSuporte para leitura e gravação nos formatos Snowflake e
net.snowflake.spark.snowflakeEmulação de tipos na criação de tabelas
Correção do acesso a estruturas aninhadas com matrizes
Correção da mensagem de erro do Parquet
Otimização do to_number, reduzindo o tamanho da consulta
Correção do cache de UDF para considerar alterações no banco de dados da consulta
Otimização da função
maskPassagem do leitor de fallback PATTERN para NVS durante a inferência do esquema Parquet
Coerção de tipo estruturado e nulo
Novos recursos¶
Introdução da dica de junção DIRECTED
Integração de XML inferSchema
1.18.0 (19 de março de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Adição de mapeamento de tipo JDBC ausente
Suporte a esquemas fornecidos pelo usuário em Parquet
Tratamento sem interrupções de caracteres UTF-8 inválidos em JSON
Resolução de colunas LCA somente se realmente utilizadas
Otimização da geração de consultas get_json_object
Remoção de ponto e vírgula de consultas SQL
Definição de
processInBulk=Truecomo padrão para leituras JSON e correção da inferência de esquemaNullTypeCorreção de bug relacionado à leitura incorreta de área de preparação
Adição de não verificação no registro da UDF
Redução do limite para mensagem de erro
Permissão de campos ausentes em esquemas fornecidos pelo usuário
Inferência de compressão de JSON e CSV
Correção para
coalesce(1)criando um único arquivo
Novos recursos¶
Adição do método
execute_jarpara iniciar cargas de trabalho Java/Scala
Snowpark Submit¶
Correções de bugs¶
Correção de omissão de erros com o sinalizador
--wait-for-completion
1.17.0 (13 de março de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Inferência de compressão em JSON e CSV.
Correção do
coalesceque cria um único arquivo.Refatoração de leitura JSON para usar
COPY INTOnas leituras de arquivo único e adição da inferência de esquemaVariantType.Permitir o carregamento JSON sem esquema explícito.
Correção de
multi_lineem JSON.Correção do esquema de inferência JSON para evitar a verificação de arquivos inteiros.
Tratamento correto da conversão em carimbo de data/hora
ltz.Valor retornado do hash de limitação.
Correção de
repartitioncompartitionBy.Correção para usar o cabeçalho da seção
[connections.spark-connect]emconfig.toml.Conversão de tokens do formato Java
date/timestampem equivalentes do Snowflake para leituras CSV.Calcular esquema para funções
pivot.Correção de UDTFs em junção lateral com alias.
Alinhamento do resultado para o comando SQL
SET.Correção do tipo de retorno para as funções
CEILeFLOOR.Melhoria na geração de consultas no
unbase64v2.Correção de algumas opções para mapeamento do Snowflake para CSV.
Correção de serialização para
POJO.Melhoria nas mensagens de erro CSV com cabeçalho.
Melhoria na lógica de detecção
mapTypecomtry_castpara leituras do Parquet.
Novos recursos¶
Suporte para
reduceGroupsAPI.Suporte para especificação do nome da conexão em
init_spark_session.Adição do parâmetro de configuração para usar UDF para
unbase64.
1.16.0 (12 de março de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Otimização da geração de SQL na função
unbase64.Correção da regressão
from_jsonCorreção dos registros que abrangem vários limites de bloco de compactação BZ2
Correção do mapeamento de nulidade no atributo não resolvido
Inicialização da sessão
spark-connectcom qualquer conexão, não apenas aquela chamadaspark-connectAdição da validação de opções XML
Opção de descarte de ESCAPE CSV quando corresponde ao caractere de aspas para impedir erro de compilação
Correção da conversão incorreta de tuplas nomeadas em
productEncoderNão há suporte para verificar
mergeSchemapara CSV e JSONCorreção do tipo complexo de ida e volta Parquet (gravação + leitura)
Correção do esquema para
pivot/unpivotCorreção do tipo de retorno para as funções
MODePMODCorreção da extração de cabeçalho de CSV para arquivos com linhas em branco iniciais
Testar os fusos horários corretamente e substituir a serialização de data/hora baseada em cadeia de caracteres por baseada em época
Atualização da verificação de versão do Java para Windows
Nivelamento de chamadas
withColumnaninhadasAlteração da lógica para
Literal _IntegralTypeem operações de adição/subtraçãoRetorno de
LongTypepara funçõesCOUNTLeitura de JSON: teste de compactação = bz2/bzip2/nenhum
Melhoria no desempenho de
to_varchar/to_charMelhoria na comparação em testes de E/S
Definir
multi_linecomoFalsepor padrão para cópia JSON
Snowpark Submit¶
Correções de bugs¶
Gerar um erro em caso de pool de computação não especificado.
1.15.0 (6 de março de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Remoção da verificação de resultados ao chamar
df.count()Garantir que o esquema de inferência seja executado em linhas limitadas para leitura JSON
Correção de
createDataFramepara tipos de intervaloAlteração da lógica para
Literal _IntegralTypeem operações de multiplicação e divisãoTipo mais amplo e de coerção para operações
SetCorreção do suporte para várias rótulos de
neo4jModificação dos metadados JAR para que o Grype não detecte a vulnerabilidade do Netty
Retornar o tipo correto para a função
ANY_VALUERetornar o tipo ampliado para sequência
Adição de suporte para a configuração
spark.sql.parquet.inferTimestampNTZ.enabledRenomeação/conversão de coluna em lote em
_validate_schema_and_get_writerJDBC trava quando consultas particionadas são fornecidas com tamanho de busca
Retornar uma mensagem de exceção excluída quando ela excede os limites de cabeçalho HTTP
Correção de
map_type_to_snowflake_typeparaBigDecimalCorreção da precisão e escala decimais literais
Melhoria na geração de cadeias de caracteres aleatórias
Fazer com que o carregamento JSON compactado do BZ2ignore registros corrompidos
Novos recursos¶
Uso de arquivos preparados da configuração em UDFs do Scala
Uso de
TRY_CASTpermissivo em leitura JSONTornar o número de threads de servidor configurável
Snowpark Submit¶
Correções de bugs¶
Readicionar
init_spark_session()para testesÉ obrigatório atualizar a saída da linha de comando
snowpark-submitpara esclarecer osnowflake-connection-name.
1.14.0 (19 de fevereiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Tipo de tabela de cache ao executar
saveAsTableOtimizar entrada literal para conversão de subcadeia de caracteres e tipo para
coalesceTratamento do estouro decimal em
avg/meane correção da coerção do tipo decimalIceberg: preservar concessões ao substituir
Padronizar modo de passagem SQL
Otimizar
from_utc_timestamp/to_utc_timestamppara fuso horário literalManipular valores nulos JSON em tipos estruturados para corresponder à semântica do Spark
Emular tipos integrais na criação de tabelas com base em SQL
Corrigir caso de borda com mapeamento de linhas aninhadas em UDFs Scala
Corrigir como o Parquet lida com leitura e gravação de tipos de dados estruturados complexos
Oferecer suporte ao argumento “save ignore” para arquivos Parquet
Adicionar suporte para repositório de artefatos
Corrigir nulidade de matriz em UDxF Scala
Corrigir
log1ppara argumentos da faixa (-1, 0)Corrigir
first_valueelast_valueem contexto agregadoCorrigir a leitura:code:
DayTimeIntervalTypepara cliente Scala
Novos recursos¶
Manusear fusos horários corretamente em UDFs Scala
Oferecer suporte a Java 11 e 17 sem nenhuma configuração
Atualizações de envio do Snowpark¶
Novos recursos¶
Oferecer suporte a
snowpark-submitpara Python 3.9Aprimorar
init_spark_sessionpara ser usado no fluxo de trabalho desnowpark-submit
1.13.0 (13 de fevereiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Corrigido o problema da função
splitRealizado o downgrade da dependência snowflake-snowpark-python para a versão 1.44
Corrigido o dialeto
Neo4jcorrespondente para melhorar a tradução de SQLCorrigido o ID da operação retornado em respostas de execução para manter a consistência
Corrigido o tratamento de metadados do
gRPCpara conexões de canal TCP
Novos recursos¶
Adicionado suporte para
partition_hintem operaçõesmapPartitionsAdicionado suporte do leitor XML para cenários com esquemas definidos pelo usuário
1.11.0 (28 de janeiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Preservar colunas ocultas após vários operadores DataFrame
Corrigir problemas de tipos de entrada udf Scala (
byte,binary,scala.math.BigDecimal)
Outras atualizações¶
Adicionar argumentos
snowpark-submitdefinidos pelo usuário para comentar
1.10.0 (22 de janeiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Corrigido o erro do comando config unset na configuração de sessão.
Uso de «copiar em» para carregar arquivos CSV em paralelo.
Correção das gravações de DataFrames usando junções externas.
Tratamento de nulos em UDFs do Scala.
Otimização da geração de consultas CTE com proteção de parâmetros.
Evitar converter argumentos de
DATEDIFF.Corrigida a anexação de arquivos particionados e a leitura de partições nulas.
Melhoria feita no desempenho em 10 vezes para conversão entre base 10 e 16 usando SQL.
Novos recursos¶
Substituição somente de partições modificadas para arquivos parquet.
Outras atualizações¶
Lógica atualizada para detectar se o Snowpark Connect for Spark está em execução no XP.
Suporte à gravação em tabela com tipo de dados «variante» no Snowflake.
Remoção de logs de informação desnecessários.
Os testes do Java foram movidos do trabalho de testes do Scala para um trabalho separado.
Atualização da versão de dependência para gcsfs.
Snowpark Submit¶
Nenhum.
1.9.0 (14 de janeiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Correção da serialização de tuplas do Scala.
Correção do carregamento de arquivos JSON enormes.
Implementação de pequenas correções de problemas de clientes.
Implementação de correções para comparações com struct (estrutura).
Adição de tratamento para DataFrames de coluna 0.
Caminho correto do arquivo de carregamento.
Correção de
Upload_files_if_neededque não era executado em paralelo.Melhoria na inferência de tipo de entrada quando tipos de entrada de UDF não são definidos no proto.
Correção de casos de borda NA.
Novos recursos¶
Suporte à leitura de único arquivo JSON BZ2.
Suporte a UDFs do Scala no Snowpark Connect for Spark do lado do servidor.
Implementação de conversão entre cadeia de caracteres e
daytime.Suporte adicionado para UDFs do Scala em
group_map.
Snowpark Submit¶
Correções de bugs¶
Redução dos nomes gerados de carga de trabalho.
1.8.0 (7 de janeiro de 2026)¶
Snowpark Connect for Spark¶
Correções de bugs¶
Tratamento de JAVA_HOME corrigido para Windows.
Novos recursos¶
Suporte para fonte de dados
neo4jvia JDBC.
Snowpark Submit¶
Nenhum.