Explicação do custo de armazenamento

O custo de armazenamento representa o custo de:

  • Arquivos preparados para carregamento/descarregamento de dados em massa (armazenados compactados ou não compactados).

  • Tabelas de banco de dados, incluindo dados históricos para o Time Travel.

  • Fail-safe para tabelas do banco de dados.

  • Clones de tabelas de banco de dados que referenciam dados excluídos da tabela que possui os clones.

Os custos mensais de armazenamento de dados no Snowflake são baseados em uma taxa fixa por terabyte (TB). O valor cobrado depende de seu tipo de conta (Capacidade ou Sob Demanda) e região (US ou EU).

Para obter os preços de armazenamento, consulte o Guia de preços do Snowflake.

Neste tópico:

Custo do arquivo preparado

Arquivos preparados para carregamento/descarregamento de dados em massa incorrem em custos de armazenamento com base no tamanho dos arquivos. Para obter mais informações sobre carregamento de dados, consulte Carregamento de dados para o Snowflake.

Custos do banco de dados

Os custos do banco de dados incluem os dados armazenados em tabelas de banco de dados. Os custos do banco de dados também incluem dados históricos mantidos para Time Travel. O Snowflake comprime automaticamente todos os dados armazenados em tabelas e usa o tamanho do arquivo compactado para calcular o armazenamento total usado para uma conta.

Consulte também Considerações sobre armazenamento de dados.

Custos de Time Travel e Fail-safe

As taxas de Time Travel e Fail-safe são calculadas para cada período de 24 horas (ou seja, 1 dia) a partir do momento em que os dados foram alterados. O número de dias de dados históricos é mantido com base no tipo de tabela e no período de retenção do Time Travel para a tabela.

O Snowflake minimiza a quantidade de armazenamento necessária para os dados históricos, mantendo apenas as informações necessárias para restaurar as linhas de tabela individuais que foram atualizadas ou excluídas. Como resultado, o uso do armazenamento é calculado como uma porcentagem da tabela alterada. Cópias completas das tabelas só são mantidas quando as tabelas são descartadas ou truncadas.

Consulte também Custos de armazenamento para Time Travel e Fail-safe.

Custos de tabelas temporárias e transitórias

Para ajudar a gerenciar os custos de armazenamento associados ao Time Travel e Fail-safe, o Snowflake fornece dois tipos de tabelas, temporária e transitória. As tabelas temporárias e transitórias não incorrem nas mesmas taxas que as tabelas permanentes:

  • As tabelas transitórias e temporárias contribuem para as taxas de armazenamento que o Snowflake cobra de sua conta até que seja explicitamente descartada. Os dados armazenados nestes tipos de tabela contribuem para os encargos gerais de armazenamento que o Snowflake cobra de sua conta enquanto eles existem.

  • As tabelas temporárias são normalmente usadas para dados transitórios específicos de sessões não permanentes, tais como ETL ou outros dados específicos de sessões. As tabelas temporárias só existem pela vida útil ou para sua sessão associada. No fim da sessão, os dados da tabela temporária são purgados e irrecuperáveis. As tabelas temporárias não são acessíveis fora da sessão específica que as criou.

  • As tabelas transitórias existem até serem explicitamente descartadas e estão disponíveis para todos os usuários com privilégios apropriados.

  • As tabelas transitórias e temporárias podem ter um período de retenção do Time Travel de 0 ou 1 dia.

  • As tabelas transitórias e temporárias não têm período de Fail-safe.

  • As tabelas transitórias e temporárias podem, no máximo, incorrer em um dia de custo de armazenamento.

A tabela a seguir ilustra os diferentes cenários, com base no tipo de tabela:

Tipo de tabela

Período de retenção do Time Travel (dias)

Período do Fail-safe (dias)

Dados históricos mínimos e máximos mantidos (dias)

Permanente

0 ou 1 (para Snowflake Standard Edition)

7

7 , 8

0 para 90 (para Snowflake Enterprise Edition)

7

7 , 97

Transitória

0 ou 1

0

0 , 1

Temporária

0 ou 1

0

0 , 1

Uso de tabelas temporárias e transitórias para gerenciar os custos de armazenamento

Ao escolher entre armazenar dados em tabelas permanentes, temporárias ou transitórias, considere o seguinte:

  • As tabelas temporárias são descartadas quando a sessão em que foram criadas termina. Os dados armazenados em tabelas temporárias não são recuperáveis depois que a tabela é descartada.

  • Dados históricos em tabelas transitórias não podem ser recuperados pelo Snowflake após o término do período de retenção do Time Travel. Use tabelas transitórias apenas para dados que você pode replicar ou reproduzir independentemente do Snowflake.

  • Tabelas de longa duração, tais como tabelas de fatos, devem sempre ser definidas como permanentes para garantir que sejam totalmente protegidas pelo Fail-safe.

  • Tabelas de curta duração (ou seja, <1 dia), tais como tabelas de trabalho ETL, podem ser definidas como transitórias para eliminar custos do Fail-safe.

  • Se o tempo de inatividade e o tempo necessário para recarregar dados perdidos forem fatores, tabelas permanentes, mesmo com seus custos adicionais de Fail-safe, podem oferecer uma solução geral melhor do que tabelas transitórias.

Nota

O tipo padrão para tabelas é permanente. Para definir uma tabela como temporária ou transitória, você deve especificar explicitamente o tipo durante a criação da tabela.

Custos da tabela híbrida

Se você optar por usar tabelas híbridas para suas cargas de trabalho operacionais e analíticas, considere que o custo do armazenamento de dados nesse tipo de tabela se baseia nas taxas de consumo do seguinte:

  • Armazenamento de tabelas híbridas (incorrido principalmente pelas próprias tabelas híbridas e pelos índices que elas contêm)

  • Solicitações de tabela híbrida

Geralmente, as tabelas híbridas são mais caras do que as tabelas Snowflake padrão.

Para obter mais informações, consulte Compreensão dos custos das tabelas híbridas.

Custos de clonagem de tabelas, esquemas e bancos de dados

O recurso de clonagem zero-copy do Snowflake fornece uma maneira conveniente de tirar rapidamente um “instantâneo” de qualquer tabela (exceto tabelas híbridas), esquema ou banco de dados e criar uma cópia derivada daquele objeto que inicialmente compartilha o armazenamento subjacente. Isto pode ser extremamente útil para a criação de backups instantâneos que não incorram em custos adicionais (até que sejam feitas alterações no objeto clonado).

Entretanto, a clonagem torna o cálculo do uso total de armazenamento mais complexo, pois cada clone tem seu próprio ciclo de vida separado. Isto significa que mudanças podem ser feitas no objeto original ou no clone independentemente um do outro, e estas mudanças são protegidas através do CDP.

Por exemplo, quando um clone é criado a partir de uma tabela, não utiliza armazenamento porque compartilha todas as micropartições existentes da tabela original no momento em que foi clonado; no entanto, linhas podem então ser adicionadas, excluídas ou atualizadas no clone independentemente da tabela original. Cada mudança no clone resulta em novas micropartições que são de propriedade exclusiva do clone e são protegidas através do CDP.

Além disso, os clones podem ser clonados, sem limitações no número ou iterações de clones que podem ser criados (por exemplo, pode-se criar um clone de um clone de um clone e assim por diante), o que resulta em uma hierarquia em nível n de objetos clonados, cada um com sua própria porção de armazenamento compartilhada e independente.

Custos de preenchimento automático entre nuvens

O preenchimento automático entre nuvens permite que você forneça um produto de dados aos consumidores em outras regiões de nuvem sem replicação manual de dados. Quando seu produto de dados é preenchido automaticamente para outra região, você incorre em armazenamento e outros custos. Para obter mais detalhes, consulte Como gerenciar os custos do preenchimento automático entre nuvens.

Próximo tópico