Snowpark Container Services: como trabalhar com pools de computação¶

Um pool de computação é uma coleção de um ou mais nós de máquinas virtuais (VM) nos quais o Snowflake executa seus serviços do Snowpark Container Services (incluindo serviços de trabalho). Você cria um pool de computação usando o comando CREATE COMPUTE POOL. Em seguida, você o especifica ao criar um serviço ou executar um serviço de trabalho.

Criação de um pool de computação¶

Um pool de computação é uma construção em nível de conta, análoga a um warehouse virtual Snowflake. O escopo de nomenclatura do pool de computação é a sua conta. Ou seja, você não pode ter vários pools de computação com o mesmo nome na sua conta.

As informações mínimas necessárias para criar um pool de computação incluem o seguinte:

O tipo de máquina (conhecido como a família de instâncias) a ser provisionada para os nós do pool de computação
Os nós mínimos para iniciar o pool de computação
O número máximo de nós para os quais o pool de computação pode ser dimensionado (o Snowflake gerencia o dimensionamento).

Se você espera uma carga substancial ou picos repentinos de atividade nos serviços que pretende executar no pool de computação, defina uma contagem mínima de nós maior que 1. Essa abordagem garante que nós adicionais estejam prontamente disponíveis quando necessário, em vez de aguardar o início do dimensionamento automático.

Definir um limite máximo de nós evita que um número inesperadamente grande de nós seja adicionado ao seu pool de computação pelo dimensionamento automático do Snowflake. Isso pode ser crucial em cenários como picos de carga inesperados ou problemas no código que podem fazer com que o Snowflake aloque um número maior de nós do pool de computação do que o planejado originalmente.

Para criar um pool de computação usando Snowsight ou SQL:

Snowsight:

No menu de navegação, selecione Compute » Compute Pools.
Selecione seu nome de usuário na parte inferior da barra de navegação e alterne para a função ACCOUNTADMIN ou qualquer função que tenha permissão para criar um pool de computação.
Selecione + Compute Pool.
Na New compute pool UI, especifique as informações necessárias (o nome do pool de computação, a família de instâncias e o limite de nós).
Selecione Create Compute Pool.

SQL:

Execute o comando CREATE COMPUTE POOL.

Por exemplo, o comando a seguir cria um pool de computação de um nó:

CREATE COMPUTE POOL tutorial_compute_pool
  MIN_NODES = 1
  MAX_NODES = 1
  INSTANCE_FAMILY = CPU_X64_XS;

Copy

A família de instâncias identifica o tipo de máquina que você deseja provisionar para os nós de computador no pool de computação. Especificar a família de instâncias na criação de um pool de computação é semelhante a especificar o tamanho do warehouse (XSMALL, SMALL, MEDIUM, LARGE e assim por diante) ao criar um warehouse. A tabela a seguir lista os tipos de máquinas disponíveis. Você também pode usar o SHOW COMPUTE POOL INSTANCE FAMILIES Comando para obter esta lista de famílias de instâncias disponíveis.

Posicionamento de pools de computação¶

Um grupo de posicionamento é um domínio de isolamento de falhas dentro de uma região Snowflake, semelhante a uma zona de disponibilidade (AZ) na AWS ou no Azure. Quando você define um grupo de posicionamento em um pool de computação, o Snowflake provisiona todos os nós para esse pool a partir do grupo de posicionamento. Se nenhum grupo de posicionamento for definido, o Snowflake alocará os nós com base na disponibilidade, o que pode abranger vários grupos de posicionamento.

Você deve definir o grupo de posicionamento explicitamente nas seguintes situações:

Você precisa de latência reduzida entre nós e custos de comunicação menores para serviços altamente interativos e bastante integrados.
Você está criando um serviço de alta disponibilidade e opta por implantar o mesmo serviço em vários pools de computação, cada um atribuído a um grupo de posicionamento distinto.

As diretrizes a seguir se aplicam quando você define explicitamente um grupo de posicionamento para um pool de computação:

A disponibilidade da família de instâncias varia de acordo com o grupo de posicionamento e a região. Regiões menores (especialmente para famílias de GPU) podem oferecer menos opções de grupos de posicionamento. Chame a função do sistema SYSTEM$GET_INSTANCE_FAMILY_PLACEMENT_GROUPS para listar os grupos de posicionamento disponíveis para uma família de instâncias específica em sua região.
Os nomes dos grupos de posicionamento são consistentes dentro de uma conta em diferentes famílias de instâncias. Contas Snowflake diferentes podem observar nomes diferentes para os mesmos grupos de posicionamento subjacentes.
Quando você configura um grupo de posicionamento para um pool de computação, restringe a flexibilidade do Snowpark Container Services de otimizar o posicionamento de nós. Essa restrição pode aumentar a probabilidade de erros de capacidade insuficiente e prolongar os tempos de inicialização durante picos de demanda.
Você só poderá alterar um grupo de posicionamento se o pool de computação estiver totalmente suspenso e os seus serviços não usarem armazenamento em bloco.

Famílias de instâncias disponíveis (tipos de máquina) para nós de pool de computação¶

INSTANCE_FAMILY, consulte Tabela de consumo do serviço Snowflake

vCPU

Memória (GiB)

Armazenamento (GB)

Limite de largura de banda (Gbps)

GPU

Memória GPU por GPU (GiB)

Limite de nós

Descrição

CPU_X64_XS

1

6

100

Até 12,5

n/a

n/a

150

Menor instância disponível para Snowpark Containers. Ideal para economizar custos e começar.

CPU_X64_S

3

13

100

Até 12,5

n/a

n/a

150

Ideal para hospedar vários serviços/trabalhos enquanto economiza custos.

CPU_X64_M

6

28

100

Até 12,5

n/a

n/a

150

Ideal para ter um aplicativo full stack ou múltiplos serviços

CPU_X64_SL (exceto China)

14

54

100

Até 12,5

n/a

n/a

150

Para aplicativos que precisam de um grande número de CPUs, memória e armazenamento.

CPU_X64_L

28

116

100

12,5

n/a

n/a

150

Para aplicativos que precisam de um número incomumente grande de CPUs, memória e armazenamento.

HIGHMEM_X64_S

6

58

100

AWS e GCP: até 12,5, Azure: 8

n/a

n/a

150

Para aplicativos com uso intensivo de memória.

HIGHMEM_X64_M

28

AWS: 240, Azure e GCP: 244

100

AWS: 12,5, Azure e GCP: 16

n/a

n/a

150

Para hospedar vários aplicativos com uso intenso de memória em uma única máquina.

HIGHMEM_X64_SL (Azure e GCP, exceto região de GCP Dammam)

92

654

100

32

n/a

n/a

20

Maior Azure ou máquina de alta memória GCP disponível para processamento de muitos dados em memória.

HIGHMEM_X64_L (somente AWS)

124

984

100

50

n/a

n/a

150

A maior máquina de alta memória do AWS disponível para processamento de grandes volumes de dados em memória.

GPU_NV_S (somente AWS, exceto nas regiões de Singapura, Norte da Suíça, Paris e Osaka)

6

27

300 (NVMe)

Até 10

1 NVIDIA A10G

24

150

Nosso menor tamanho NVIDIA GPU disponível para Snowpark Containers para começar.

GPU_NV_M (somente AWS, exceto regiões governamentais, Singapura, Norte da Suíça, Paris e Osaka)

44

178

3,4 TB (NVMe)

40

4 NVIDIA A10G

24

10

Otimizado para cenários de uso intensivo de GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.

GPU_NV_L (somente AWS, disponível apenas nas regiões não governamentais AWS US West e US East mediante solicitação; disponibilidade limitada pode ser possível em outras regiões mediante solicitação)

92

1112

6,8 TB (NVMe)

400

8 NVIDIA A100

40

Mediante solicitação

Maior instância de GPU para casos de GPU especializados e avançados, como LLMs e clustering etc.

GPU_NV_XS (somente Azure, exceto regiões Norte da Suíça, UAE North, US Central e UK South)

3

26

100

8

1 NVIDIA T4

16

10

Nosso menor tamanho de GPU NVIDIA Azure disponível para contêineres Snowpark para começar.

GPU_NV_SM (somente Azure, exceto região US Central)

32

424

100

40

1 NVIDIA A10

24

10

Um tamanho menor de GPU NVIDIA Azure disponível para contêineres Snowpark para começar.

GPU_NV_2M (somente Azure, exceto região US Central)

68

858

100

80

2 NVIDIA A10

24

5

Otimizado para cenários de uso intensivo de GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.

GPU_NV_3M (somente Azure, exceto regiões US Central, Norte da Europa e UAE North)

44

424

100

40

2 NVIDIA A100

80

Mediante solicitação

Otimizado para cenários de uso intensivo de memória com GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.

GPU_NV_SL (somente Azure, exceto regiões US Central, Norte da Europa e UAE North)

92

858

100

80

4 NVIDIA A100

80

Mediante solicitação

Maior instância de GPU para casos de GPU especializados e avançados, como LLMs e clustering etc.

GPU_GCP_NV_L4_1_24G (somente Google Cloud)

6

28

300

Até 16

1 NVIDIA L4

24

10

Nosso menor tamanho NVIDIA GPU disponível para Snowpark Containers para começar.

GPU_GCP_NV_L4_4_24G (somente Google Cloud)

44

178

1200

Até 50

4 NVIDIA L4

24

10

Cenários de uso do GPU como Visão Computacional ou LLMs.

GPU_GCP_NV_A100_8_40G (somente Google Cloud, disponível apenas nas regiões GCP US Central1 e Europe West4 mediante solicitação)

92

654

2500

Até 100

8 NVIDIA A100

40

Mediante solicitação

Otimizado para cenários de uso intensivo de memória com GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.

INSTANCE_FAMILY, consulte Tabela de consumo do serviço Snowflake	vCPU	Memória (GiB)	Armazenamento (GB)	Limite de largura de banda (Gbps)	GPU	Memória GPU por GPU (GiB)	Limite de nós	Descrição
CPU_X64_XS	1	6	100	Até 12,5	n/a	n/a	150	Menor instância disponível para Snowpark Containers. Ideal para economizar custos e começar.
CPU_X64_S	3	13	100	Até 12,5	n/a	n/a	150	Ideal para hospedar vários serviços/trabalhos enquanto economiza custos.
CPU_X64_M	6	28	100	Até 12,5	n/a	n/a	150	Ideal para ter um aplicativo full stack ou múltiplos serviços
CPU_X64_SL (exceto China)	14	54	100	Até 12,5	n/a	n/a	150	Para aplicativos que precisam de um grande número de CPUs, memória e armazenamento.
CPU_X64_L	28	116	100	12,5	n/a	n/a	150	Para aplicativos que precisam de um número incomumente grande de CPUs, memória e armazenamento.
HIGHMEM_X64_S	6	58	100	AWS e GCP: até 12,5, Azure: 8	n/a	n/a	150	Para aplicativos com uso intensivo de memória.
HIGHMEM_X64_M	28	AWS: 240, Azure e GCP: 244	100	AWS: 12,5, Azure e GCP: 16	n/a	n/a	150	Para hospedar vários aplicativos com uso intenso de memória em uma única máquina.
HIGHMEM_X64_SL (Azure e GCP, exceto região de GCP Dammam)	92	654	100	32	n/a	n/a	20	Maior Azure ou máquina de alta memória GCP disponível para processamento de muitos dados em memória.
HIGHMEM_X64_L (somente AWS)	124	984	100	50	n/a	n/a	150	A maior máquina de alta memória do AWS disponível para processamento de grandes volumes de dados em memória.
GPU_NV_S (somente AWS, exceto nas regiões de Singapura, Norte da Suíça, Paris e Osaka)	6	27	300 (NVMe)	Até 10	1 NVIDIA A10G	24	150	Nosso menor tamanho NVIDIA GPU disponível para Snowpark Containers para começar.
GPU_NV_M (somente AWS, exceto regiões governamentais, Singapura, Norte da Suíça, Paris e Osaka)	44	178	3,4 TB (NVMe)	40	4 NVIDIA A10G	24	10	Otimizado para cenários de uso intensivo de GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.
GPU_NV_L (somente AWS, disponível apenas nas regiões não governamentais AWS US West e US East mediante solicitação; disponibilidade limitada pode ser possível em outras regiões mediante solicitação)	92	1112	6,8 TB (NVMe)	400	8 NVIDIA A100	40	Mediante solicitação	Maior instância de GPU para casos de GPU especializados e avançados, como LLMs e clustering etc.
GPU_NV_XS (somente Azure, exceto regiões Norte da Suíça, UAE North, US Central e UK South)	3	26	100	8	1 NVIDIA T4	16	10	Nosso menor tamanho de GPU NVIDIA Azure disponível para contêineres Snowpark para começar.
GPU_NV_SM (somente Azure, exceto região US Central)	32	424	100	40	1 NVIDIA A10	24	10	Um tamanho menor de GPU NVIDIA Azure disponível para contêineres Snowpark para começar.
GPU_NV_2M (somente Azure, exceto região US Central)	68	858	100	80	2 NVIDIA A10	24	5	Otimizado para cenários de uso intensivo de GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.
GPU_NV_3M (somente Azure, exceto regiões US Central, Norte da Europa e UAE North)	44	424	100	40	2 NVIDIA A100	80	Mediante solicitação	Otimizado para cenários de uso intensivo de memória com GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.
GPU_NV_SL (somente Azure, exceto regiões US Central, Norte da Europa e UAE North)	92	858	100	80	4 NVIDIA A100	80	Mediante solicitação	Maior instância de GPU para casos de GPU especializados e avançados, como LLMs e clustering etc.
GPU_GCP_NV_L4_1_24G (somente Google Cloud)	6	28	300	Até 16	1 NVIDIA L4	24	10	Nosso menor tamanho NVIDIA GPU disponível para Snowpark Containers para começar.
GPU_GCP_NV_L4_4_24G (somente Google Cloud)	44	178	1200	Até 50	4 NVIDIA L4	24	10	Cenários de uso do GPU como Visão Computacional ou LLMs.
GPU_GCP_NV_A100_8_40G (somente Google Cloud, disponível apenas nas regiões GCP US Central1 e Europe West4 mediante solicitação)	92	654	2500	Até 100	8 NVIDIA A100	40	Mediante solicitação	Otimizado para cenários de uso intensivo de memória com GPU, como Pesquisa Visual Computacional ou LLMs/VLMs.

Para obter informações sobre famílias de instâncias disponíveis, consulte CREATE COMPUTE POOL.

Dimensionamento automático de nós do pool de computação¶

Depois de criar um pool de computação, o Snowflake inicia o número mínimo de nós e cria automaticamente nós adicionais até o máximo permitido. Isso é chamado de dimensionamento automático. Novos nós são alocados quando os nós em execução não podem suportar nenhuma carga de trabalho adicional. Por exemplo, suponha que duas instâncias de serviço estejam em execução em dois nós do seu pool de computação. Se você executar outro serviço no mesmo pool de computação, os requisitos de recursos adicionais poderão fazer com que o Snowflake inicie um nó adicional.

No entanto, se nenhum serviço for executado em um nó por um período específico, o Snowflake removerá automaticamente o nó, garantindo que o pool de computação mantenha os nós mínimos necessários, mesmo após a remoção.

Gerenciamento de um pool de computação¶

Você pode gerenciar um pool de computação usando Snowsight ou SQL.

Em Snowsight, você escolhe a opção mais (…) ao lado do nome do pool de computação e escolhe a operação desejada no menu. A seção explica os comandos SQL que podem ser usados para gerenciar um pool de computação.

O Snowpark Container Services fornece os seguintes comandos para gerenciar pools de computação:

Monitoramento: use o comando SHOW COMPUTE POOLS para obter informações sobre pools de computação.
Operação: use o comando ALTER COMPUTE POOL para alterar o estado de um pool de computação.
```
ALTER COMPUTE POOL <name> { SUSPEND | RESUME | STOP ALL }
```
Copy
Quando você suspende um pool de computação, o Snowflake suspende todos os serviços, exceto os serviços de trabalho. Os serviços de trabalho continuam a ser executados até atingirem um estado terminal (DONE ou FAILED), após o qual os nós do pool de computação são liberados.

Um pool de computação suspenso deve ser retomado antes que você possa iniciar um novo serviço. Se o pool de computação estiver configurado para retomada automática (com a propriedade AUTO_RESUME definida como TRUE), o Snowflake retoma automaticamente o pool quando um serviço é enviado a ele. Caso contrário, será necessário executar o comando ALTER COMPUTE POOL para retomar manualmente o pool de computação.
Modificação: use o comando ALTER COMPUTE POOL para alterar as propriedades do pool de computação.
```
ALTER COMPUTE POOL <name> SET propertiesToAlter = <value>
propertiesToAlter := { MIN_NODES | MAX_NODES | AUTO_RESUME | AUTO_SUSPEND_SECS | PLACEMENT_GROUP | INSTANCE_FAMILY | TAG | COMMENT }
```
Copy
Ao diminuir MAX_NODES, observe os seguintes efeitos potenciais:
- O Snowflake pode precisar encerrar uma ou mais instâncias de serviço e reiniciá-las em outros nós disponíveis no pool de computação. Se MAX_NODES estiver definido como muito baixo, o Snowflake poderá não conseguir agendar determinadas instâncias de serviço.
- Se o nó encerrado tiver uma execução de serviço de trabalho em andamento, a execução do trabalho falhará. Snowflake não reiniciará o serviço de trabalho.
  
  Exemplo:
  ALTER COMPUTE POOL my_pool SET MIN_NODES = 2 MAX_NODES = 2;
  
  Copy
Remoção: use o comando DROP COMPUTE POOL para remover um pool de computação.
Exemplo:
DROP COMPUTE POOL <name>

Copy

Você deve interromper todos os serviços em execução antes de descartar um pool de computação.
Listagem de pools de computação e visualização de propriedades: use os comandos SHOW COMPUTE POOLS e DESCRIBE COMPUTE POOL. Para ver exemplos, consulte Exibição de pools de computação.

Ciclo de vida do pool de computação¶

Um pool de computação pode estar em qualquer um dos seguintes estados:

IDLE: o pool de computação tem o número desejado de nós de máquinas virtuais (VM), mas nenhum serviço está agendado. Neste estado, o dimensionamento automático pode reduzir o pool de computação para o tamanho mínimo devido à falta de atividade.
ACTIVE: o pool de computação tem pelo menos um serviço em execução ou programado para execução nele. O pool pode aumentar (até o máximo de nós) ou diminuir (até o mínimo de nós) em resposta ao carregamento ou às ações do usuário.
SUSPENDED: o pool atualmente não contém nós de máquinas virtuais em execução, mas se a propriedade do pool de computação AUTO_RESUME estiver definida como TRUE, o pool será retomado automaticamente quando um serviço for agendado.

Os seguintes estados são transitórios:

STARTING: quando você cria ou retoma um pool de computação, o pool de computação entra no estado STARTING até que pelo menos um nó seja provisionado.
STOPPING: quando você suspende um pool de computação (usando ALTER COMPUTE POOL), o pool de computação entra no estado STOPPING até que o Snowflake libere todos os nós no pool de computação. Quando você suspende um pool de computação, o Snowflake suspende todos os serviços, exceto os serviços de trabalho. Os serviços de trabalho continuam a ser executados até atingirem um estado terminal (DONE ou FAILED), após o qual os nós do pool de computação são liberados.
RESIZING: quando você cria um pool de computação, inicialmente ele entra no estado STARTING. Depois de provisionar um nó, ele entra no estado RESIZING até que o número mínimo de nós (conforme especificado em CREATE COMPUTE POOL) seja provisionado. Quando você altera um pool de computação (ALTER COMPUTE POOL) e atualiza os valores mínimo e máximo do nó, o pool entra no estado RESIZING até que os nós mínimos sejam provisionados. Observe que o dimensionamento automático de um pool de computação também coloca o pool de computação no estado RESIZING.

Para obter informações sobre como os custos incorridos durante os diferentes estados do ciclo de vida do pool de computação, consulte Custo do pool de computação.

Privilégios do pool de computação¶

Quando você trabalha com pools de computação, o seguinte modelo de privilégio se aplica:

Para criar um pool de computação em uma conta, a função atual precisa do privilégio CREATE COMPUTE POOL na conta. Se você criar um pool, como proprietário você terá a permissão OWNERSHIP, que concede controle total sobre esse pool de computação. Ter OWNERSHIP de um pool de computação não implica nenhuma permissão em outros pools de computação.

Para gerenciamento de pool de computação, há suporte para os seguintes privilégios (recursos):

Privilégio	Uso
MODIFY	Permite alterar quaisquer propriedades do pool de computação, incluindo a alteração do tamanho.
MONITOR	Enables viewing compute pool usage, including describing compute pool properties. Enables access to the monitoring endpoint exposed by the compute pool.
OPERATE	Permite alterar o estado do pool de computação (suspender, retomar). Além disso, permite interromper todos os serviços agendados (incluindo serviços de trabalho).
USAGE	Permite a criação de serviços no pool de computação. Observe que quando um pool de computação está em estado suspenso e tem sua propriedade AUTO_RESUME definida como verdadeira, uma função com permissão USAGE no pool de computação pode acionar implicitamente a retomada do pool de computação ao iniciar ou retomar um serviço, mesmo que a função não tenha a permissão OPERATE.
OWNERSHIP	Grants full control over the compute pool. Only a single role can hold this privilege on a specific object at a time. Enables access to the monitoring endpoint exposed by the compute pool.
ALL [ PRIVILEGES ]	Concede todos os privilégios, exceto OWNERSHIP, no pool de computação.

Manutenção do pool de computação¶

Como parte da manutenção rotineira da infraestrutura interna, o Snowflake atualiza regularmente os nós do pool de computação para garantir desempenho e segurança ideais. Isso inclui atualizações do sistema operacional, melhorias de driver e correções de segurança. A manutenção envolve a substituição de nós desatualizados por atualizados a cada poucas semanas, com cada nó ativo por até um mês.

Janela de manutenção¶

Em geral, a manutenção programada ocorre todos os sábados, das 20h às 8h de domingo, e todos os domingos, das 20h às 8h de segunda-feira. Para contas de acesso antecipado, a manutenção ocorre diariamente, a partir das 23h, e pode durar até seis horas.

Interrupção do serviço¶

Durante a manutenção, o Snowflake recria automaticamente as instâncias de serviço em execução nos nós mais antigos do pool de computação nos novos nós. O Snowflake usa um método contínuo para recriar as instâncias de serviço.

Se um serviço tiver apenas uma instância, a interrupção do serviço ocorrerá enquanto o Snowflake estiver recriando a instância.
Para serviços com várias instâncias, o Snowflake recria as instâncias de serviço de forma incremental nos nós atualizados. Não mais do que 50% das instâncias de serviço são substituídas de cada vez. Observe que isso pode resultar em menos instâncias disponíveis do que o MIN_INSTANCES solicitado para o serviço. Se as instâncias disponíveis caírem para menos de MIN_READY_INSTANCES, isso fará com que o serviço passe do estado READY para o estado PENDING, causando a interrupção do serviço. Portanto, para evitar a interrupção do serviço, considere a possibilidade de configurar MIN_READY_INSTANCES para menos de 50% de MIN_INSTANCES.

Os serviços de trabalho em andamento serão interrompidos e deverão ser reiniciados pelos clientes após a conclusão da manutenção.

Atenção

Interrupções de serviço durante uma janela de manutenção ou atualizações críticas não são cobertas pela Política de suporte e Acordo de nível de serviço da Snowflake.

Práticas recomendadas para minimizar o tempo de inatividade¶

Execute várias instâncias de serviço: ter várias instâncias minimiza a interrupção do serviço durante a manutenção, garantindo alta disponibilidade.
Armazenar o estado do aplicativo no armazenamento persistente: armazene dados e objetos com estado no armazenamento persistente, incluindo armazenamento em bloco, estágios do Snowflake ou tabelas do Snowflake.
Capture o sinal SIGTERM: ao encerrar uma instância de serviço, o Snowflake primeiro envia um sinal SIGTERM para cada contêiner de serviço (consulte Encerramento do serviço). Como parte do processamento do sinal, o código do contêiner pode salvar o estado do serviço antes que a instância do serviço seja desligada ou reiniciada.
Projete serviços de alta disponibilidade para serem executados em estado obsoleto durante a manutenção: para permanecer disponível durante a manutenção, seu serviço deve ser tolerante à execução com apenas 50% das instâncias.
Forneça uma sonda de prontidão: se você não fornecer uma sonda de prontidão, o Snowflake presumirá que sua instância de serviço está pronta assim que o código começar a ser executado. Normalmente, leva algum tempo para que um contêiner conclua a inicialização e esteja pronto para lidar com as solicitações. Você deve fornecer uma sonda de prontidão na configuração do serviço para informar explicitamente ao Snowflake quando a instância do serviço está pronta para tratar as solicitações.
Monitore as programações de manutenção: evite programar tarefas críticas durante uma janela de manutenção.
Evite programar o serviço de trabalho para ser executado durante as janelas de manutenção: o Snowflake pode cancelar um trabalho em execução durante uma janela de manutenção.
Realize backups ou pontos de verificação regulares: faça periodicamente o backup ou o ponto de verificação do estado do aplicativo no armazenamento persistente (incluindo armazenamento em bloco, estágios do Snowflake ou tabelas do Snowflake).

Como os serviços são agendados em um pool de computação¶

No momento de criar um serviço, você pode optar por executar diversas instâncias para gerenciar a carga de entrada. Snowflake usa as seguintes diretrizes gerais ao agendar suas instâncias de serviço em nós de pool de computação:

Todos os contêineres em uma instância de serviço sempre são executados em um único nó do pool de computação. Ou seja, uma instância de serviço nunca se estende por vários nós.
Quando você executa várias instâncias de serviço, o Snowflake pode executar essas instâncias de serviço no mesmo nó ou em nós diferentes dentro do pool de computação. Ao tomar essa decisão, o Snowflake considera quaisquer requisitos de recursos físicos especificados (como memória e GPU), conforme descrito no arquivo de especificação de serviço (consulte Campo containers.resources).

Por exemplo, suponha que cada nó do pool de computação forneça 8 GB de memória. Se a especificação do seu serviço incluir um requisito de memória 6 GB e você optar por executar duas instâncias ao criar um serviço, o Snowflake não poderá executar as duas instâncias no mesmo nó. Nesse caso, o Snowflake agenda cada instância em um nó separado no pool de computação para atender aos requisitos de memória.

Nota

O Snowflake oferece suporte a montagens de estágio para uso em contêineres de aplicativo. O estágio interno Snowflake é um dos tipos de volume de armazenamento compatíveis.

Para desempenho ideal, o Snowflake agora limita o número total de montagens de volume de estágio a oito por nó de pool de computação, independentemente de esses volumes pertencerem à mesma instância de serviço, ao mesmo serviço ou a serviços diferentes.

Quando o limite de um nó é atingido, o Snowflake não usa esse nó para iniciar novas instâncias de serviço que usam um volume de estágio. Se o limite for atingido em todos os nós no pool de computação, o Snowflake não poderá iniciar sua instância de serviço. Neste cenário, quando você executa o comando SHOW SERVICE CONTAINERS IN SERVICE, o Snowflake retorna o status PENDING com a mensagem ”Não programável devido a recursos insuficientes”.

Para acomodar esse limite de cota de montagem de estágio em um nó, em alguns casos, você pode aumentar o número máximo de nós que você solicita a um pool de computação. Isso garante que nós adicionais estejam disponíveis para o Snowflake iniciar suas instâncias de serviço.

Pools de computação do sistema¶

O Snowflake provisiona automaticamente dois pools de computação em cada conta Snowflake. Esses pools de computação são fornecidos exclusivamente para as seguintes cargas de trabalho do Snowflake.

Notebooks
Serviço de modelo
Trabalhos de ML

Ao usar pools de computação do sistema, os usuários podem executar essas cargas de trabalho sem que um administrador da conta precise configurar um pool de computação primeiro.

Os pools de computação do sistema têm a seguinte configuração padrão:

Nome do pool de computação: SYSTEM_COMPUTE_POOL_GPU
- Família de instâncias: dependendo do fato de sua conta Snowflake estar nas regiões do AWS ou do Microsoft Azure, o Snowflake usa a seguinte família de instâncias de GPU para esse pool de computação.
  - No Azure, GPU_NV_SM.
  - No AWS, GPU_NV_S.
  Observe que as seguintes regiões não são compatíveis com SYSTEM_COMPUTE_POOL_GPU:
  - No AWS: Cingapura, Suíça Norte, Paris e Osaka.
  - No Azure: US Central.
  - Google Cloud: pool de computação de GPU não está disponível.
- Configuração padrão:
  - MIN_NODES=1
  - MAX_NODES=50
  - INITIALLY_SUSPENDED=verdadeiro
  - AUTO_SUSPEND_SECS=600
Nome do pool de computação: SYSTEM_COMPUTE_POOL_CPU
- Família de instâncias: CPU_X64_S
- Configuração padrão:
  - MIN_NODES=1
  - MAX_NODES=150
  - INITIALLY_SUSPENDED=verdadeiro
  - AUTO_SUSPEND_SECS=600

Observe que:

Os pools de computação estão inicialmente em um estado suspenso e só começam a incorrer em custos quando uma carga de trabalho do Snowflake compatível começa a usá-los.
Se nenhuma carga de trabalho estiver em execução, esses pools de computação serão suspensos automaticamente após dez minutos. Para modificar a política de suspensão automática dos pools de computação padrão, use o comando ALTER COMPUTE POOL SET AUTO_SUSPEND_SECS.

Gerenciamento dos pools de computação do sistema¶

Em uma conta Snowflake, a função ACCOUNTADMIN é proprietária desses pools de computação do sistema. Os administradores têm controle total sobre os pools de computação, incluindo a modificação de suas propriedades, a suspensão de operações e o monitoramento do consumo. A função ACCOUNTADMIN pode excluir o pool de computação. Por exemplo:

USE ROLE ACCOUNTADMIN;
ALTER COMPUTE POOL SYSTEM_COMPUTE_POOL_CPU STOP ALL;
DROP COMPUTE POOL SYSTEM_COMPUTE_POOL_CPU;

Copy

Por padrão, a permissão USAGE nos pools de computação do sistema é concedida à função PUBLIC, permitindo que todas as funções da conta os utilizem. No entanto, o ACCOUNTADMIN pode modificar esses privilégios para restringir o acesso, se necessário.

Para restringir o acesso aos pools de computação do sistema a funções específicas em sua conta, use a função ACCOUNTADMIN para revogar a permissão USAGE da função PUBLIC e concedê-la às funções desejadas. Por exemplo:

USE ROLE ACCOUNTADMIN;
REVOKE USAGE ON COMPUTE POOL SYSTEM_COMPUTE_POOL_CPU FROM ROLE PUBLIC;
GRANT USAGE ON COMPUTE POOL SYSTEM_COMPUTE_POOL_CPU TO ROLE <role-name>;

Copy

Os pools de computação do sistema podem ser associados a orçamentos para gerenciamento de custos.

Configuração de seus próprios pools de computação preferidos para Notebooks¶

Por padrão, os serviços de notebook são executados em pools de computação do sistema. Se você não quer usar os pools de computação provisionados pelo Snowflake, tem a opção de escolher outros pools de computação em sua conta para notebooks. Para substituir os pools de computação provisionados pelo Snowflake, você pode definir estes parâmetros (DEFAULT_NOTEBOOK_COMPUTE_POOL_CPU e DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU). Observe que isso vai alterar sua experiência com o Snowsight. Ao criar um notebook no Snowsight, o pool de computação que você configura usando esses parâmetros aparece como a primeira preferência na UI. Os comandos de exemplo a seguir definem esses parâmetros:

Configure my_pool como o pool de computação em nível de conta preferencial para Notebooks que usam o tempo de execução da GPU.
```
ALTER ACCOUNT SET DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU='my_pool';
```
Copy
Configure my_pool como o pool de computação preferencial para os Notebooks criados no banco de dados my_db.
```
ALTER DATABASE my_db SET DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU='my_pool';
```
Copy
Configure my_pool como o pool de computação preferencial para os Notebooks criados no esquema my_db.my_schema.
ALTER SCHEMA my_db.my_schema SET DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU='my_pool';
Copy

Use os seguintes comandos para verificar a preferência atual do pool de computação de GPU configurado em sua conta para executar Notebooks:

SHOW PARAMETERS LIKE 'DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU' IN ACCOUNT;

SHOW PARAMETERS LIKE 'DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU' IN DATABASE my_db;

SHOW PARAMETERS LIKE 'DEFAULT_NOTEBOOK_COMPUTE_POOL_GPU' IN SCHEMA my_db.my_schema;

Copy

Para obter mais informações, consulte SHOW PARAMETERS.

Diretrizes e limitações¶

Permissão CREATE COMPUTE POOL: se não for possível criar um pool de computação com a função atual, consulte o administrador da conta para obter permissão. Por exemplo:
```
GRANT CREATE COMPUTE POOL ON ACCOUNT TO ROLE <role_name> [WITH GRANT OPTION];
```
Copy
Para obter mais informações, consulte GRANT <privilégios> … TO ROLE.
Limite por conta nos nós do pool de computação.
- O número máximo de nós que você pode criar em sua conta (independentemente do número de pools de computação) é limitado a 500.
- O número máximo de nós por pool de computação é 50.
Além disso, há um limite no número de nós permitidos para cada família de instância (consulte a coluna Limite de nós na tabela de famílias de instância). Se você vir uma mensagem de erro como Requested number of nodes <#> exceeds the node limit for the account, você encontrou esses limites. Para obter mais informações, entre em contato com o representante da sua conta.