Snowpark Migration Accelerator: Configuração passo a passo¶
Este guia oferece experiência prática com o Snowpark Migration Accelerator (SMA). Por meio de exemplos do mundo real, você aprenderá a avaliar o código e a interpretar os resultados da avaliação, o que lhe dará uma compreensão clara dos recursos da ferramenta.
Materiais¶
Para concluir este tutorial, você precisará do seguinte:
Um computador que tenha o software Snowpark Migration Accelerator (SMA) instalado
Acesso aos arquivos de código de amostra no mesmo computador
Para começar, você precisará de dois itens em seu computador:
A ferramenta Snowpark Migration Accelerator (SMA)
Amostras de código
Vamos explicar como obter esses recursos essenciais.
Aplicativo SMA¶
O Snowpark Migration Accelerator (SMA) ajuda os desenvolvedores a converter seus aplicativos PySpark e Spark Scala para serem executados no Snowflake. Ele detecta automaticamente as chamadas do Spark API em seu código Python ou Scala e as transforma em chamadas equivalentes do Snowpark API. Este guia demonstrará a funcionalidade básica do SMA, analisando exemplos de código do Spark e mostrando como ele ajuda nos projetos de migração.
Durante a fase de avaliação inicial, o Snowpark Migration Accelerator (SMA) examina seu código-fonte e cria um modelo detalhado que captura toda a funcionalidade do seu código. Com base nessa análise, o SMA cria vários relatórios, inclusive um relatório de avaliação detalhado que analisaremos neste passo a passo. Esses relatórios ajudam a entender o quanto o seu código está pronto para a migração para o Snowpark e a estimar o esforço necessário para a transição. Analisaremos essas descobertas com mais detalhes à medida que prosseguirmos com este laboratório.
Download e instalação¶
Para iniciar uma avaliação com o Snowpark Migration Accelerator (SMA), você só precisa concluir o processo de instalação. Embora a Snowflake ofereça um treinamento útil opcional sobre o uso do SMA, você pode prosseguir sem ele. Não são necessários códigos de acesso especiais. Simplesmente:
Visite a seção Download e acesso
Siga as instruções de instalação em Snowpark Migration Accelerator: Instalação para configurar o aplicativo em seu computador
Exemplo de base de código¶
Este guia usa exemplos de código Python para demonstrar o processo de migração. Selecionamos duas bases de código de amostra disponíveis publicamente em repositórios Git de terceiros como exemplos imparciais do mundo real. Você pode acessar essas bases de código em:
Exemplos de engenharia de dados PySpark: https://github.com/spark-examples/pyspark-examples
Exemplos de aprendizado de máquina do Apache Spark: https://github.com/apache/spark/tree/master/examples/src/main/python
Para analisar bases de código usando o Snowpark Migration Accelerator (SMA), siga estas etapas:
Faça o download das bases de código como arquivos zip em GitHub. Você pode encontrar instruções sobre como fazer isso na documentação do GitHub.
Crie pastas separadas em seu computador para cada base de código.
Extraia cada arquivo zip em sua pasta designada, conforme mostrado na imagem abaixo:
Esses exemplos de bases de código demonstram como o SMA avalia as referências do Spark API para calcular a Pontuação de preparação do Spark API. Vamos analisar dois cenários:
Uma base de código que recebeu uma pontuação alta, indicando que é altamente compatível com o Snowpark e está pronta para a migração
Uma base de código que recebeu uma pontuação baixa, indicando que requer revisão adicional e possíveis modificações antes da migração
Embora a pontuação de preparação forneça informações valiosas, ela não deve ser o único fator considerado ao planejar uma migração. Para garantir uma migração bem-sucedida, é necessária uma avaliação abrangente de todos os aspectos, tanto para as avaliações com pontuação alta quanto para as com pontuação baixa.
Após descompactar os diretórios, o SMA analisará apenas os arquivos que usam formatos de código e de notebook compatíveis. Esses arquivos são verificados quanto a referências ao Spark API e a outras APIs de terceiros. Para ver quais tipos de arquivos são compatíveis, consulte a lista aqui.
Durante o restante deste passo a passo, analisaremos como essas duas bases de código são executadas.
Suporte¶
Para obter ajuda com a instalação ou para ter acesso ao código, envie um e-mail para sma-support@snowflake.com.
Depois de fazer o download e descompactar as bases de código em diretórios separados, você pode:
Vá para executar a ferramenta
Revise [as notas de preparação de código] (notes-on-code-preparation.md)