Ao usar trabalhos de ETL, os usuários também podem construir e monitorar os pipelines de dados através dos quais os dados extraídos são transferidos. A AWS Glue se integra a serviços como Amazon S3, Amazon DynamoDB, Amazon Redshift e Amazon RDS para extrair e mover dados.
Este artigo descreverá os seguintes aspectos da AWS Glue:
Quais são os componentes da cola da AWS?
A seguir, alguns componentes da AWS Glue que funcionam em coordenação para executar várias tarefas:
Console de cola da AWS: O AWS Glue Console define o fluxo de trabalho ETL e chama operações de API em outros componentes da AWS Glue para executar diferentes tarefas como executar e agendar rastreadores, criar tabelas, configurar as conexões, etc.
Catálogo: Catálogo de dados da AWS Glue é a loja de metadados da nuvem da AWS. Em cada conta da AWS, toda região da AWS possui um catálogo de dados de cola já criado. Nos catálogos de dados, tabelas que contêm dados de diferentes serviços como a AWS RDS são armazenadas de forma organizada.
Rastreadores e classificadores: Os rastreadores podem digitalizar os dados de todos os tipos de repositórios na AWS. Através de rastreadores, os usuários podem criar bancos de dados para organizar as tabelas de dados dos dados extraídos na cola da AWS, para que os dados pareçam limpos e organizados.
Operações de ETL: O usuário pode "extrair" os dados de um serviço e "transformar" os dados (por exemplo, extrair dados brutos e transformá -los em uma forma limpa, categorizando -os em diferentes conjuntos de dados) e depois "carregar" os dados ou fazer esses dados acessível para os serviços que fila e analisam os dados.
ETL Jobs: AWS GULE ETL Jobs Gerenciar o fluxo de trabalho ETL por meio de algumas configurações. Os usuários podem agendar trabalhos de ETL para o fluxo de dados e acionar o trabalho em eventos específicos, como quando novos dados são movidos, uma tabela de dados é excluída, etc.
Qual é a importância da cola da AWS?
A AWS Glue é popular por vários motivos, incluindo o seguinte:
Como usar a AWS cola?
O uso da cola da AWS é muito simples. Abra o serviço "AWS Glue" depois de fazer login no console da AWS. No menu do lado esquerdo do console da AWS Glue, haverá uma lista de opções que tornam a funcionalidade do serviço de cola da AWS mais compreensível. O usuário pode executar qualquer trabalho ETL (Extrair, Transformar e Carregar) na cola da AWS:
Por exemplo, selecionamos a opção "Banco de dados" para criar um banco de dados na cola da AWS ou acessar um banco de dados criado em qualquer outro serviço da AWS:
Da mesma forma, os usuários podem criar rastreadores na AWS:
Se abrirmos os detalhes de algum dos rastreadores criados, ele exibe sua fonte de dados. Aqui, fica claro que os dados são acessados a partir de um balde criado no serviço AWS S3:
Explicado acima era tudo sobre cola da AWS, seus componentes, importância e uso.
Conclusão
AWS Glue é o serviço de integração de dados sem servidor da AWS que move os dados entre serviços, aplicativos e componentes de software da AWS. Os dados são extraídos e depois transferidos após a modificação para outro serviço com eficiência usando recursos da AWS Cloud. Este serviço AWS confiável e escalável também é fácil de usar e é preferido em outras plataformas com as mesmas funcionalidades devido a seus recursos vastos e utilizáveis e custo-efetividade.