Vamos começar com o serviço Amazon EMR.
Introdução ao AWS EMR
A Amazon EMR é um serviço de gerenciamento de dados que usa várias estruturas para análise de big data, criando clusters usando instâncias do Amazon EC2 e seu fluxo de trabalho foi explicado abaixo:
Planeje e configure: Para criar um cluster EMR, o usuário precisa planejar o armazenamento necessário para gerenciar big data e escolher as estruturas para analisar o big data.
Gerenciar: Gerenciar o cluster pode ser feito conectando -se a ele e enviando os dados no cluster para verificar os resultados antes de encerrar o cluster:
Limpar: Esta etapa é para encerrar o cluster e seus recursos e é importante, pois os clusters ociosos podem custar muito ao usuário:
Nó em EMR
Um cluster EMR é uma combinação de instâncias do EC2 e cada instância é chamada de nó e seus tipos são explicados abaixo:
Nó mestre: É o nó principal ou o nó líder, responsável por gerenciar todos os recursos do cluster.
Nó central: Ele hospeda dados do Sistema de Arquivos Distribuídos (HDFS) e executa as tarefas do nó primário e o nó primário gerencia as tarefas para o nó do núcleo.
Nó de tarefa: Esses nós não hospedam dados, mas executam tarefas para nós anteriores e é um nó auxiliar, o que significa que não é obrigatório criar ao lançar o cluster EMR:
Crie o cluster EMR
Para criar um cluster no serviço EMR da AWS, vá para o painel EMR pesquisando o serviço do console da Amazon:
Nesta página, selecione “Clusters”No painel esquerdo e clique no“Criar cluster" botão:
Na página de criação do cluster, clique no “Vá para opções avançadas" link:
Configuração de software: Na página de configurações avançadas, o usuário pode escolher várias estruturas de processamento de dados de código aberto, e o serviço também oferece a criação de vários nós na instância do EC2:
Configuração de hardware: Nesta página, o usuário pode configurar os recursos necessários para o cluster EMR disponível na nuvem:
Nós de cluster e instâncias: Esta seção oferece ao usuário para configurar os tipos de nós que criarão as instâncias do EC2 tendo recursos configurados:
Segurança: Na última página, selecione o arquivo de par de chaves privadas do EC2, que pode ser criado na página do par de chaves do painel EC2 para conectar -se aos nós:
O cluster EMR será exibido em sua página:
Você criou com sucesso um cluster EMR na AWS.
Conclusão
O serviço AWS EMR é usado para criar clusters para planejar o armazenamento para o big data a ser usado com a ajuda do sistema de arquivos distribuído. Cada cluster é criado com vários nós (instâncias EC2) anexadas a ele, que podem criar e se conectar à máquina virtual em branco na nuvem. Esses clusters podem ser usados para gerenciar big data na nuvem sem que nenhum recurso seja usado do seu sistema.