MongoDB encontra duplicatas

MongoDB encontra duplicatas
“Você já ouviu falar sobre o conceito de duplicação de dados enquanto trabalhava em bancos de dados? Quando um registro, coisa, pessoa ou lugar tem sua cópia exata, diz que a cópia é a duplicata do original. Enquanto trabalhamos em bancos de dados tradicionais, usamos a cláusula WHERE para descobrir as duplicatas dentro dos registros da tabela, eu.e., SQL, PostgreSQL. Por outro lado, o MongoDB não permite que você use a cláusula WHERE para descobrir as duplicatas inseridas nas coleções de um banco de dados específico.

Ele criou a função agregada para descobrir os valores duplicados da coleção. Neste artigo hoje, discutiremos a inserção de registros duplicados nas coleções de DB de Mongo e as exibirão no shell do MongoDB usando o comando agregado das coleções. Vamos começar com o artigo de hoje pelo uso de APT Atualize e atualizar as instruções no Terminal Shell do Ubuntu 20.04 Sistema. Para isso, você precisa fazer login primeiro e abrir o shell pelo uso de “ctrl+alt+t.”Depois disso, você pode experimentar a instrução mostrada em informante em seu shell e adicionar a senha para o usuário continuar o processo de atualização.”

Pode exigir que sua confirmação continue este processo. Toque em “Y” ao perguntar: “Você quer continuar?”. Depois disso, pressione a tecla Enter.

Pode levar mais ou menos tempo para processar de acordo com a situação do seu sistema.

Após a atualização completa, você receberá as últimas linhas de processamento mostradas.

Após a atualização e atualização do sistema bem -sucedido do sistema, temos que abrir o shell do MongoDB para inserir algumas coleções e registros no banco de dados. Então, estamos usando a consulta "Mongo" para fazê -lo, conforme exibido na imagem. A concha foi preparada com sucesso.

Ao usar a instrução "db" no shell do MongoDB, descobrimos que o banco de dados "teste" está disponível para nosso uso.

Portanto, estamos usando o banco de dados "teste" para outras consultas e criando uma coleção dentro dele. Para isso, tente a instrução de "uso" seguida pelo nome de um banco de dados, eu.e., "teste.”

Para adicionar registros, precisamos de uma coleção no banco de dados de teste. Assim, precisamos criar uma nova coleção. Para isso, temos que experimentar a instrução "db" junto com a função "createCollection ()" de MongoDB, seguida pelo nome de uma nova coleção dentro de seus parênteses, i i.e., Dados. A consulta foi bem -sucedida e a coleção foi criada com sucesso, de acordo com o status "OK: 1". Além disso, MongoDB, tendemos a utilizar a função find () precedida pelo nome da coleção para exibir os registros de uma coleção específica. Portanto, tentamos a instrução "db" seguida pelo nome da coleção, eu.e., Dados e a função encontram () para fazê -lo. A coleção "dados" está vazia agora. Assim, precisamos adicionar alguns registros à coleção.

Para inserir os registros na coleta de dados do MongoDB, precisamos experimentar a função insert () dentro da instrução "db" junto com os dados na forma de documentos, i i.e., Formato da lista. Temos usado um total de 4 colunas para os dados do documento de coleções, i i.e., _id, título, idade e preço. Adicionamos um total de 5 registros para todas essas 4 colunas de coleta de dados.

O registro foi adicionado com sucesso conforme a saída acima mostra o número de registros 5 para a opção “Ninserted”. Depois disso, usaremos a função find () com a coleção "dados" para encontrar e exibir todos os registros desta coleção. Não estamos transmitindo nenhum argumento para os parênteses de uma função de find () para não restringir os registros de coleção. Todos os 5 registros para coleta de dados foram apresentados no shell de Mongo DB.

Como estamos lidando com o tópico de encontrar as duplicatas nas coleções de MongoDB, devemos ter alguns registros duplicados nas coleções também. Portanto, estamos inserindo mais três registros na coleção de dados a serem usados ​​como duplicatas de alguns dos registros já inseridos. Precisamos atualizar apenas a coluna "_id", pois o ID de qualquer coluna deve ser único no MongoDB, como costumávamos fazer nos bancos de dados tradicionais. A mesma função de inserção foi usada até agora com o nome da coleção "dados". Todos os três registros foram adicionados.

Agora, quando você executa a instrução "db" com o nome da coleção "dados" seguidos pela função find () mais uma vez no shell do MongoDB, o total de 8 registros será exibido na tela. Podemos ver os valores duplicados para colunas que não sejam "_id" neste Dados da Coleção.

É hora de experimentar o método agregate () para a coleção "dados" para listar os valores específicos da coluna que são duplicados nela. Você precisa usar a sintaxe mostrada do sol-telão de um comando agregado em mongodb. A opção "$ Grupo" é usada para adicionar todos os valores duplicados de uma coluna específica em um, enquanto a correspondência de opção $ será utilizada para descobrir os grupos com mais de 1 documento. Por outro lado, a opção "$ projeto" será usada para especificar o formato de mostrar os registros duplicados. O primeiro campo da opção "$ GROUP" especificará o nome da coluna em que procuraremos duplicatas. Um total de 3 registros foi encontrado duplicado para a coluna "Título" de uma coleção de dados. Depois disso, a mesma consulta foi tentada para a coluna "Age" e obteve os 3 resultados novamente.

Conclusão

A explicação dos registros duplicados foi dada no parágrafo introdutório, e discutimos a diferença entre descobrir as duplicatas dos bancos de dados tradicionais e MongoDB. Para esse fim, tentamos dar uma ilustração sobre fazer uma nova coleção no MongoDB e inserir registros dentro dele. Além disso, discutimos o uso da função agregada para descobrir a coluna específica que contém o valor duplicado nas coleções. Este artigo mostrou a clara diferença na descoberta dos duplicados para o MongoDB como uma comparação com qualquer outro banco de dados.