Comando Linux Uniq

Comando Linux Uniq
Um aplicativo de texto Linux chamado Uniq pesquisa as linhas duplicadas em um arquivo. Em termos mais simples, o Uniq é uma ferramenta que ajuda a identificar e eliminar todas as linhas duplicadas de um arquivo. O comando Uniq nos dá acesso a várias bandeiras distintas, incluindo "-c", "-u", "-d", "-d" e "-i", entre outros, para realizar várias operações. Ao empregar essas opções de comando Uniq, podemos exibir o número de palavras em qualquer linha, imprimir apenas as linhas que são repetidas ou mostrar o conteúdo exclusivo do arquivo. Falaremos sobre alguns dos sinalizadores de comando da Uniq neste artigo.

Exemplo: Utilizando o comando Linux Uniq

Neste exemplo, usamos o comando "Uniq" do sistema operacional Linux. Este comando é usado para condensar ou resumir a informação. O comando "Uniq" é usado para localizar as linhas repetitivas que se seguem. Vamos apenas começar a execução do comando uniq. No entanto, antes de fazê -lo no terminal, devemos primeiro criar um arquivo de texto. Como o arquivo de texto já existe em nossa área de trabalho, usaremos isso. O “arquivo de texto.txt ”é o nome do arquivo que já está em nossa área de trabalho. A extensão do arquivo de texto deve ser “.TXT".

O comando "CAT", que é frequentemente usado no Linux, é usado para abrir este arquivo de texto no terminal que contém alguns dados. Os dados do arquivo são extraídos e seu conteúdo é emitido. Isso facilita a fusão, a leitura e a criação dos arquivos. Portanto, digitamos “gato” primeiro, seguido pelo nome do arquivo que é “TextFile.TXT".

omar@omar-virtualbox: ~/desktop $ cat textfile.TXT

Agora, como você pode ver, quando executamos este comando, os dados do arquivo atualmente existente no arquivo de texto chamado “TextFile.txt ”é exibido na janela do terminal. Este arquivo tem nove linhas. Os dois primeiros são idênticos e carregam as informações “Alex gosta de codificar com várias tecnologias”. A próxima linha está vazia, e a quarta e a quinta linhas incluem as mesmas informações, incluindo “trabalhar com linguagens de script é meu interesse”. As duas últimas linhas têm duas linhas separadas que são "algumas das linguagens de programação são" java "," oop "," php "," c ++ "," python ", etc. e “A linguagem usada para criar programas de computador é chamada de linguagem de programação.”Agora, é evidente que as duas primeiras linhas são idênticas e repetidas, pois as duas seguintes. Embora as duas últimas linhas tenham conteúdo diferente, usamos o comando "Uniq" para remover as linhas duplicadas do arquivo.

Alex gosta de codificar com várias tecnologias.
Alex gosta de codificar com várias tecnologias.
Trabalhar com linguagens de script é meu interesse.
Trabalhar com linguagens de script é meu interesse.
Algumas das linguagens de programação são Java, OOP, PHP, C ++, Python, etc.
A linguagem usada para criar programas de computador é chamada de linguagem de programação.

Agora, vamos apenas usar o comando Uniq para excluir a linha duplicada do arquivo. Para fazer isso, execute o seguinte comando no terminal. Em seguida, insira a palavra -chave “Uniq” seguida pelo “TextFile.Nome do arquivo txt ”.

omar@omar-virtualbox: ~/desktop $ uniq textfile.TXT

Como visto no seguinte, quando executamos este comando, ele não exibe as linhas duplicadas na saída na janela do terminal. Existem nove linhas no arquivo original. Mas depois de aplicar o comando uniq, existem apenas seis. Isso ocorre porque a primeira linha, "Alex gosta de codificar com várias tecnologias", aparece duas vezes no arquivo original, mas apenas uma vez depois de aplicar o comando Uniq. A segunda linha aparece duas vezes no arquivo original, mas apenas uma vez depois de aplicar o comando Uniq. As duas últimas linhas são apresentadas exatamente como são porque não repetem no arquivo.

Alex gosta de codificar com várias tecnologias.
Trabalhar com linguagens de script é meu interesse.
Algumas das linguagens de programação são Java, OOP, PHP, C ++, Python etc.
A linguagem usada para criar programas de computador é chamada de linguagem de programação.

Usando as opções do comando Uniq

O comando Uniq nos oferece algumas opções diferentes, como "-c", "-d", "-u", etc. Para realizar as várias tarefas. Podemos contar o número de linhas repetidas que estão contidas nos arquivos usando as opções do comando uniq. Só podemos exibir as linhas repetidas dos arquivos na saída, etc. Vamos utilizar alguns dos seguintes sinalizadores seguintes do comando do UNIQ:

Contando o número de linhas com a bandeira "-C"

O número de linhas no arquivo é contado usando a bandeira "-C" da função Uniq. Ele conta as linhas repetidas, bem como as linhas únicas e exibe a ocorrência de cada linha, exibindo um número como um prefixo com a linha. Para conseguir isso, usamos o comando em que primeiro inserimos a palavra "Uniq", depois a opção "-c" e depois o nome do arquivo, "TextFile.TXT".

omar@omar -virtualbox: ~/desktop $ uniq -c textfile.TXT

A saída deste comando mostra a repetição das linhas, mostrando o número como seu prefixo. Por exemplo, a linha "Alex gosta de codificar com várias tecnologias" aparece duas vezes no arquivo. Então, o número "2" é mostrado na frente dele. Da mesma forma, a linha “Trabalhar com linguagens de script é meu interesse” aparece duas vezes no arquivo também. As linhas restantes são usadas apenas uma vez e "1" é mostrado como o prefixo.

2 Alex gosta de codificar com várias tecnologias.
1
2 Trabalhar com linguagens de script é meu interesse.
1
1 Algumas das linguagens de programação são Java, OOP, PHP, C ++, Python etc.
1
1 O idioma usado para criar programas de computador é chamado de linguagem de programação.

Usando a bandeira "-d" para imprimir as linhas repetidas

Nesta parte, as linhas repetidas no arquivo são exibidas usando a opção "-d" do comando Uniq. Para isso, usamos o comando em que primeiro entramos na palavra "uniq", depois a opção "-d" e depois o "TextFile.txt ”nome do arquivo.

omar@omar -virtualbox: ~/desktop $ uniq -d textfile.TXT

Somente as linhas que se repetem são apresentadas na saída que segue a execução deste comando. As outras linhas, que são usadas apenas uma vez, não são mostradas.

Alex gosta de codificar com várias tecnologias.
Alex gosta de codificar com várias tecnologias.
Trabalhar com linguagens de script é meu interesse.
Trabalhar com linguagens de script é meu interesse.

Usando a bandeira -u do comando uniq

A opção "-u" do comando Uniq agora é usada para imprimir o conteúdo exclusivo do arquivo, usando esta opção. Ele exibe as linhas ou conteúdo do arquivo na saída que é usada apenas uma vez. O texto repetido no arquivo não é exibido na saída; é excluído. Somente a bandeira "-u" é usada no lugar da seguinte opção. Caso contrário, o comando é o mesmo que o que é usado no exemplo anterior.

omar@omar -virtualbox: ~/desktop $ uniq -u textfile.TXT

Quando executamos este comando, a saída é a seguinte. As linhas repetidas dos arquivos são removidas e o conteúdo exclusivo do arquivo é revelado. Esta saída inclui as duas linhas mostradas na seguinte demonstração; Ambas as linhas são usadas apenas uma vez no arquivo, e é por isso que elas aparecem.

Algumas das linguagens de programação são Java, OOP, PHP, C ++, Python etc.
A linguagem usada para criar programas de computador é chamada de linguagem de programação.

Conclusão

O comando Linux Uniq, que é usado para eliminar o conteúdo duplicado dos arquivos e o exibe apenas uma vez na saída usando a palavra -chave "Uniq" com o arquivo de texto fornecido neste artigo. Nos exemplos dados, usamos os sinalizadores de comando da Uniq que são "-c", "-u" e "-d". Essas bandeiras nos permitiram realizar as várias operações com o comando Uniq. Neste artigo, demonstramos repetidamente que uma linha é repetida prefixando a linha com um número. Além disso, examinamos como utilizar esses marcadores para imprimir apenas as linhas repetidas e o conteúdo exclusivo.