Espaço de Whitesp Awk Trim

Espaço de Whitesp Awk Trim

“Ao trabalhar na indústria de TI, você pode encontrar milhares de arquivos contendo muitas linhas de código ou enormes quantidades de dados. Embora os dados em si possam ser um fator que contribui para o tamanho do arquivo, os espaços em branco também compõem o tamanho. Com o aumento do tamanho do arquivo, você pode ter problemas ao armazenar esses arquivos ou transferi -los para seus colegas. Portanto, é imperativo que você os remova para controlar melhor o tamanho do arquivo, mas primeiro, vamos dar uma olhada para entendê -los em detalhes.”

O que é um espaço em branco?

O espaço em branco é o espaço entre dois caracteres imprimíveis. Pode estar dentro de uma linha horizontal ou separando verticalmente. Em outras palavras, espaço entre palavras, linhas em branco, tag nbsp junto com guias podem ser consideradas como brancos. Os espaços em branco no início e/ou no final das linhas também são considerados espaços em branco.

Para preservar a sanidade dos dados, os programadores acabam escrevendo o código responsável por remover esses espaços em branco ao armazenar dados. Os seguintes casos podem solicitar a remoção de espaços em branco:

  • Código fonte de reformatação/refatoração
  • Limpe os dados
  • Simplifique quaisquer saídas de linha de comando
  • Reduzir o tamanho do arquivo

É possível remover manualmente os espaços de branco se houver um punhado de linhas de dados no arquivo. Mas, quando o arquivo contém centenas de linhas, pode se tornar muito difícil removê -las manualmente. Para superar isso, podemos empregar as muitas ferramentas de linha de comando disponíveis para nós, e.g., sed, corte, tr e awk. Destes, Awk é o comando mais poderoso. Vamos explorar ainda mais.

O que é estranho?

AWK é uma linguagem de script muito poderosa usada para manipulação de dados e geração de relatórios. O comando AWK é a abreviação das primeiras iniciais de cada um dos três criadores Aho, Weinberger e Kernighan. A Awk capacita seus usuários a definir variáveis, cordas, funções numéricas e operadores aritméticos, além de criar relatórios formatados, entre muitos outros.

Neste artigo, exploraremos usando o comando AWK para aparar os espaços em branco de seus arquivos. Depois de passar pelo guia, você saberá como:

  • Apare todos os espaços em branco em qualquer arquivo.
  • Apare os espaços em branco e a direita.
  • Apare todos os principais espaços de branco.
  • Aparar todos os espaços de brancos à direita.
  • Substitua vários espaços por um único espaço.

Os cenários demonstrados neste artigo são realizados no Ubuntu 22.04 sistema de água -viva Jammy. Esses comandos também são executados em outras distribuições também.

Arquivo de amostra

Para este guia, usaremos um arquivo de texto chamado “ASD.TXT". O conteúdo de espaço reservado do arquivo de amostra é assim:

Agora, vamos começar.

Como visualizar todos os espaços em branco em seu arquivo?

Para entender melhor os espaços em branco, vamos primeiro ver como podemos identificar os espaços em branco em um arquivo. Para isso, você precisa canalizar a saída do comando CAT através do comando TR como tal:

$ CAT ASD.txt | tr “” “*” | tr “\ t” “&”

Este comando substituirá espaços por asteriscos e guias espaços com o "&" símbolo. Assim que isso for executado, você poderá ver todos os espaços de branco em seu arquivo como tal:

Agora vamos explorar o uso do comando AWK.

Aparando todos os espaços em branco

Para o nosso primeiro cenário, removemos todos os espaços de branco do nosso arquivo de amostra. Para conseguir isso, precisamos colocar a saída do comando CAT para o comando AWK como tal:

$ CAT ASD.txt | awk 'gsub ( / /, ""); imprimir '

Aqui:

  • GSUB significa substituição global, usada para substituir os espaços em branco.
  • Os corte duplos para a frente ( / /) representam o espaço em branco.
  • “” As aspas duplas são usadas para aparar as cordas.

Então, com o comando acima, estamos substituindo todos os espaços de branco ( / /) por nada (""). Com a saída do comando acima, você pode ver que todos os espaços em branco foram removidos.

Aparando os espaços de braçadeira de liderança e à direita do seu documento

Desde a última saída, podemos ver que os espaços em branco foram removidos, deixando para trás guias e linhas vazias. Podemos atualizar o comando usado no último exemplo para cuidar dos espaços de brancos principais e à direita, juntamente com as guias como tal:

$ CAT ASD.txt | awk 'gsub (/^[\ t]+| [\ t]+$/, ""); imprimir '

Usando elementos do comando anterior, você pode verificar se os espaços de branco principal e à direita foram removidos.

$ CAT ASD.txt | awk 'sub (/^[\ t]+| [\ t]/, ""); Imprimir '| tr "" "*" | tr "\ t" "e"

Aqui estão os comandos que você pode usar para remover esses espaços separadamente, respectivamente.

Removendo apenas os principais espaços de branco

$ CAT ASD.txt | awk 'sub (/^[\ t]+/, ""); imprimir '

Removendo apenas espaços em branco à direita

$ CAT ASD.txt | awk 'sub (/[\ t]+$/, ""); imprimir '

Bônus: substitua vários espaços por um único espaço

Para substituir vários espaços por um único ou nada, você pode usar o comando AWK como tal:

$ CAT ASD.txt | awk 'gsub (/[]+/""); imprimir '

Usando o comando TR, podemos ver que os espaços em branco foram removidos.

Conclusão

Então, com essas demonstrações, exploramos várias maneiras pelas quais podemos usar o comando AWK para aparar os espaços em branco. Removê -los pode ser útil por vários motivos.

Se você tiver algum problema usando -o, sinta -se à vontade para nos alcançar usando a seção de comentários abaixo e ficaremos felizes em ajudar.