Todos os dias, as pessoas lidam com dados enormes que chamamos de big data. Nesse big data, às vezes contém nomes de colunas ou às vezes sem os nomes das colunas. Os nomes das colunas estão lá, mas eles contêm nome irrelevante ou alguns personagens indesejados, como espaços, etc. Então, primeiro precisamos pré-processar esses dados enormes antes de iniciar a análise. Então, antes de tudo, exigimos a renomeação dos nomes das colunas.
Quadro de dados são dados tabulares orientados para a linha que possuem linhas e colunas. Também podemos dizer que o DataFrame é uma coleção de colunas diferentes e cada coluna é de diferentes tipos como string, numérico, etc.
$ pandas.Quadro de dados
A Pandas Quadro de dados pode ser criado usando o seguinte construtor
$ pandas.Dataframe (dados = nenhum, index = nenhum, colunas = nenhum, dtype = nenhum, cópia = false)
Método 1: Usando a função renome ():
Sintaxe:
df.Renomear (colunas = D, inplace = false)
Criamos um Quadro de dados (df), que usaremos para mostrar diferentes métodos de renomeação ().
No acima Quadro de dados, Podemos ver que temos quatro colunas ['Nome', 'idade', 'favorito_color', 'grau'].
Os pandas têm uma função embutida chamada renome () que pode alterar o nome da coluna instantâneo. Para usar isso, temos que passar uma chave (o nome original da coluna) e o valor (o novo nome da coluna) para a função de renomeação sob o atributo da coluna. Também podemos usar outra opção no local para o verdadeiro que muda diretamente para o existente Quadro de dados Por padrão, em lugar é falso.
Do resultado acima, podemos ver que os nomes das colunas mudaram.
Método 2: Usando o método da lista
Pandas Quadro de dados também deu uma coluna de nome de atributo que nos ajuda a acessar todos os nomes de colunas de um Quadro de dados. Portanto, usando este atributo deste colunas, também podemos renomear o nome da coluna. Temos que passar em uma nova lista de colunas e atribuir ao atributo colunas como mostrado abaixo:
A principal desvantagem de usar o método da lista para renomear o nome de uma coluna é que precisamos passar todos os nomes de colunas, mesmo que queremos alterar apenas alguns nomes de colunas.
Método 3: Renomeie o nome da coluna usando o arquivo read_csv
Também podemos renomear as colunas durante o próprio read_csv. Para isso, temos que criar uma lista de colunas e passar essa lista como um parâmetro para o atributo de nomes ao ler o CSV.
Usamos o cabeçalho de um atributo = 0, o que significa que substituímos as colunas anteriores do .Arquivo CSV com as novas colunas que passamos pelo atributo de nomes.
No acima .Método CSV, renomeamos as colunas enquanto usamos a lista e passamos todas as novas colunas dentro dessa lista. Mas às vezes, precisamos renomear apenas algumas colunas. Em seguida, temos que usar o atributo USECOLS e mencionar os valores do índice dessas colunas dentro daquele como mostrado abaixo:
No exposto, renomeamos apenas a primeira e a última coluna do arquivo CSV e, por isso, passamos os valores do índice das colunas (0 e 3) para o atributo USECOLS.
Método 4: Usando as colunas.str.substituir()
Este método é basicamente usado quando queremos alterar algumas frases para algumas outras frases e não queremos mudar a renomeação completa da coluna como o espaço para sublinhado, etc.
Do resultado acima, podemos ver que agora os espaços são substituídos com o sublinhado.
O método acima também tem a instalação do índice (df.índice.str.substituir()).
Método 5: renomear colunas usando set_axis ()
Este método é usado para renomear o índice junto com a coluna, como mostrado abaixo:
Conclusão
Neste artigo, mostramos métodos diferentes sobre como renomear as colunas. O melhor método que considero é o método renome () em que temos que passar apenas aquelas colunas que queremos renomear no formato Dicionário (Key, Value). O atributo das colunas é o método mais fácil, mas a principal desvantagem disso é que temos que passar por todas as colunas, mesmo que queira renomear apenas algumas colunas. Também podemos renomear colunas enquanto lê o próprio arquivo CSV, o que também é uma boa opção. As colunas.str.substituir () é a melhor opção apenas quando queremos substituir alguns caracteres por outros personagens.