Colunas de pandas

Colunas de pandas
Uma grade retangular chamada DataFrame de pandas é usada para armazenar dados. Os dados que são salvos em um quadro de dados são simples de visualizar e manipular. O DataFrame pode consistir em várias linhas e colunas. Cada linha representa uma medição de uma única instância, enquanto cada coluna é um vetor que contém os dados de um atributo específico ou variável. As linhas de quadro de dados podem ter dados heterogêneos ou homogêneos em uma determinada linha, mas cada coluna DataFrame contém dados homogêneos em qualquer coluna de qualquer coluna. Os eixos de um quadro de dados em pandas são rotulados, ao contrário dos de uma matriz bidimensional. Neste artigo, discutimos os vários métodos para adicionar, modificar e excluir as colunas ou valores de pandas nas colunas de um quadro de dados em pandas. Isso pode ser feito através de vários métodos. Vamos ver alguns desses métodos em detalhes.

Como adicionar colunas ou valores a uma coluna em pandas

As colunas podem ser adicionadas a um quadro de dados usando os vários métodos. No exemplo a seguir, usamos as funções Apply () e Insert () para adicionar colunas ao nosso quadro de dados.

Exemplo 1: Adicione coluna ao DataFrame usando a função Aplicar ()
Você pode adicionar várias colunas a um quadro de dados usando os pandas.Quadro de dados.Atribuir () método. Primeiro, criamos uma amostra de quadro de dados usando o PD.DataFrame () Função com algumas linhas e colunas. A biblioteca "pandas" é importada primeiro para criar o quadro de dados de pandas.

Criamos o quadro de dados "df" passando um dicionário com duas chaves - "C1" e "C2" - com valores ["a", "b", "c"] e ["d", "e", "f" f ”] Respectivamente. Passando o dicionário em PD.DataFrame, as chaves se tornam o rótulo de colunas e os valores na lista se tornam os dados de cada célula em colunas do DataFrame.

Como pode ser visto, criamos um quadro de dados com duas colunas agora. Usando a função Atribuir (), adicionamos mais colunas ou colunas ao nosso quadro de dados "df".

A função fornece um novo DataFrame "new_df" que contém a coluna adicional (recém -adicionada "C3") e todas as colunas antigas ("C1" e "C2") como resultado. Lembre -se de que, se alguma coluna atual for transferida, todas elas serão substituídas.

Exemplo 2: Adicione a coluna ao DataFrame usando a função insert ()
O “DataFrame.O método insert () ”também pode ser usado para adicionar colunas a um quadro de dados. Vamos primeiro criar um quadro de dados com algumas linhas e colunas.

Para exibir nossa estrutura de dados "df", a função print () é usada.

Nosso DataFrame tem duas linhas - A e B - com valores ["1", "2", "3"] e ["4", "5", "6"], respectivamente, respectivamente. Agora, usamos o método insert () para adicionar outra coluna no quadro de dados "df".

Antes de usar a função insert (), criamos uma lista com valores ["7", "8", "9"]]. A indexação de colunas do DataFrame começa em zero. Quando aplicamos a função insert () com o quadro de dados "df", especificamos o índice 1 para colocar a nova coluna "c". Também passamos a lista de "valores" nos parâmetros da função insert () para armazenar os valores da coluna "c".

Você pode notar que nossa nova coluna é adicionada no 2nd Localização da coluna entre "A" e "B" porque especificamos o índice "1" nos parâmetros da função insert ().

Como selecionar colunas em pandas

As colunas podem ser selecionadas por suas posições de índice, etiquetas ou tipos de dados. Veremos como selecionar as colunas específicas e múltiplas nos exemplos a seguir.

Exemplo 1: Selecione uma coluna específica usando os nomes/etiquetas da coluna
Criamos uma amostra de dados de dados para mostrar como você pode selecionar uma coluna específica do DataFrame.

Criamos o quadro de dados com colunas "col1" e "col2". A maneira mais simples de obter uma coluna de dados de dados específica é escrever o nome da coluna como uma string com citações entre parênteses [].

No quadro de dados fornecido, temos duas colunas numéricas - "Col1" e "Col2" - com os valores (3, 1, 5) e (7, 2, 6), respectivamente, respectivamente.

Ao usar uma lista com vários nomes das colunas de dados dentro dos colchetes "[]", você pode selecionar várias colunas.

Como pode ser visto, passamos por uma lista contendo nomes de colunas "col1" e "col2" entre os colchetes.

Exemplo 2: Selecione uma coluna específica por seu tipo de dados
Criamos um DataFrame com colunas com diferentes tipos de dados.

A coluna "nome" armazena os nomes das pessoas ("Tim", "Alex", "Joe", "Rick"). Enquanto a coluna "idade" armazena as idades das pessoas (12, 11, 11, 13). Vamos verificar os tipos de dados de nossas colunas de dados de dados usando o atributo "dtypes".

O tipo de dados da coluna "Nome" é "Objeto" e "Int64" é o tipo de dados da coluna "Age". Agora, selecionamos as colunas pelo seu tipo de dados usando a função "loc []".

Dentro do df.Função [], especificamos os dtypes == 'Int64'. Os valores são retornados onde o tipo de dados é 'int64' usando o “.valores ”atributo com df.loc [:, (df.dtypes == 'int64') função.

Exemplo 3: Selecione várias colunas por seus índices
Criamos uma nova amostra de quadro de dados para mostrar como selecionar várias ou todas as colunas do quadro de dados usando o método "iloc []".

Desde que criamos nosso DataFrame, agora usamos o método ILOC [] para selecionar várias colunas do nosso DataFrame. Quando uma única coluna é selecionada, o método iloc [] retorna um objeto de série. Quando mais de 1 coluna é selecionada, um quadro de dados de pandas é retornado.

Especificamos a faixa de índice de colunas de 0 a 3. Observe que a coluna no índice 3 não faz parte do grupo. Somente as colunas do índice 0 a 2 são selecionadas.

Como pode ser visto, as colunas "W", "X" e "Y" são selecionadas especificando o intervalo 0: 3.

Como alterar os nomes e valores das colunas

No exemplo a seguir, alteraremos os nomes das colunas usando a função renome () e a alteração dos valores usando a função substituir ().

Exemplo 1: Altere o rótulo da coluna usando a função renome ()
Primeiro, criamos um quadro de dados com uma ou mais colunas.

Depois que o DataFrame for criado, podemos renomear sua coluna usando a função Pandas Rename (). Dentro da função renome (), usamos um dicionário como original_label: new_label. E especificamos o rótulo atual e o novo rótulo (que queremos adicionar).

Como você pode observar, mudamos o nome da coluna "A" para "Nome" e o nome da coluna "B" para "Assunto".

Exemplo 2: Altere os valores da coluna usando a função Substituir ()
Criamos um quadro de dados com o número de colunas que armazenam valores. Em seguida, modificamos os valores das colunas usando a função Substituir ().

Desde que criamos nosso quadro de dados, vamos agora alterar os valores de sua coluna usando a função substituir (). O método substituir () troca o valor na coluna DataFrame com o novo valor especificado.

A função substitui () substituiu o valor da coluna “X” da coluna “5” a 9.

Como remover as colunas de pandas

As colunas DataFrame podem ser excluídas usando o método Drop () e Del em pandas.

Exemplo: Excluindo uma coluna de um quadro de dados de pandas
Vamos criar um quadro de dados primeiro a partir do qual excluiremos as colunas específicas usando os métodos Drop () e Del.

Temos um DataFrame "DF" com 4 colunas ("A", "B", "C", "D"). O método Drop () do DataFrame () exclui as linhas ou colunas com base nos eixos correspondentes e na coluna especificada (rótulo) nomes. Vamos excluir a coluna “A” usando a função Drop ().

O eixo = 1 indica que estamos removendo a coluna, não a linha.

A função DROP () removeu com sucesso a coluna "A". Agora, vamos usar o método "del" na coluna "D".

A coluna "D" é removida do DataFrame usando o método "del".

Conclusão

Neste tutorial, discutimos o que são colunas no quadro de dados do pandas. Usamos as diferentes funções para adicionar, modificar e excluir colunas de nosso quadro de dados. Este tutorial foi projetado para ensinar as diferentes operações que você pode executar na coluna de um quadro de dados em pandas. Implementamos vários exemplos para ensinar como você pode adicionar colunas ou valores em uma coluna, como selecionar colunas, como alterar os nomes e valores das colunas e como excluir a coluna de um quadro de dados pandas.