Pandas Reindex

Pandas Reindex

“Em“ Pandas ”, podemos armazenar muitas informações em forma de tabular, que também é conhecida como DataFrame. Os "pandas" nos facilitam com o método "dataframe ()" para construir o quadro de dados. O DataFrame contém índices e também podemos alterar os índices do DataFrame, utilizando as funções "pandas". O método que utilizamos para a reindexação do DataFrame é o método "reindex ()". Este método ajuda a alterar os valores do índice da linha, bem como os valores do índice das colunas. Ao utilizar esse método, podemos alterar o índice padrão do DataFrame e também podemos alterar o índice que definimos ao criar o DataFrame. Usaremos o método "reindex ()" em nossos exemplos de "pandas" neste tutorial e explicaremos esse conceito em profundidade aqui.”

Exemplo # 01

A ferramenta “Spyder” nos ajuda a desenvolver o código “Pandas” aqui neste tutorial, e iniciamos nosso código com a palavra -chave “importação”, o que ajudará a importar a função “pandas”. Colocamos "pandas como PD" depois de digitar a "importação". Depois disso, criamos o quadro de dados digitando “PD.Quadro de dados()". Escrevemos este "PD" aqui porque o "DataFrame ()" é o método de "pandas". O "value_df" é o nome da variável na qual o DataFrame é salvo. Adicionamos "RandomName", que é o nome da coluna, e o "nome randomname" contém "Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander e Samuel".

Em seguida, temos "Value_1", no qual inserimos "16, 29, 24, 35, 44, 50, 69, 74 e 88". Depois vem "Value_2" e adicionamos "25, 38, 42, 56, 54, 65, 78, 89 e 99". Agora, o “value_3” vem a seguir e colocamos “36, 48, 52, 69, 74, 75, 87, 91 e 69” nele. A coluna “Value_4” está presente depois disso, onde inserimos “52, 64, 72, 88, 82, 95, 97, 21 e 39”. A última coluna é a coluna “Value_5” aqui e, nesta coluna, os valores que adicionamos são “66, 78, 82, 99, 34, 45, 57, 61 e 89”. Depois disso, usamos a função "print ()" na qual "valores_df" é adicionado. Ele vai imprimir no terminal.


Depois de pressionar "Shift+Enter", podemos facilmente obter o resultado de nossos códigos no aplicativo "Spyder". Aqui, este código retorna o quadro de dados com o índice padrão. Agora, aplicaremos o método "reindex ()" para reindexar esse quadro em "pandas".


A função "reindex ()" é usada aqui para reindexar o valor do índice da linha. No quadro de dados acima, você pode ver que os valores de índice padrão da linha são exibidos e agora estamos aplicando o método "reindex ()" para reindexar esses índices de linha. Colocamos o nome do DataFrame e, em seguida, o método "reindex ()" no qual colocamos os valores de índice que queremos adicionar ao DataFrame acima. Colocamos "Ind_a, Ind_b, Ind_c, Ind_d, Ind_e, Ind_f, Ind_g, Ind_h e Ind_i" na função "reindex ()". Portanto, os índices dessas linhas serão atualizados no quadro de dados quando executarmos este código.


Os valores do índice da linha são exibidos nesse resultado, e você pode observar que os valores dos dados do quadro não são exibidos aqui, e os valores "nan" apareceram. Isso ocorre porque os novos valores de índice não correspondem aos valores anteriores do índice do DataFrame. Quando o novo índice e Índice antigo não correspondem, ele exibe "nan" lá. Esses valores "nan" aparecem por padrão quando alteramos o índice e não corresponde ao índice anterior.

Exemplo # 02

Agora estamos mudando os valores do índice da coluna do "value_df", que criamos anteriormente no Exemplo 1. Depois de imprimir o "value_df", colocamos a variável "coluna" e adicionamos alguns valores a ele. Adicionamos “A_1, B_1, C_1, D_1 e E_1”. Agora, queremos ajustar esses valores como o índice das colunas; portanto, para isso, estamos usando o método "reindex ()" e colocamos o nome da variável "coluna" na qual os novos valores do índice de coluna são armazenados e Também defina o "eixo" como "colunas", então ele atualizará o índice do eixo da coluna. Colocamos o método "reindex ()" no "Print ()", para que ele também renderá no terminal.


Como usamos o método "reindex ()", os valores do índice de coluna que estão presentes no primeiro DadosFrame são atualizados e novos valores são adicionados no quadro de dados atualizado. Você também pode observar que todos os valores do quadro de dados são convertidos em "nan" porque ambos os valores de índice das colunas são diferentes.

Exemplo # 03

O "Programming_data" neste código contém "P_Languages", onde adicionamos "JavaScript, CSS, Engenharia da Web, OOP, C#, AI, Java e JavaScript". Então, temos "horas" em que colocamos "4_HRs, 2_HRs, 3_HRs, 7_HRs, 6_HRs, 5_HRs, 8_Hrs e 6_Hrs". Depois disso, o "P_Code" é inserido e inserimos "11523, 12423, 12321, 11456, 11454, 12267, 13106 e 14123". Adicionamos a variável "p_index" e colocamos "pro_a, pro_b, pro_c, pro_d, pro_e, pro_f, pro_g e pro_h".

Esses valores serão usados ​​como os valores do índice das linhas. Mudamos o "Programming_Data" no DataFrame "Programming_DF". Também adicionamos o "p_index" a este DataFrame usando o método "índice". Colocamos "Programming_df" e depois o método "índice" e atribuímos o "p_index" a isso. Agora, os valores do índice acima são adicionados como os valores do índice de linhas ao DataFrame. Nós imprimimos o “Programming_DF” também.

Depois disso, adicionamos alguns novos valores de índice na variável “new_index”, e estes são “P_1, P_2, P_3, P_4, P_5, P_6, P_7 e P_8”. Como queremos atualizar os valores do índice das linhas, usamos o método "reindex ()" e colocamos "new_index" como o parâmetro desta função e também armazenamos o quadro de dados atualizado no "newprogramming_df" e colocamos o "newprogramming_df" em " print () ”para exibir.


Os valores do índice são atualizados e também podemos dizer que reiniciamos o quadro de dados que criamos. Todos os valores do quadro de dados também são convertidos em "nan" porque ambos os valores de índice são diferentes.

Exemplo # 04

Atualmente, estamos alterando os valores de índice "Programming_DF" das colunas, que desenvolvemos anteriormente no Exemplo 3. Colocamos a variável "coluna" e inserimos novos valores nela. O “P_Code, P_Languages, Hours and New” são adicionados à variável “coluna”. Em seguida, usamos novamente o método "reindex ()" no qual definimos a variável "coluna", que atualizará os valores anteriores do índice de coluna e adicionamos esses novos valores de índice de coluna ao DataFrame.

Aqui, você pode observar que os novos valores que adicionamos em "coluna" são os mesmos que adicionamos no quadro de dados acima, mas a sequência é diferente, para que mude a sequência das colunas e ajuste todas as colunas como nós mencionado na variável "coluna". Além disso, adicionamos mais um valor de índice que não está presente no quadro de dados acima, que é "novo" aqui, de modo que os valores "nan" aparecerão nesta coluna.


A sequência das colunas é alterada aqui, e todos os valores aparecem como está presente nas colunas do quadro de dados originais e na coluna "nova" no quadro de dados atualizado contém todos os valores "nan" porque esta coluna não está presente no quadro de dados original.

Conclusão

Apresentamos este tutorial que nos ajuda a entender a noção "Pandas Reindex" em detalhes. Discutimos como podemos reindex. Nós explicamos que a função "reindex ()" de "pandas" é utilizada para fazer isso. Fizemos exemplos diferentes nos quais alteramos os valores do índice das linhas do quadro de dados e também os valores do índice do índice da coluna do DataFrame. Renderizamos os resultados de todos os códigos que fizemos aqui neste tutorial e também os explicamos em profundidade.