PANDAS DATAFRAME PIVOT

PANDAS DATAFRAME PIVOT
Pandas é a biblioteca de Python. Utilizamos pandas para muitos propósitos. Podemos fazer o quadro de dados em pandas e pivô que dados dados de dados. Para privar ou remodelar o quadro de dados, os pandas fornecem o método "pivot ()". Um quadro de dados especificado pode ser reorganizado usando o método "pivot ()" através dos valores especificados do índice e da coluna. Quando queremos remodelar o quadro de dados, utilizamos o método "pivot ()". Quando utilizamos o método "pivot ()", ele deve usar o valor de índice exclusivo. A agregação de dados não é suportada pelo método "pivot ()"; Vários valores produzem um multiindex nas colunas. Neste guia, exploramos o método "pivot ()" em pandas em detalhes. E nós lhe daremos uma demonstração visual dos códigos em que remodelamos o quadro de dados usando "Pivot ()".

Sintaxe:

Quadro de dados.pivô (self, index = nenhum, colunas = nenhum, valores = nenhum)

Exemplo 1:

Mostraremos o exemplo prático do método "pivot ()" em pandas. Fazemos o código de pandas no aplicativo "Spyder". Como sabemos, precisamos importar algumas funções dos pandas como "PD". Desenvolvemos este código, então aplicamos o método "pivot ()". Este método é aplicado ao quadro de dados. Primeiro, criamos o quadro de dados aqui. O quadro de dados que desenvolvemos aqui é chamado "cars_data", onde adicionamos os dados relacionados a carros. Fazemos a primeira coluna com o nome "car_name", onde adicionamos alguns nomes de carros como "Wagonr, Swift, Lexus, Mehran, Mustang, Alto e Jaguar".

Também inserimos mais colunas que são chamadas “car_model, car_no e desafio”. Os dados nessas colunas também são inseridos aqui. A coluna "Car_model" contém os números de modelo dos carros que são "2014, 2001, 2010, 2015, 2020, 2012 e 2019". A coluna "car_no" contém "R123, R456, R162, R102, S127, W190 e Z345". Em seguida, temos a coluna “Challan”, onde adicionamos os valores “500, 4000, 500, 6000, 2000, 1000 e 2000”. Este é o quadro de dados completo que contém quatro colunas. Depois disso, definimos os valores do índice para as linhas que são "R1, R2, R3, R4, R5, R6 e R7". Inserimos esses valores de índice no "cars_data", utilizando o método "índice".

Em seguida, colocamos no método "print ()" para renderizar no console. Ainda não remodelamos o quadro de dados ou aplicamos o método "pivot ()". Simplesmente exibimos o quadro de dados "cars_data".

Pressionamos o "Shift+ Enter" para executar este código. Depois de pressionar essas chaves, obtemos o resultado fornecido do código que exibe o quadro de dados que desenvolvemos no Código Pandas. Agora, aplicamos o método "pivot ()" a este quadro de dados e remodelá -lo de acordo com a nossa escolha.

Aqui, adicionamos essas linhas ao nosso código Pandas e utilizamos o método "pivot ()". Este método "pivot ()" contém três parâmetros. No primeiro parâmetro, definimos o novo índice que é o "car_model". O segundo parâmetro é o nome da coluna que definimos aqui como "Challan". E o terceiro parâmetro é o parâmetro de valor que nós como "car_name". Agora, o quadro de dados "cars_data" é remodelado e aparece como definimos. A coluna "Car_model" aparece como o índice, a coluna "Challan" aparece como os nomes da coluna e os valores do quadro de dados são o "car_name".

Aqui, o quadro de dados remodelado é exibido e todos os ajustes dos valores aparecem de acordo que definimos no código. O índice deste quadro de dados remodelado é o "car_model". O nome da coluna aqui é a coluna "Challan". Todo o "car_name" é ajustado aqui como os valores. O "nan" aparece aqui na célula vazia.

Exemplo 2:

O DataFrame que desenvolvemos neste exemplo é o "new_interview_df". Mas primeiro criamos uma lista aninhada com o nome "new_interview". E então, convertemos esta lista aninhada no DataFrame. A lista "new_interview" contém a "pro_language", onde temos o "java, c#, python, oop e python". Possui "code_office", onde colocamos o "Bar12, LON34, PAR33, LON56, Bar53, LON11 e Bar34". Em seguida, temos o "EMP_SALARY" e inserimos os "18000, 25000, 20000, 15000, 34000, 22000, 31000 e 43000". O "new_interview" é transformado no "new_interview_df" com a ajuda do "PD.DataFrame ”. Também colocamos o "new_interview_df" no método "print ()". Aparece no console após a execução.

Agora, remodelamos o "new_interview_df" com a ajuda do método "pivot ()". Desta vez, mencionamos os "valores, índice e a coluna" dentro do método "pivot ()". Aqui, definimos o "EMP_SALARY" como os valores, "code_office" como o índice e "pro_language" como as colunas. Em seguida, imprimimos este molho de dados reformulado.

O original, assim como os quadros de dados remodelados, aparecem aqui. Você pode notar que os nomes de valor, índice e colunas são alterados e um novo quadro de dados remodelado aparece abaixo do quadro de dados original. No quadro de dados remodelado que apareceu aqui, o índice é o "code_office", os nomes das colunas são "pro_language" e os valores são o "emp_salary".

Exemplo 3:

Nós novamente criamos outra lista para este exemplo. Esta lista é chamada "temp_list", que tem "mês, cidade, temperatura e umidade". O "mês" que inserimos aqui é "janeiro, maio, junho, fevereiro e julho". A “cidade” tem “Nova York, Birmingham, Mumbai, Baljiam e Bangalore”. Na “temperatura” e “umidade”, adicionamos “62, 68, 70, 77, 69” e “60, 66, 69, 74, 63”, respectivamente. Em seguida, mudamos o "temp_list" no quadro de dados "temp_df". Em seguida, renderizamos este "temp_df" aqui.

Agora, queremos girar ou remodelar este "temp_df". O método "pivot ()" aqui ajuda a fazê -lo. Definimos o "mês" como seu índice e a "cidade" como o nome da coluna. Os valores que definimos aqui são "temperatura" e "umidade". Eles aparecem como dois quadros de dados separados com valores diferentes.

Este resultado mostra que, após a remodelação, existem dois quadros de dados separados por pontos. O primeiro dataframe contém os valores de "temperatura" e o segundo quadro de dados contém os valores de "umidade". Os índices e nomes de colunas para ambos os quadros de dados são os mesmos. O índice para ambos os dados de dados é o "mês" e as "colunas" para ambos é "cidade".

Exemplo 4:

Este código contém um DataFrame "DF", onde colocamos "A01" como a primeira coluna e adicione "James, James e Mina". A segunda coluna é "A02", que tem "engenheiro, engenheiro e professor". A terceira coluna é chamada "A03", onde colocamos "44, 63, 21". Imprimos o "DF" e aplicamos o "pivô" aqui. O "A01" é o índice, "A02" é a coluna e "A03" é o valor. Agora, verifique a saída do que acontece com este DataFrame.

Aqui está o resultado deste código. Você pode notar que a mensagem de erro aparece na saída que diz que o índice contém as entradas duplicadas. Isso significa que não definimos essas colunas como um índice que contém as entradas duplicadas porque os índices são valores únicos. Portanto, tenha cuidado com isso enquanto gira qualquer dataframe.

Conclusão

O objetivo deste guia é tornar a lógica da função "Pandas Pivot ()" mais compreensível para você. Descrevemos esse conceito em grande profundidade, para que fosse fácil para você aplicar a função "pivot ()" no código de pandas. Explicamos o método "pivot ()". Utilizamos esse método para remodelar ou girar o quadro de dados em pandas. Também explicamos sua sintaxe aqui. Neste guia, analisamos quatro exemplos descritivos e práticos, olhando cuidadosamente por cada linha de código. Fornecemos o resultado para cada código aqui junto com os scripts.