Tabela de pivôs de pandas

Tabela de pivôs de pandas

O Python fornece muitas bibliotecas para realizar tarefas diferentes. Os "pandas" também são uma biblioteca de python. Utilizamos esta biblioteca para manipular e analisar os dados. Podemos projetar facilmente o quadro de dados em "pandas". Além disso, projetamos as "tabelas de articulação" também, utilizando as funções de "pandas". Uma tabela de articulação é uma característica das planilhas que permitem vários arranjos de tabelas para várias perspectivas de dados idênticos. Uma técnica interativa para resumir um vasto volume de dados é a "tabela de articulação". O método "Pivot_table ()" de "pandas" nos ajuda a projetar as tabelas dinâmicas, utilizando os dados dos dados de dados. Podemos definir seu índice, colunas e valores dentro do método “pivot_table ()” de acordo com nossa escolha ou necessidade. Também podemos aplicar funções de agregação a esses pivot_tables em "pandas". Neste tutorial, criaremos a tabela pivô utilizando o método "pivot_table ()" e explicaremos essa "tabela de pivô" em detalhes.

Sintaxe

Pandas.pivot_table (dataframe_name, valores = valores_names, index = index_names, columns = column_names, aggfunc = 'média')

Primeiro, adicionamos o nome do quadro de dados cujos dados queremos utilizar na tabela Pivot. Então, nos valores, adicionamos os nomes dessas colunas que queremos ajustar como os valores da tabela dinâmica. Depois disso, inserimos os nomes das colunas do quadro de dados que desejamos definir como o índice da tabela pivô. Agora, nas colunas, definimos os nomes das colunas que queremos ajustar como os nomes das colunas da tabela de articulação. Então, também podemos adicionar a função de agregação a ele. Agora, faremos o código "pandas" e mostraremos a criação da tabela de pivô em nossos códigos. Vejamos os exemplos abaixo.

Exemplo 01

Começamos este exemplo colocando a "importação" para importar os módulos de "pandas" no aplicativo "Spyder". Colocamos "pandas como PD" após a palavra -chave "importar". Também importamos outra biblioteca que é a “Numpy” da mesma maneira. Colocamos "importar" e depois adicionamos o "Numpy como NP", então isso nos ajudará a acessar os métodos da biblioteca "Numpy". Depois de importar as duas bibliotecas, avançamos em direção à criação do DataFrame. O DataFrame é chamado "Expense_df" e depois usamos o método "Pandas" "PD.Dataframe () ”Então, nos ajuda a criar o DataFrame.

Os dados que adicionamos no "despesa_df" contêm três colunas que são chamadas "exp_id, despesa_type e dinheiro". Os dados que adicionamos no "Exp_id" são "E1, E2, E3, E4, E5 e E6". Então, no "Expense_type", colocamos: "Habitação, entretenimento, transporte, comida, contas e impostos". A última coluna é a coluna "dinheiro" que adicionamos: "$ 1500, US $ 1200, US $ 200, US $ 3000, US $ 5000 e US $ 2000". Agora, simplesmente exibimos este "Expense_df usando" print () ". O DataFrame é criado e exibido. Ainda não usamos o método "pivot_table ()". Primeiro, mostraremos esse quadro de dados. Em seguida, aplicamos o método “pivot_table ()” também neste exemplo.

Obtemos o resultado deste código no aplicativo "Spyder" com a ajuda das teclas "Shift+Enter" ou também podemos utilizar o ícone "Run" deste aplicativo. Somente o DataFrame é mostrado aqui no resultado e todos os dados são adicionados a este quadro de dados. Agora, aplicaremos o método "pivot_table" para criar a tabela Pivot usando os dados deste DataFrame.

Adicionamos essas linhas dadas ao código acima. Aqui, você pode ver que acessamos o método "pivot_table ()" de "pandas" usando "pd" com esse método. Depois disso, adicionamos o nome do DataFrame como o primeiro parâmetro. Então, nos "valores", definimos a coluna "dinheiro" para que ela seja exibida como os valores nas células da tabela de articulação. No "índice", definimos o "exp_id". Portanto, a coluna "Exp_Id" será convertida no índice da tabela pivô. Também ajustamos o "Expense_type" nas "colunas", para que os valores da coluna "Despense_type apareçam como os nomes das colunas da tabela Pivot.

Em seguida, também aplicamos a função de agregação “Aggfunc” e a configuramos como “NP. soma ”que adicionará valores. A "soma" é a função da biblioteca "Numpy" que obtemos colocando o "np". Nós armazenamos essa "tabela de pivô" na variável "Tabela" e adicionamos essa variável "tabela" em "impressão" para exibir.

Aqui está a tabela de articulação. Observe que os "nomes das colunas" desta tabela pivô são os valores da coluna "Despense_type" do DataFrame. O "índice" desta tabela pivô são os valores do "exp_id" do quadro de dados que criamos acima. Além disso, os "valores" que são adicionados nas células desta tabela de articulação são os valores da coluna "dinheiro" do quadro de dados.

Exemplo 02

Nós novamente importamos "pandas" e bibliotecas "Numpy" para gerar o novo código. Criaremos a tabela Pivot depois de ler o arquivo CSV e converter os dados do arquivo CSV no DataFrame. Em seguida, use os dados do quadro de dados para criar a tabela pivô. Vamos tentar como fabricamos a tabela pivô utilizando os dados do arquivo CSV. Depois de importar as bibliotecas, usamos o método "read_csv" dos "pandas". Em seguida, adicione o nome do arquivo CSV a ele, que lê os dados deste arquivo CSV e armazene esses dados na forma de DataFrame na variável "DF".

Então, imprimimos este "df". Também colocamos o método "Head (8)" com isso, para que ele exiba apenas as primeiras "8" linhas do DataFrame. Depois disso, usamos o método "pivot_table ()" no qual inserimos o nome do DataFrame. Em seguida, colocamos dois índices para a tabela pivô, que são as colunas "order_id e unidades" do quadro de dados. Nos "valores", colocamos as colunas "quantia" e "país" do quadro de dados para que elas sejam adicionadas como os valores da tabela pivô. Na função de agregação, adicionamos o “np. Sum ”função. Esta tabela de articulação é armazenada em "Pivot_result" e também exibimos o "Pivot_result" usando o "Print ()".

O DataFrame, assim como a tabela pivô, é renderizada neste resultado e você pode verificar facilmente os índices e valores da tabela Pivot. Todos os valores e índices da tabela dinâmica são ajustados de acordo com a definição do código.

Exemplo 03

Também podemos criar uma tabela pivô com muitos métodos de agregação. Aqui, projetamos o DataFrame e depois criamos a tabela Pivot seguindo o mesmo método que já discutimos anteriormente. No método "pivot_table ()", ajustamos "EMP_TYPE" como o "índice". O "EMP_Pay" é definido como os "valores" dessa tabela de pivô e adicionamos várias funções de agregação aqui e são "soma, média e contagem". Portanto, todas essas funções se aplicarão aos valores da tabela dinâmica. Este "pivot_table ()" é salvo em "resultado" e imprimimos o "resultado" também para mostrar a tabela de articulação no terminal.

O DataFrame e a tabela dinâmica são mostrados aqui. Na tabela Pivot, você pode observar que as três colunas- “Soma, média e contagem”- contém o resultado depois de aplicar essas funções aos dados da tabela Pivot. Além disso, observe que ele escreve os mesmos valores uma vez na coluna do índice e não duplica nenhum valor de índice aqui.

Conclusão

Neste tutorial, estudamos a “tabela de pivô” em “pandas”. Discutimos o que é uma tabela dinâmica, por que utilizamos esta tabela dinâmica e como criar esta tabela de pivô em "pandas". Explicamos o método que é o método "pivot_table ()" que nos ajuda a criar a "tabela pivô" em "pandas", utilizando os dados do quadro de dados. Também utilizamos este método "pivot_table ()" nos códigos "pandas" também. Aplicamos muitas funções de agregação nesta "tabela de articulação". Também desenvolvemos a "tabela pivô" depois de ler o arquivo CSV neste tutorial.