Pandas MultiIndex

Pandas MultiIndex
Quando falamos sobre as bibliotecas de código aberto de "Python", então "pandas" é uma delas. Utilizamos esta biblioteca quando precisamos manipular e analisar os dados. Podemos utilizar os módulos "pandas" para criar as diferentes séries ou dados de dados. Às vezes, precisamos ajustar as várias colunas como as colunas de índice no quadro de dados. "Pandas" fornece um método "MultiIndex" para criar mais de um índice. O método "MultiIndex" oferece a oportunidade de selecionar as várias linhas ou colunas como os índices desse quadro de dados. Aprenderemos sobre os métodos "multiindex" neste guia e também faremos alguns códigos em que utilizamos os métodos "multindex" de "pandas" para criar vários índices.

Métodos Pandas MultiIndex

"Pandas" fornece muitos métodos de "MultiIndex" que utilizamos para criar vários índices. Estes são:

  • MultiIndex.de_frame
  • MultiIndex.From_Product
  • MultiIndex.From_arrays
  • MultiIndex.de_tuples

Agora, avançamos e utilizamos esses métodos "multiindex" que mencionamos anteriormente no código "pandas" aqui.

Exemplo 1:

O primeiro código deste guia é dado aqui. Fizemos todos os códigos que discutiremos neste guia na ferramenta "Spyder". Sempre que queremos desenvolver o código "Pandas", temos que importar alguns módulos de "pandas". Podemos importá -los simplesmente utilizando a palavra -chave "importar" e escrever os "pandas como pd". Agora, neste código, obtemos as funções de "pandas" colocando "PD". Nós criamos algumas matrizes aqui. A primeira matriz é chamada "Raw_names" e contém "Smith, James, Bromley, Peter e Samuel". A próxima matriz é nomeada "Raw_ages", na qual armazenamos os valores "10, 11, 15, 12 e 13". A última matriz que temos são os "Raw_marks", que contém os "90, 92, 83, 74 e 88".

Depois de criar essas matrizes, utilizamos o método "MultiIndex" aqui, que é o "MultiIndex.From_arrays () ”Método. Colocamos o nome de todas as três matrizes neste método, o que significa que essas três matrizes são combinadas para que os componentes de cada matriz possam ser utilizados para criar os múltiplos índices. Nos nomes, passamos os “nomes, idades e marcas”. Agora, exibimos o resultado do código mencionado aqui, utilizando a função "print ()".

Ao atingir o "Shift+Enter", obtemos esse resultado. Quando o código está livre de erros, o seguinte resultado é renderizado na tela. Ele exibe o MultiIndex aqui que criamos neste código:

Exemplo 2:

Neste código, criamos o quadro de dados. Criamos a lista "Worker_information" aqui. Adicionamos o "nome" que aparece como o nome da coluna quando o convertemos no DataFrame e inserimos "William, Timmy, James, Alexander e Graham". O "trabalho" contém "engenheiro de software, testador de software, jogador, vendedor e professor". Em seguida, temos o "Monthly_salary", onde colocamos o salário dos trabalhadores "US $ 1500, US $ 1200, US $ 1100, US $ 1300 e US $ 1500". Em seguida, convertemos esta lista aninhada no DataFrame. Utilizamos o “PD.Dataframe () ”aqui para fazer isso.

Em seguida, o "print ()" nos ajuda a renderizar esse quadro de dados. Agora, temos uma variável aqui chamada "Result" e utilizamos o "MultiIndex.Método From_frame () ”para criar todas as colunas como o índice. Ele cria um multiindex deste dados de dados com a ajuda deste método. Depois disso, adicionamos essa variável na “print ()”, para que ela se renderize após a execução.

Aqui, o DataFrame é visto primeiro neste resultado e o MultiIndex é exibido junto com os seguintes valores. Obtemos esses múltiplos índices utilizando o “MultiIndex.From_frame () ”Método.

Exemplo 3:

Utilizamos o "trabalhador_df" neste exemplo novamente. Desta vez, adicionamos uma nova coluna a este quadro de dados que é "w_no". Também adicionamos alguns dados a esta coluna que é "W101, W102, W103, W104 e W105". Agora, utilizamos outro método aqui para criar os múltiplos índices deste quadro de dados. Usamos o “df.Método set_index ”aqui, nos quais colocamos os nomes de duas colunas que são“ w_no e nome ”. Em seguida, adicionamos o "Inplace" e "Anexamos" a "verdadeiro" e o "gota" a "false". Então, ele não soltará as colunas.

Essas colunas aparecem duas vezes no quadro de dados. O índice, assim como a coluna, aparece aqui. Em seguida, aplicamos o "print ()" ao "trabalhador_df". O "trabalhador_df" é renderizado. Agora, também exibimos os índices separadamente, colocando “trabalhador_df.ÍNDICE "na“ impressão ”depois de exibir o DataFame atualizado em que definimos esses múltiplos índices.

No primeiro dataframe, apenas o índice padrão é exibido e não há outra coluna de índice neste quadro de dados. Mas o seguinte DataFrame mostra vários índices. Você pode ver facilmente os índices "w_no e nome" que criamos no código. Esses índices junto com os valores são exibidos separadamente no final.

Exemplo 4:

Construímos as várias matrizes novamente neste código. O “Callum, Tyler, Chloe, Lewis, Hazel, John e Peter” estão todos listados na primeira matriz. O "paciente_name" é chamado aqui. A seguinte matriz, “Patient_age”, contém os valores “28, 33, 45, 17, 22, 44 e 29”. A última matriz é chamada de "paciente_contact" e contém os números "1001234, 1001235, 1001236, 1001237, 1001238, 1001239 e 1001240".

Aqui, usamos o método "MultiIndex", que é o "MultiIndex.da função de_arrays () ”depois de criar essas matrizes. Em seguida, passamos os nomes dessas três matrizes no “MultiIndex.From_arrays ”para criar essas matrizes como os índices aqui. Também adicionamos o “pai, idade e contato” nos nomes. Depois disso, temos a “print ()”, que nos ajuda a renderizar os dados da variável “paciente”, onde armazenamos os múltiplos índices após aplicar o “MultiIndex.Método From_arrays ”.

Este resultado mostra todos os índices que adicionamos ao código. O nome também é mencionado aqui. Todas as matrizes são definidas aqui como vários índices com a ajuda do “MultiIndex.From_arrays () ”Método.

Exemplo 5:

Agora, aqui está o último código deste guia, onde geramos o DataFrame e criamos os múltiplos índices deste DataFrame. Para criar o DataFrame, devemos adicionar alguns dados aqui. Adicionamos todos os dados na variável "xyz". Primeiro, adicionamos o "xyz_name", que contém "John, Michael, Foster, Samuel, Bromley, Smith e Fuller". Então, temos "xyz_codes" e colocamos "XYZ23, XYZ24, XYZ25, XYZ26, XYZ27, XYZ28 e XYZ29". Agora, vem o "xyz_month", que contém "Jan, fevereiro, março, abril, maio, junho e julho". Em seguida, adicionamos as “xyz_units” nas quais colocamos “20, 14, 19, 46, 35, 20 e 53”.

Agora, criamos o "xyz_dataframe" e colocamos o "PD.DataFrame () ”Método, que cria o DataFrame dos dados“ XYZ ”. Então, também exibimos o "xyz_dataframe". Agora, criamos os múltiplos índices do DataFrame, por isso usamos o “MultiIndex.From_frame () ”Método. Isso cria os múltiplos índices desse quadro de dados e os armazena na variável "xyz_dataframe1". Essa variável também é colocada no "print ()" para que esses índices sejam exibidos no terminal.

Ele exibe o "xyz_dataframe". Então, há os índices criados após a aplicação do “MultiIndex.From_frame () ”Método. Todos os índices, juntamente com os valores e nomes de colunas, são exibidos neste resultado.

Conclusão

Este guia foi escrito aqui para esclarecer o conceito de "MultiIndex" em "Pandas". Discutimos os diferentes métodos de "multiindex" que "pandas" fornece. Também discutimos alguns deles em detalhes aqui. Aplicamos esses métodos nos códigos "pandas" aqui e mostramos como os múltiplos índices são criados em "pandas" com a ajuda de métodos "multiindex". Aplicamos esses métodos a matrizes e dados de dados e explicamos todos esses códigos em detalhes profundos. Mostramos o DataFrame antes de criar os múltiplos índices e depois de criar os múltiplos índices, utilizando o método multiindex "pandas". Exibimos os múltiplos índices separadamente nesses códigos também.