União de Pandas

União de Pandas

A função do panda “índice.Union () ”é usado para obter o índice em uma ordem sindical, como no capítulo de matemática, onde usamos a função da União. Também podemos encontrar a união do índice usando a função "concat ()", que combina o quadro de dados e define a ordem do índice de maneira de sequência.

A sintaxe para o método concat ()


A sintaxe para o “índice.Método da União ”


Exemplo 1: A união de dois índices de quadro de dados usando o método concat ()

Neste exemplo, estamos usando a função "concat ()" para "união" os índices de dois dados de dados. Concatenar dois quadros de dados juntos é um processo direto. Embora a função "união" em pandas seja semelhante a uma união, também elimina duplicações. Concat e as duplicatas de queda funcionam em pandas usam a união. Essa função da União opera de maneira semelhante à forma como a função da União no capítulo de matemática “Conjuntos” opera, combinando todos os números sequencialmente; No entanto, nos pandas, o número repetido é descartado.

Estamos utilizando a ferramenta "Spyder" para implementar o código no primeiro exemplo do artigo. A etapa inicial em todos os códigos Python Pandas é importar a biblioteca do Panda como "PD".


Agora vamos gerar um quadro de dados. Para concatenar os quadros de dados e aplicar união em seus índices, dois quadros de dados serão criados. O primeiro DataFrame que temos é nomeado "Tabela1". Ele contém duas colunas, os "cursos" e "taxa", cada um tem alguns valores declarados neles. Na primeira coluna, listamos os nomes de alguns cursos de programação, incluindo "OOP", "Python", "Java" e "Android Studio". Mencionamos as taxas do curso na segunda coluna, "Fee" e elas são "30000", "35000", "32000" e "25000". Para gerar nosso primeiro quadro de dados "Tabela1", agora estamos utilizando "PD.DataFrame ”, como você pode ver na imagem a seguir:


A criação do segundo quadro de dados “Tabela2” é o seguinte estágio. Os nomes das colunas neste quadro de dados são os mesmos que os do quadro de dados anteriores, mas seus valores diferem. Temos "design gráfico", "php", "sql" e "swift" na coluna "cursos", e temos "34000", "32000", "22000" e "24000" na "taxa" coluna. Para a geração do segundo dataframe, Tabela 2, estamos mais uma vez usando “PD.DataFrame ”conforme demonstrado.


Agora, nesta seção, implementaremos a principal função de nossos exemplos, que combina dois quadros de dados usando a função "concat ()" e aplicando a função "união" aos seus índices. O método "concat ()" concatena os itens de pandas em um determinado eixo com lógica de conjunto opcional, que pode ser interseção ou união junto com os outros eixos. Aqui, usamos “PD.Concat (Tabela1, Tabela 2) ”para combinar o quadro de dados. Também passamos o parâmetro "ignor_index = true" porque não queremos que o índice seja repetido. Em vez disso, queremos o índice em forma incremental ao combinar os quadros de dados. Finalmente, salvamos o resultado na variável da união e a imprimimos usando a função "print ()". Consequentemente, o método "concat ()" usará essencialmente o índice para encontrar a união do quadro de dados.


Vamos recorrer à sua saída, que é mostrada na figura a seguir. Como podemos ver, a combinação de nossos quadros de dados funcionou com sucesso usando a função "concat ()". As duas colunas, "cursos" e "taxa", são exibidas. Como nosso índice não é repetido, ele é exibido na espuma da união, como pode ser visto, porque passamos o parâmetro da função "concat ()", que é "ignore_index = true". O tamanho do índice que temos atualmente é "8", o que significa que ele abrange uma variedade de "0 a 7".

Exemplo 2: Combinando o índice usando o índice.Método Union ()

Este é um exemplo simples e compacto. Antes de fundir os dois índices neste exemplo, utilizamos o “índice.Método Union () ”. Como sempre, devemos importar a biblioteca do Panda como "PD" antes de executar este código. Neste exemplo, estamos simplesmente construindo um índice em vez de um quadro de dados. Então, para criar o “index1” inicial, usamos “PD.Índice "com os números" 4 "," 5 "," 6 "e" 7 ", e seguimos o mesmo procedimento que você pode ver para o" index2 ". Os valores "index2" são "8", "9", "10" e "11".


Como você pode ver, atualmente estamos utilizando “index1.Union (index2) ”. Isso criará uma ordem sindical combinando os dois índices. Em seguida, usamos o método "print ()" para exibir o resultado gerado.


O resultado da saída mostra que o índice combinado começa no número quatro e termina no número onze. Desta vez, uma única linha do índice é exibida. Ele também indica que seu tipo de dados é "int64".

Exemplo 3: Uma união de três índices de quadro de dados usando o método concat ()

Este exemplo é semelhante ao primeiro exemplo, mas este combinará três quadros de dados e encomendará seus índices sequencialmente. Em geral, o índice de Python retorna a localização do elemento fornecido em uma lista ou os caracteres em uma string. O índice define essencialmente a posição do elemento, para simplificar.

Devemos importar a biblioteca de pandas como "PD" antes de começarmos a escrever o código para este exemplo. Nesse cenário, três quadros de dados devem ser criados. O primeiro DataFrame que temos é nomeado "Data1" e possui três colunas "Student_name", "Marks" e "Comentários". Alguns valores foram adicionados a essas colunas. Temos "Noah", "Emma", "Enna" e "George" na primeira coluna, "Student_name", e na segunda coluna "Marks", temos uma lista das marcas do aluno "450", "490 "," 482 "e" 209 "e a coluna final contém as" observações "do aluno, um" passe "ou um" falha ". Agora, criamos esse quadro de dados como mostrado usando “PD.quadro de dados".


É hora de construir um segundo quadro de dados com três colunas, que serão idênticas ao primeiro, mas os valores das colunas são alterados. O DataFrame é chamado "Data2". Temos três colunas "Student_name", "Marks" e "Comentários". Na primeira coluna, "Student_name", temos "Watson", "Henry", "James" e "Oliver" os valores na segunda coluna, "Marks", temos "499", "390", "290 ”E“ 400 ”e na última coluna, temos as observações“ Pass ”ou“ Fail ”. Este Dataframe "Data2" é concluído, então usamos o mesmo "PD.dataframe ”para produzir isso.


Chegou a hora de criar o terceiro Dados Dataframe "Data3", que possui três colunas com os mesmos nomes que o último DataFrame, mas com valores diferentes. Os valores que temos na primeira coluna são "Archie", "Ethan", "Michael" e "Samuel". Temos "230", "498", "290" e "403" na segunda coluna e, no terceiro, temos "falhas", "passa", "falha" e "passa". Para gerar o terceiro DataFrame "Data3", estamos novamente usando "PD.quadro de dados".


Aqui, combinamos nossos três quadros de dados e atribuímos a seus índices uma sequência em termos de união usando a função "concat ()" com seu parâmetro. Aqui, usamos “PD.Concat (DF1, DF2, DF3) ”é usado para combinar os quadros de dados, que são os“ Data1 ”,“ Data2 ”e“ Data3 ”. Como você pode ver, também utilizamos “ignore_index = true”, que omitirá o índice repetido e fornecerá a eles um novo índice que é preciso e na ordem certa, porque desejamos uma ordem de união para o nosso índice. Defina a opção "ignore_index = true" para instruir a concatenação para desconsiderar os índices usados ​​atualmente usados. Em seguida, ele definirá o índice a partir de '0 ”para continuar nos resultados. Para armazenar o resultado produzido por esta função, inicializamos a variável "união". Posteriormente, invocamos a função "print ()" para exibir o conteúdo armazenado nesta "união":


Os quadros de dados são combinados e mostrados como um único quadro de dados na saída, como pode ser visto. Os três quadros de dados são combinados usando a função "concat ()" e sua união de seus índices usando o parâmetro "ignore_index = true". Devido ao mesmo número de colunas e os mesmos nomes de colunas em cada um desses três quadros de dados, nenhuma colunas extras foi exibida no resultado. O "Student_name", "Marks" e "Comentários" são as três colunas exibidas após a concatenação. A representação sindical do índice é visível; Começa em "0" e termina em "11", indicando que o tamanho do índice é "12".

Conclusão

Neste artigo, concatenamos o DataFrame para obter o índice da União, utilizando a função "concat ()". Além disso, utilizamos o parâmetro da função concat "ignor_index = true" porque não queremos o índice repetido. No segundo exemplo do artigo, que é breve e simples, usamos o “índice.Union () ”função para combinar os índices e exibir o tipo de dados do índice. Acreditamos que esses métodos simplificarão sua tarefa.