Pandas se juntam a dois dados de dados

Pandas se juntam a dois dados de dados

“Os pandas são um dos pacotes de linguagem Python, tornando a análise de dados mais fácil e flexível de trabalhar e processar melhor. Muitas vezes, na vida real, enfrentamos a situação em que fizemos nosso trabalho em vários arquivos diferentes e, às vezes, precisamos ver todos os dados juntos em um "DataFrame" para analisar dados em vez de ter os dados em diferentes locais. Então, os pandas nos fornecem essa coisa possível, facilitando -nos. Existem várias maneiras de executar esse método; Estaremos implementando o método de “junção” dos pandas de todas as maneiras diferentes possíveis. O método junção () é usado principalmente e se junta aos quadros de dados com base no "índice". Usaremos a ferramenta "Spyder" para a implementação dos códigos; É um software orientado para Python que nos fornecerá benefícios para a implementação do código do método de junção de pandas ().”

Sintaxe

"Quadro de dados. juntar"

A sintaxe acima é usada para unir os dois quadros de dados juntos. Ele sempre funciona usando o outro índice para a finalidade de união. O DataFrame pode ser escrito como "df". A “junção do ponto” é para a chamada do método. Como ele usa o índice, mas não há dano ou alterações realizadas no real. O índice de dados real é preservado como o original.

Parâmetro

Posteriormente, usaremos um parâmetro como um "outro" DataFrame. Isso ajuda a unir os dois quadros de dados; a coisa combinada é feita com este parâmetro. Além disso, o índice de um dos dois "df" deve ser semelhante a se juntar a eles. Isso significa que tipos semelhantes de dados ou dados usados ​​para o mesmo objetivo podem estar juntos para processamento.

A seguir, estão as diferentes maneiras pelas quais faremos os exemplos para a implementação do método junção () em um "df".

  • Método de junção panda usando os índices.
  • Método de junção panda usando colunas (chave).
  • Método de junção panda preserva o índice de dados de dados original.
  • Método de junção do panda usando não-único (chave).

Criando o DataFrame para a implementação do método de junção ()

Aqui, primeiro, temos que importar a biblioteca de pandas como "PD", então criaremos o quadro de dados que consiste em duas colunas, uma é a "chave" como "T0", "T1", "T2", "T3 "," T4 "e" T5 "e o outro é de" n "valores como" n0 "," n1 "," n2 "," n3 "," n4 "e" n5 ". O "DF" representa o quadro de dados no código.

A saída mostra os dados inseridos no quadro de dados; Podemos ver as colunas "chave" e "n" são impressas.

Criando outro DataFrame para o método panda junção ()

Estamos criando outro quadro de dados porque teremos os dados de dados separados e depois combinamos com eles usando o método pandas junção (). O DataFrame consiste em duas colunas; À medida que criamos o último "DF", a coluna "chave" tem valores como "T0", "T1", "T2" e "T3"; Por outro lado, a outra coluna tem os valores de "M" como "M0", "M1", "M2", "M3".

Aqui está a saída que exibe a criação simples de dados de dados de acordo com o código.

Você pode ver que existem dois quadros de dados e queremos ter os dois juntos no mesmo quadro de dados, por isso estaremos fazendo os exemplos agora para ver como isso vai acontecer.

Exemplo # 01: Método Panda junção () usando os índices

Abra a ferramenta "Spyder". Agora, para se juntar aos dois quadros de dados, devemos criar os dois quadros de dados primeiro para se juntar a eles. Aqui, os quadros de dados consistem nas variáveis ​​"x" e "y" com valores atribuídos como "x" com "x0", "x1", "x2", "x3", "x4" e "x5", enquanto "y" tem menos valores, que são "y0", "y1", "y2" e "y3". Os valores "chave" são de "K0" a "K5" e em outros "df", os valores "chave" são de "K0" para "K2". Em seguida, o DataFrame com a chamada do método "DOT JON" combinará os dois "df". O "sufixo" usado no código é porque, no quadro de dados, existem duas colunas que têm o mesmo nome, eu.e., "chave". Que não sobreporá os dados.

A saída exibe os dois "df" em um. Como podemos ver que existem alguns valores como "nan", o que significa que "não é um número". O "DF" tem mais valores do que o segundo "df", então, onde não há valor atribuído, ele mostra como "nan".

Exemplo # 02: Método de junção panda usando (chave) colunas

Como sabemos agora como ingressar em dois quadros de dados, aqui agora faremos isso usando o método da coluna "chave". O método da coluna chave organiza os dados como colunas sobre o índice. Aqui o DataFrame consiste nas variáveis ​​"n" e "w". O "n" tem valores como "n0", "n1", "n2", "n3", "n4" e "n5". Enquanto "W" tem os valores "W0", "W1" e "W2". O df com “.Índice de set ”mostra com a“ chave ”e com o método de junção de chamada como“.Junte -se ", com o outro índice" DF "anexado. Este método de junção combinará os dois "df" usando seu índice. Este é um método muito eficiente de união de pandas, que ajudará de várias vezes em um ambiente de big data.

A saída usando o método da coluna de junção de índice () de pandas mostra as colunas com os valores -chave e as variáveis ​​"n" e "w".

Exemplo # 03: Método de junção panda preservando o índice de dados de dados original

Neste exemplo, estaremos vendo e provando o que escrevemos acima que os dados são preservados para seu estado original. Aqui os dados de dados têm as variáveis ​​"P" e "W". O "P" com os valores "P0", "P1", "P2", "P3", "P4" e "P5". "W" com os valores "Q0", "Q1" e "Q2". O ".A implementação de junte -se "no" df "é definida com o" índice "(chave). Este método mostrará os dados mantidos com o índice "os dados originais".

A tela representa os dados reais sem ter a originalidade tomada.

Exemplo # 04: Método de junção panda usando (chave) (chave)

Agora estaremos fazendo um exemplo para entender um método único. No exemplo anterior, aprendemos como os dados originais são mantidos. Isso foi feito mostrando os dois quadros de dados disponíveis no código. Agora faremos o mesmo para verificar o estado original e também entrar no método com o outro "df" não estar lá. O "df" aqui tem "p" e a "chave". "P" tem os valores de "P0" a "P5" contínuo e os valores "chave" de "K0" para "K5", respectivamente. A chamada do método "DOT JON" é feita com o outro "índice de conjunto" induzindo "chave".

A saída é semelhante à saída do último exemplo. Os dados são capturados dos dados mantidos que eram originais.

Conclusão

O método de pandas que se uniram a dois dados de dados é eficiente e conveniente. Este método usa o “.participe da função ”para operar os dados e unir os quadros de dados. Este método é uma ótima maneira de apresentar os dados, especialmente quando estamos trabalhando em uma enorme quantidade de dados no diretório em qualquer lugar em que a análise dos dados seja realizada. Discutimos como o método de junção panda pode ser implementado para uma melhor compreensão da função. Fizemos da maneira "índice", "coluna" e a maneira "chave" de trazer os dois quadros de dados diferentes para um único.