Pandas se juntam a fusão

Pandas se juntam a fusão

"Pandas" é uma ferramenta de alto desempenho para o ambiente Python. É um código fonte "aberto" para a análise de dados. Os pandas se juntam e o método de mesclagem de pandas são usados ​​para a união dos dois quadros de dados juntos em um único quadro de dados. Nos dois métodos de pandas, a diferença é que a função Pandas "junção" se junta ao DataFrame usando um índice. Enquanto a função Pandas "Merge" se junta ao DataFrame usando o índice e o método da coluna no qual podemos selecionar a coluna desejada nós mesmos. O método de mesclagem de pandas é usado principalmente em comparação com o método de junção de pandas. O software que usaremos para a implementação é o software "Spyder", que está no ambiente Python que nos fornecerá benefícios para a implementação de código do método de junção de pandas () e a função do método pandas mescle ().

Sintaxe do método Pandas junção ()

“DF1.JONE (DF2) ”

O "df" na sintaxe acima é a abreviação do "DataFrame". Existem dois quadros de dados na sintaxe com a função "DOT junção", que é para chamar o método. É o método de pandas de ingressar em dois quadros de dados. Funciona usando o índice para combinar os quadros de dados em um único.

Sintaxe do método Pandas Merge ()

“DF1.mesclar (df2, on = 'column_name') "

A sintaxe do método de mesclagem de pandas possui dois quadros de dados como "df1" e "df2". A função "Dot Merge" está chamando o método de unir os dois quadros de dados com o aparecimento de colunas invertidas.

Cobriremos as seguintes maneiras de combinar dois quadros de dados para usar os métodos de Merge e Pandas de Panda se juntam:

  • Método de junção de pandas sobreposição.
  • Os pandas ingressam no método usando um Índice Redefinir.
  • Método de mesclagem de pandas (coluna "esquerda e direita").
  • Método de mesclagem de pandas explícito.

Criando os quadros de dados para a implementação da mesclagem de pandas e o método de junção de pandas

Primeiro, temos que criar um quadro de dados. Para isso, usaremos a ferramenta "Spyder". Depois de abri -lo, comece a escrever o código. Importar pandas como "PD" para a Associação de Bibliotecas Pandas. Temos as variáveis ​​de quadro de dados como "x", "y", "p" e "q correspondentemente e" a "com valores" 1 "e" b "com o valor atribuído como" 2 ".

A saída é um "df" criado com os valores atribuídos. Podemos torná -lo tão grande quanto os dados são.

Criando outro quadro de dados

Temos que fazer outro dados de dados, para entender os métodos de união de pandas e pandas se fundindo claramente. Aqui, temos "df" criados da mesma forma que os "df" acima, apenas os valores são variáveis ​​atribuídas são diferentes. Temos "H", "J", "S" e "D", enquanto atribui valores "B" com o valor "8" e "Y" com o valor "3".

A saída mostra um simples "df" criado.

Exemplo # 01: Método de junção de pandas (sobreposição)

Agora, veremos como ingressar em dois quadros de dados com o método de junção de pandas. Para este método, podemos escolher a coluna de sua escolha em que queremos trabalhar no DataFrame. Tomamos o exemplo com a coluna sobreposta "esquerda" do "df", para que possamos consertar isso com o "sufixo" para superar a sobreposição de dados. Aqui, as variáveis ​​usadas são "x", "z", "v", "d". "P", "O", "L" e "Y" com os valores atribuídos como "3", "6", "7" e "9". O ".ingressar ”chama o método, com o alinhamento alinhado para a esquerda se juntando ao sufixo“ df ”direito. ”. O "sufixo" usado no código é porque no quadro de dados, existem duas colunas que têm o mesmo nome que é "chave" e que não se sobrepõem aos dados.

A saída exibe dados sobrepostos com o método de unir dois "df" usando o método de junção de pandas.

Exemplo # 02: Método de junção de pandas usando uma redefinição de índice

Neste exemplo, especificaremos separadamente a coluna com o parâmetro "ON" para usar como "chave" na junção do método que ajuda a ingressar nos dois quadros de dados. a coisa combinada é feita com este parâmetro. Além disso, o índice de um dos dois "df" deve ser semelhante a se juntar a eles. Tipos semelhantes de dados ou dados usados ​​para o mesmo objetivo podem estar juntos para processamento. Isso usará o índice ainda, usando da direita. As variáveis ​​são "s", "t", "u", "v", "n", 'w "," k "e" q ". Os valores atribuídos são "3", "6", "7" e "9". O "Índice de redefinição" é um método de pandas para redefinir o índice do "df". O índice de redefinição define todos os números inteiros da sua lista de dados de 0 de 0 até os dados do DataFrame estão alongados.

Aqui está a saída exibida com o índice "chave", método de pandas.

Exemplo # 03: Método de mesclagem de pandas (coluna "esquerda e direita")

O método de mesclagem executa uma operação semelhante à do método de junção de pandas. Ambos os métodos são para combinar dados em um quadro de dados semelhante. O método de mesclagem é mais versátil, exigindo especificar a chave. Também podemos especificá -lo nas colunas esquerda e direita, dependendo do trabalho do seu quadro de dados. As variáveis ​​no código são "S", "D", "G", "F", "K", "J", "B" e "Q". Os valores atribuídos são "9", "5", "6" e "7". A implementação externa de "junção" é feita em ambos.

A saída que vemos mostra os dados mesclados dos dois quadros de dados. O "nan" representa "não um número", o que significa que onde não há número atribuído nos dados que o "nan" mostra lá.

Exemplo # 04: O método de mesclagem explicitamente

Aqui, neste exemplo, o método de mesclagem é a destruição do índice e o valor do índice não é assumido no quadro de dados. Faremos esse método de acordo com o trabalho necessário, onde a especificação explícita é acompanhar. Ele mesclará os dados com base em um índice esquerdo ou índice direito com o parâmetro. As variáveis ​​nesse quadro de dados são "T", "R", "I", "U", "H", "O", "E" e "E". Os valores atribuídos são "2", "4", "6" e "4". O exemplo acima do método de mesclagem de pandas com a seleção da coluna de acordo com a necessidade é o método mais apresentável e valioso de unir os dois quadros de dados. Verificando no final da linha de código sobre a chave de mesclagem sendo única no conjunto de dados.

Na saída abaixo, o índice não é mostrado sem o índice, mas a função é executada com base no índice direito e esquerdo.

Conclusão

Os métodos Merge () e junção () são os dois métodos que são muito convenientes e eficazes. Ambas as funções são usadas para ingressar no quadro de dados separado no mesmo quadro de dados, mas têm uso diferente, dependendo do caso. Neste artigo, aprendemos as principais diferenças entre o método de junção e mesclagem do Pandas. Depois de fazer os exemplos e entender o método dos pandas ingressos, concluiremos -o com o conhecimento de que, se queremos uma união mais flexível e de estilo de banco de dados, é preferível ir com o método de mesclagem de pandas. Por outro.