Os pandas concatenam dois quadros de dados

Os pandas concatenam dois quadros de dados
As informações de que precisamos geralmente aparecem em inúmeras fontes em cenários do mundo real. Para avaliar as estatísticas, frequentemente exigimos a integração de vários arquivos em um uniforme de dados de dados. Com a ajuda dos pandas, é possível combinar rapidamente a série, bem como o quadro de dados com os diferentes tipos de lógica predefinida para os índices mais recursos de álgebra relacional para as funções de junção e merge do tipo Merge. Além disso, os pandas têm ferramentas que permitem comparar duas séries ou quadros de dados e listar quaisquer variações. Você pode precisar combinar os dados usando uma variedade de abordagens. Por exemplo, você pode concatenar os conjuntos de dados para mesclar. Concatenando os conjuntos de dados pode ser feito em vários métodos.

As ações de concatenação em todo o eixo são tratadas pelo método concat () e a lógica de configuração adicional para os índices em planos adjacentes também é realizada. Devemos considerar certas seleções ao concatenar ou anexar os quadros de dados. Tais opções podem envolver coisas como se quisermos manter os índices originais, adicionar chaves mais benéficas e mais.

A utilização do método Pandas Concatenate requer a seguinte sintaxe:

Temos uma carga de inúmeras configurações à nossa disposição com esse método para adaptar ainda mais a concatenação dos dados. Você não precisará necessariamente compreender totalmente cada um deles para navegar. No entanto, é importante estar ciente de sua existência, bem como o que eles executam se o seu caso de uso os exigir.

Exemplo 1: Concatenar colunas semelhantes de dois quadros de dados usando a função Pandas Concatenate

O exemplo mais simples e fácil de começar é concatenar as mesmas colunas dos dois quadros de dados diferentes.

Como sabemos, trabalhar com o módulo pandas da Python requer a importação da biblioteca de pandas. Então, começamos nossa implementação prática dos códigos de exemplo importando a biblioteca de pandas em Python como PD.

Uma vez feito, agora estamos prontos para começar a trabalhar em nosso script principal, pois os recursos de pandas estão atualmente acessíveis para nós.

Em seguida, criamos nossos quadros de dados fundamentais. Precisamos de dois quadros de dados aqui, pois temos que executar a concatenação.

As variáveis ​​"d1" e "d2" foram geradas e são mostradas no exemplo dado. Utilizamos a função Pandas Dataframe para construir os quadros de dados. O Pd.O método dataframe () é invocado. Dentro de seus aparelhos, damos 2 valores - id e nome. Os valores para ambas as colunas dos quadros de dados são atribuídos. Empregamos o método print () para exibir os quadros de dados D1 e D2.

A imagem de saída a seguir mostra 2 quadros de dados com as mesmas colunas:

Criamos com sucesso nossos quadros de dados. O próximo passo é concatená -los. Para esse fim, empregamos o método Pandas Concatenate - PD.concate (). Este método mescla os dados das mesmas colunas dos quadros de dados D1 e D2.

Construímos uma variável "con_output" que armazena o resultado de invocar o PD.função concat (). Você só precisa fornecer o PD.concat () função com os objetos que você deseja concatenar para que a lista de variáveis ​​possa ser simplesmente passada. Considerando isso, podemos entrar no [D1, D2]. Certifique -se de que, se você estiver colocando a lista diretamente dentro do PD.função concate (), você precisa usar os colchetes "[]". Caso contrário, ele fornece um prompt de erro. Nós invoquemos o método print () e o passamos a variável "con_output" para exibir o que formos armazenados nele.

Os quadros de dados concatenados que contêm as colunas semelhantes são obtidos executando o programa acima mencionado.

Os quadros de dados são mesclados como eram, pois não colocamos nenhum parâmetros. Devido a esses fatores, as configurações de índices reais estão incluídas. O índice pode ocasionalmente exigir um ajuste. O índice ignorante = o parâmetro true pode ser utilizado para fazer isso.

Como resultado, os índices são alterados a partir de 0 indo até o ponto final do tamanho. Os valores de índice modificados são mostrados no seguinte instantâneo:

Exemplo 2: Concatenar diferentes colunas de dois quadros de dados usando a função Pandas Concatenate com parâmetro de junção

Anexamos nossos quadros de dados um para o outro, verticalmente, para concatená -los. Utilizando as colunas de cada conjunto de dados que possuem valores semelhantes, como um ID exclusivo compartilhado, é um método adicional para combinar os dados de dados. "Juntar" é o processo de fusão dos quadros de dados, utilizando um campo compartilhado. A (s) chave (s) de junção refere -se às colunas que incluem os dados compartilhados. Esse método de combinar os quadros de dados é frequentemente vantajoso, quando um quadro de dados serve como uma "tabela de pesquisa" para o conteúdo suplementar que pretendemos integrar na segunda tabela. Idêntico à maneira como conectamos as tabelas em um banco de dados relacional, esse método une muitos conjuntos de dados.

Você possui flexibilidade de maneiras para tratar os eixos adicionais sempre que ligamos numerosos dados de dados, excluindo o que está sendo combinado.

Existem duas abordagens para realizar isso. A primeira abordagem é entrar no junção = "externo" para obter a combinação de todos esses. A configuração referida é a configuração padrão porque nenhum dado está comprometido. A outra estratégia é tornar a passagem em consideração com a junção = "interior".

Vamos considerar a seguinte ilustração:

Aqui, criamos dois quadros de dados com diferentes colunas. O primeiro DataFrame "D1" consiste em 2 colunas - ID e Name. Enquanto o segundo quadro de dados “D3” tem 2 colunas - cidade e idade. Criamos uma variável "resultado" para armazenar a saída de chamar o PD.função concat ().

Entre os parênteses da função Pandas Concatenate, especificamos o nome dos dados de dados como D1 e D3. A linha final do script chama o método print ().

Isso nos produz a seguinte saída:

Os dois quadros de dados na instância mencionada anteriormente são mesclados. No entanto, como algumas colunas estavam ausentes nos quadros de dados, eles foram fornecidos usando as entradas em branco. Essas entradas são inseridas, pois o valor padrão do argumento "junção =" é "externo", o que explica sua inclusão. Como resultado, todos os dados entre as entidades são retidos.

"Interior" é um argumento viável diferente para o método.

Utilizamos os argumentos "ingressar" e "eixo" neste caso. Para o argumento "ingressar", colocamos o valor "interno", enquanto, para o argumento do "eixo", ele está definido como "1". O "Eixo" é o eixo ao longo da qual concatenamos nossos quadros de dados. Está definido como 0 por padrão. As colunas adicionais são introduzidas se houver um requisito para aumentar o número de objetos no eixo = 1. O Pd.Concat () executa uma junção externa nas linhas por padrão. Agora, alteramos os valores padrão para que ele execute o interno da coluna no interior dos dados de dados para concatenação.

A saída que obtemos do código executado anteriormente é mostrado no seguinte:

Conclusão

Esta discussão se concentrou na função de concatenato de pandas. Demos uma introdução detalhada à função concatenada dos pandas e a necessidade de empregar este método. A sintaxe para usar esta técnica é fornecida no início e todos os parâmetros que você pode usar dentro desta função são identificados. Elaboramos a concatenação dos dois quadros de dados com uma demonstração prática dos códigos de exemplo. Combinar as mesmas colunas dos diferentes quadros de dados, bem como combinar o quadro de dados com diferentes colunas, é explicado nesta redação. Aprendendo a trabalhar com os pandas.A função concat () acomoda você em lidar e analisar os dados.