Pandas se fundem em várias colunas

Pandas se fundem em várias colunas
Os pandas são essencialmente um pacote python que é frequentemente usado para trabalhar com coleções de dados. É um código aberto que pode ser utilizado em tarefas precisas de aprendizado de máquina. Além disso, as matrizes multidimensionais são suportadas. As principais características dos pandas são o alinhamento de dados e o conjunto de dados remodelando. Pode ser construído sobre a linguagem de programação Python usada com código aberto.

Mesclar no método de coluna múltipla ()

Existem várias técnicas para operar os conjuntos de dados. O método de mesclagem é um deles. Várias colunas de dois ou mais dois quadros de dados podem ser mesclados para manter os dados de uma maneira boa. Sempre que precisamos mesclar dois pandas de dados de dados em várias colunas, usamos os “pandas.Merge () ”Método. É uma maneira eficiente para o cientista de dados, pois poderia economizar tempo para manter o banco de dados de uma maneira melhor. Para melhorar a fidelidade do código, precisamos mesclar nossos quadros de dados em pandas, porque dois quadros de dados podem ter diferentes tipos de informações sobre o mesmo elemento e eles podem ter segmentos importantes iguais.

Em nosso artigo, veremos como podemos mesclar as múltiplas colunas de dados de dados usando os “pandas.Merge () ”Método. Se queremos mesclar os conjuntos de dados sem nenhuma coluna de chave, ele mescla todas as colunas comuns no quadro de dados. Mas substitui cada coluna comum por uma única coluna de ambos os conjuntos de dados.

Sintaxe:

Exemplo 1: Exibindo o método Merge () em várias colunas com uma coluna semelhante em pandas de dois quadros de dados

Aqui, olhamos para a fusão de várias colunas em dados de dados. Raramente usamos a técnica "mescla" para combinar dois quadros de dados. Agora, criamos nossos dois quadros de dados. Primeiro, importamos os pandas de código aberto como "kd". Em seguida, criamos nosso primeiro dadoframe usando o “KD.DataFrame ”e nomeou -o“ CD1 ”, que declara as três variáveis ​​que são“ M ”,“ K ”e“ A ”.

Basicamente "M", "K" e "A" são as três colunas do quadro de dados "CD1". Os valores que são atribuídos à variável da coluna "M" são "10", "10", "20", "20" e "30". Os valores atribuídos a "K" são "10", "10", "20", "20" e "20". Os valores atribuídos à variável "A" são "130", "90", "120", "50" e "50". Aqui, nosso primeiro dadoframe "CD1" é criado. Agora, venha para o segundo quadro de dados chamado "CD2", que possui três colunas declarando três variáveis ​​"M", "K" e "N". Os valores atribuídos a "M" são "10", "20", "20", "20" e "30". Os valores atribuídos à variável "K" são "10", "10", "10" "20" e "20". E os valores atribuídos de "n" são "150", "160", "170", "180" e "130". Aqui, nosso DataFrame "CD2" é criado.

Agora, chegamos à nossa função principal “KD.Merge () ”, que aplicamos para mesclar as várias colunas de nosso quadro de dados. Aqui, aplicamos o parâmetro "esquerda" às nossas colunas "M" e "K", pois elas são semelhantes em ambos os dados de dados. Depois disso, simplesmente aplicamos nossa função "print ()" para exibir a "mesclagem" de duas colunas. Neste exemplo, discutimos a "mescla" de duas colunas em "CD1" e "CD2" Dataframes com colunas semelhantes que são "M" e "K". Simplesmente mescla as duas colunas semelhantes dos diferentes quadros de dados.

Agora, discutimos a saída do nosso código. A primeira coluna que começa de "0" a "4" são os números do índice. Como a coluna "M" é semelhante em ambos os quadros de dados, ela é mesclada e exibida uma vez com valores que são "10", "10", "20", "20" e "30". Depois disso, a próxima coluna exibida é "K", que também é uma coluna semelhante. Também é mesclado e mostrado apenas uma vez junto com os dados de "10", "10", "20", "20" e "20". As diferentes colunas de ambos os quadros de dados são "a" e "n" que são exibidos ao longo deles. Os valores desta coluna semelhante "A" exibidos são "130", "90", "120", "50" e "50". A última coluna exibida na saída é "n" junto com dados que são "150", "150", "180", "180" e "130".

Colunas semelhantes são mescladas no lado esquerdo por causa da aplicação do método "esquerda". O restante das colunas não comuns é exibido à direita por padrão. Como as colunas "M" e "K" foram semelhantes em ambos os quadros de dados, eles podem ser exibidos uma vez na saída após a implementação dos “pandas.método de merge () ”, juntamente com as colunas restantes“ a ”e“ n ”.

Exemplo 2: Exibindo Merge () em várias colunas com nomes distintos em dois dados de dados

Agora, discutimos a mesclagem de várias colunas com nomes de colunas diferentes neste exemplo. Nesse caso, importamos a biblioteca do panda como "fb". Primeiro de tudo, criamos nossos quadros de dados como "PK1" e "PK2". O DataFrame "PK1" declara com três nomes de variáveis ​​que são "sujeitos", "cobranças" e "time_period", que atuam como colunas. Os valores armazenados em "assuntos" são "web", "gramática", "social", "eletrônico" e "TIC". Os valores de dados que são armazenados na coluna "cobranças" são "10000", "20000", "30000", "40000" e "50000". A última coluna do quadro de dados "PK1" é "time_period", que armazena os valores de "4hrs", "5hrs", "6hrs", "5.5 horas "e" 5hrs ".

O segundo quadro de dados chamado "PK2" possui três colunas que são "sujeitos", "cobranças" e "percentil". O valor que atribuímos aos "sujeitos" é "TIC", "gramática", "social", "eletrônico" e "banco de dados". Na segunda coluna "cobranças" do DataFrame, atribuímos os valores de "10000", "20000", "30000", "40000" e "50000". A última coluna "percentil" armazena os valores que são "5%", "10%", "20%", "10%" e "5%". Depois de criar os quadros de dados, simplesmente os exibimos usando a função "print ()".

Quando nossos dados de dados são criados, aplicamos a implementação dos “pandas.Merge () ”função. Nós mesclamos o primeiro dataframe "PK1" junto com o segundo quadro de dados "PK2". Aqui, queremos mesclar as diferentes colunas dos quadros de dados, por isso usamos os parâmetros de "Left_on" e "Right_on". Usamos esses parâmetros na coluna de "assuntos" de ambos os dados de dados. Depois disso, os dois quadros de dados são mesclados e simplesmente o exibimos pela função "print ()".

Agora, dê uma olhada na nossa saída do respectivo código. Como podemos ver em nossa exibição de saída do primeiro índice de "0" a "4", ele exibe nosso primeiro quadro de dados de "PK1" das primeiras colunas "assuntos" que contêm "web", "gramática", "social" , "Electronic" e "TIC". A segunda coluna “Cobras” contém os valores numéricos de “10000”, “20000”, “30000”, “40000” e “50000. A terceira coluna “time_period” contém os valores “4 horas”, “5hrs”, “6hrs”, “5.5 horas "e" 5hrs ".

Em seguida, exibe os dados do quadro de dados "PK2", que também contém três colunas: "Assuntos", "Cobras" e "percentil". A coluna "Assunto" exibe "TIC", "Grammer", "Social", "Electronic" e "Database". A coluna "cobranças" exibe seus valores de "10000", "20000", "30000", "40000" e "50000". A terceira coluna "percentil" exibe dados de "5%", "10%", "20%", "10%" e "5%".

Finalmente, depois de aplicar os “pandas.Função Merge () ”, combina os dados de ambos os quadros. Por padrão, ele mescla a coluna "Assunto" de ambos os dados de dados com valores semelhantes e os exibe junto com as várias colunas diferentes de ambos os dados de dados. Após a mesclagem de ambos os dados de dados, exibimos as cinco colunas diferentes mescladas que são "sujeitos", "cobranças_x", "time_period", "cobranças" e "percentil", juntamente com todos os dados que atribuímos.

Conclusão

Descrevemos como combinar as várias colunas neste artigo. Discutimos isso usando os exemplos de fusão de dois quadros de dados que contêm colunas semelhantes e diferentes. Para mesclar as colunas semelhantes, apenas usamos o simples “kd.Função de Merge () ”e mescla a coluna semelhante por padrão pela função. Para mesclar as diferentes colunas múltiplas, usamos o “FB.Merge () ”, juntamente com os parâmetros“ Left_on ”e“ Right_on ”.