Os pandas verificam se duas colunas são iguais

Os pandas verificam se duas colunas são iguais
Freqüentemente, você deseja comparar dados em duas colunas em um quadro de dados de pandas e exibir os resultados em uma terceira coluna. Aprenderemos todas as diretrizes sobre como comparar as colunas em um quadro de dados de pandas neste post. Pandas é um pacote python útil para análise de dados, visualização, purificação de dados e outras atividades. Continue lendo este artigo para encontrar todos os detalhes sobre a comparação de duas colunas em um quadro de dados de pandas com exemplos.

Módulo pandas em python

O módulo Python Pandas é essencialmente um pacote python gratuito. Possui uma ampla gama de aplicações em computação, análise de dados, estatísticas e outros campos.

O módulo Pandas faz uso dos principais recursos do módulo Numpy. Numpy é uma estrutura de dados de baixo nível. Ele permite que os usuários manipulem matrizes multidimensionais e apliquem várias operações matemáticas a eles. Os pandas oferecem uma interface de usuário mais avançada. Também inclui capacidade robusta de séries temporais e alinhamento de dados tabulares aprimorados.

O DataFrame é a estrutura de dados principal dos pandas. É uma estrutura de dados em 2-D que permite armazenar e manipular dados que estão em forma de tabular.

Os pandas têm muitos recursos para o DataFrame. Alinhamento de dados, corte, estatística de dados, agrupamento, concatenando dados, fusão e assim por diante são exemplos.

Por que comparar duas colunas em pandas?

Quando desejamos comparar os valores de duas colunas ou ver como elas são semelhantes, devemos compará -las. Por exemplo, se tivermos duas colunas e queremos determinar se a coluna é mais ou menos que a outra coluna ou sua semelhança, comparar as colunas é a maneira apropriada de fazê -lo.

Para associar os valores em pandas e numpy, há uma variedade de abordagens. Neste editorial, passaremos por inúmeras estratégias e as ações envolvidas em colocá -las em prática.

Suponhamos que tenhamos duas colunas: a coluna A contém vários projetos, e a coluna B tem os nomes associados. Na coluna D, temos vários projetos não relacionados. Com base nos projetos na coluna D, desejamos devolver os nomes associados da coluna B. No Excel, como você pode comparar as colunas A e D e obter os valores relativos da coluna B? Vejamos alguns exemplos e entendem como você pode conseguir isso.

Exemplo 1:

O np.onde () a técnica será usada neste exemplo. A sintaxe é Numpy.onde (condição [, a, b]). Este método recebe a condição e, se a condição for verdadeira, o valor que fornecemos ('a' na sintaxe) será o valor que fornecemos a eles.

Nós importamos as bibliotecas necessárias, pandas e numpy, no código abaixo. Construímos um dicionário e listamos os valores para cada coluna.

Temos a condição para comparar as colunas usando o método where () em Numpy. Se 'First_Column' for menor que 'Second_Column' e 'First_Column' for menor que 'terceiro_column,' Os valores de 'First_Column' são impressos. Se a condição falhar, o valor será definido como 'nan.'Esses resultados são salvos na nova coluna do quadro de dados. Finalmente, o DataFrame é apresentado na tela.

Importar pandas
importar numpy
dados =
'First_column': [2, 3, 40, 5],
'Second_column': [8, 5, 30, 10],
'Terceiro_column': [4, 9, 12, 40]

d_frame = pandas.DataFrame (dados)
d_frame ['new'] = Numpy.onde ((d_frame ['primeiro_column']] <= d_frame['Second_Column']) & (
d_frame ['primeiro_column'] <= d_frame['Third_Column']), d_frame['First_Column'], numpy.nan)
Imprimir (d_frame)

A saída é mostrada abaixo. Aqui você pode ver o primeiro_column, o segundo_column e o terceiro_column. A coluna 'nova' mostra os valores resultantes após a execução do comando.

Exemplo 2:

Este exemplo demonstra como usar o método iguals () para comparar duas colunas e retornar o resultado na terceira coluna. Quadro de dados.equals (outro) é a sintaxe. Este método verifica se duas colunas têm os mesmos elementos.

Estamos usando o mesmo método no código abaixo, que envolve a importação de bibliotecas e a construção de um quadro de dados. Criamos uma nova coluna (chamada: Fourth_Column) neste DataFrame. Esta nova coluna é igual a 'Second_Column' para mostrar o que a função executa neste DataFrame.

Importar pandas
importar numpy
dados =
'First_column': [2, 3, 40, 5],
'Second_column': [8, 5, 30, 10],
'Terceiro_column': [4, 9, 12, 40],
'Fourth_column': [8, 5, 30, 10],

d_frame = pandas.DataFrame (dados)
print (d_frame ['Fourth_column'].equals (d_frame ['segundo_column'])))

Quando executamos o código de amostra fornecido acima, ele retorna 'True', como você pode visualizar na imagem em anexo.

Exemplo 3:

Este método nos permite passar no método e, de outra forma. Usando esta estratégia, minimizamos o tempo e o código.

O mesmo código também é usado neste exemplo para criar um quadro de dados em pandas. Criamos uma função anônima temporária no Apply () em si, utilizando lambda usando o método Apply (). Ele determina se 'Column1' é menor que 'Column2' e 'Column1' é menor que 'Column3'. Se verdadeiro, o valor 'column1' será devolvido. Ele exibirá nan se for falso. A nova coluna é usada para manter esses valores. Como resultado, as colunas foram comparadas.

Importar pandas
importar numpy
dados =
'First_column': [2, 3, 40, 5],
'Second_column': [8, 5, 30, 10],
'Terceiro_column': [4, 9, 12, 40],

d_frame = pandas.DataFrame (dados)
d_frame ['new'] = d_frame.Aplicar (Lambda X: X ['First_Column'] se x ['First_Column'] <=
x ['Second_Column'] e X ['First_Column']
<= x['Third_Column'] else numpy.nan, axis=1)
Imprimir (d_frame)

A imagem anexada mostra a comparação de duas colunas.

Conclusão:

Este foi um curto post sobre o uso de pandas e python para comparar uma ou mais colunas de dois quadros de dados. Examinamos a função iguals () (que verifica se dois objetos de pandas têm os mesmos elementos), o NP.onde () método (que retorna itens de x ou y, dependendo dos critérios), e o método Apply () (que aceita uma função e o aplica a todos os valores em uma série de pandas). Se você não estiver familiarizado com o conceito, pode usar este guia. Para sua conveniência, a postagem inclui todos os detalhes e inúmeras amostras.