Método Pandas Merge ()
O “PD.Merge () ”pode ser utilizado pela seguinte sintaxe dada:
Aqui, alguns parâmetros necessários são "deixados", o que significa o quadro de dados esquerdo, a "direita", que significa o quadro de dados direito, o "como" sobre como ingressar nos quadros de dados, o "ON" que se refere à coluna que usamos para ingressar no dois dados de dados., e o "esquerd_on" e "right_on" que ajudam a especificar a coluna esquerda ou direita para ingressar.
Realizaremos alguns exemplos práticos para implementar esse método neste aprendizado para encontrar uma junção cruzada entre dois dados de dados.
Exemplo 1: Utilizando Pandas PD.Método Merge () para obter uma união cruzada entre dois quadros de dados com uma única coluna
Começando com a primeira ilustração para a implementação prática do código Python para executar uma junção cruzada nos quadros de dados do Pandas, precisamos procurar uma ferramenta ou software que possa executar nossos códigos Python. Muitas ferramentas suportam a linguagem python. Entre essas opções diferentes, selecionamos a ferramenta "Spyder". Primeiro precisamos instalar a configuração da ferramenta "Spyder". Uma vez feito, lançamos a ferramenta. Abra um novo arquivo clicando no botão "Arquivo", pressionando o símbolo do arquivo ou atingindo as teclas "Ctrl+N".
Nosso novo arquivo com o “.extensão py ”que se refere a“ python ”está pronta para começar a trabalhar. Vamos agora focar no código. Você pode observar que a primeira palavra do título do nosso artigo é "pandas", o que significa que algo será feito utilizando a biblioteca "pandas". Entendemos que nosso pré -requisito para implementar este código é importar a biblioteca de pandas para o arquivo python. Escrevemos uma linha de código “Importar pandas como PD”. Isso importa todos os recursos da biblioteca de pandas. Além disso, usamos o "AS PD", o que significa que, onde quer que precisemos acessar qualquer método de pandas neste código, temos que escrever "PD" em vez de escrever o formulário completo "pandas".
À medida que realizamos a junção cruzada, somos obrigados a ter dois quadros de dados de pandas onde exercemos esse método. Você aprenderá aqui como construir um quadro de dados definido pelo usuário. Para criar um quadro de dados, os pandas nos dão um “PD.DataFrame () "Função em que" PD "é o" pandas ". Então, acessamos um método de pandas. O "DataFrame ()" é a palavra -chave dessa função que, quando invocada, gera um DataFrame. Fazemos um DataFrame usando este “PD.DataFrame () ”Método e inicialize -o com uma única coluna“ NUM ”. Esta coluna contém dois valores que são "4" e "5". Chamando o “PD.O método de dataframe () ”gera um DataFrame com esses valores fornecidos.
Agora, para armazenar esse quadro de dados, criamos um objeto DataFrame "V1". O DataFrame de dados recém -gerado agora está acessível por esta variável "V1". Para ver esse quadro de dados no terminal, empregamos o método "print ()". Em seguida, criamos nosso segundo quadro de dados seguindo as mesmas etapas mencionadas ao criar o primeiro DataFrame "V1". Invoque o “PD.Dataframe () ”para criar um DataFrame que foi inicializado por uma coluna com três valores“ R ”,“ S ”e“ T ”. Para armazenar este DataFrame, criamos uma variável "V2". Para exibir o quadro de dados "V2", utilizamos novamente o método "print ()".
Se você é novo na ferramenta "Spyder", pode estar se perguntando como executará o código. Para executar este arquivo python, clique no botão "Executar arquivo" ou pressione as teclas "Shift+Enter". Agora, você pode ver dois quadros de dados que acabamos de criar que são exibidos no terminal da ferramenta "Spyder".
A tarefa principal começa daqui. Agora temos que aplicar a cross se unir nos dois dados de dados. Para executar uma junção cruzada em dois quadros de dados, deve haver alguma coluna "chave" que esteja presente nos dois quadros para criar um link entre eles para que possamos mesclá -los usando -o usando. Como podemos ver, não há nada, então agora adicionamos um nos dois quadros de dados "V1" e "V2", que é uma coluna comum. Adicionamos a mesma coluna "chave" aos dois quadros de dados que "v1 ['key] = 0" e "v2 [' key '] = 0". Agora, podemos mesclá -los nesta coluna "chave".
Para mesclá -los, utilizamos o “PD.Merge () ”Método. Entre seus parênteses, fornecemos os quadros de dados "V1" e "V2". O parâmetro "on" pede que dêmos o nome comum da coluna com base no qual podemos mesclá -los. Então, parece "on = 'key'". Com esta função, usamos o “.Método Drop () ”para soltar a coluna“ chave ”assim que a mesclagem for realizada. A função "Drop ()" possui dois parâmetros - o nome da coluna "Key" e o "eixo = 1", o que significa que a queda é em termos de coluna. Criamos uma “loja” variável para manter a saída do “PD.Merge () ”função. Chamamos o método "print ()" para ver a saída.
A execução do programa fornecido nos fornece um quadro de dados que possui todas as combinações possíveis de linha do DataFrame fornecido.
Exemplo 2: Utilizando Pandas PD.Método Merge () para obter uma união cruzada entre dois quadros de dados com várias colunas
Vamos realizar outro exemplo aqui no mesmo tópico, o Pandas Cross Join. Para isso, lançamos nossa ferramenta "Spyder" e abrimos um novo arquivo pressionando o "Ctrl+N". O requisito mais importante do código é importar as bibliotecas necessárias. Utilizamos um método de pandas, por isso importamos a biblioteca de pandas como PD. Agora, construímos nosso primeiro quadro de dados usando o “PD.DataFrame () ”Método.
Inicializamos esse quadro de dados com duas colunas - "Color" e "num". A coluna "cor" contém três valores que são "vermelhos", "verdes" e "azuis". Enquanto a coluna "num" tem o mesmo comprimento de valores que são "101", "110" e "100". Criamos uma variável "P1" para armazenar a saída de chamando o "PD.DataFrame () ”Método. Agora, podemos obter o quadro de dados usando esta variável. Empregamos a função "print ()" para exibir o primeiro quadro de dados no terminal.
Nosso primeiro DataFrame é criado com sucesso. Geramos o segundo dadoframe agora. Novamente, utilizamos o “PD.DataFrame () ”Método e crie uma coluna dentro de seus parênteses. Esta coluna “serial” armazena quatro valores. Esses valores são "C1", "C2", "C3" e "C4". Para armazenar esse quadro, criamos uma variável "P2". Em seguida, invocamos a função "print ()" para exibir o quadro de dados "P2".
A execução do código Python anterior nos produz a seguinte saída que exibe 2 DataFrames:
Geramos uma coluna "chave" em cada quadro de dados onde podemos mesclá -los. Aqui, usamos o valor “2” para as colunas “P1 ['key']” e “p2 ['key']”. Finalmente, invocamos o “PD.Função Merge () ”para mesclar os quadros de dados nas bases da coluna“ chave ”. e a ".Método Drop () ”para remover a coluna“ chave ”após a fusão de ambos os dados de dados. Criamos uma variável de "pintura" para armazenar o DataFrame mesclado. O "print ()" é utilizado para exibir o quadro de dados cruzado final armazenado em "Paint".
Isso nos leva ao seguinte quadro de dados de entrequento único exibido, gerado a partir da fusão de dois quadros de dados.
Conclusão
A mesclagem de dois quadros de dados em um único quadro de dados cruzados é uma técnica muito fácil e importante para aprender. Este artigo enfatizou e explicou o conceito de cross se unir no Pandas Dataframe. Elaboramos em todos os detalhes menores do download da ferramenta necessária para a obtenção da saída desejada. Por meio de exemplos práticos de códigos Python implementados e executados na ferramenta "Spyder", fizemos um esforço intencional para trazer a você um aprendizado frutífero e um conceito fácil de entender dos pandas de Python.