Pandas DataFrame exclusivo

Pandas DataFrame exclusivo

A biblioteca Python mais popular que é utilizada na ciência de dados é chamada de pandas. Oferece programadores Python de alto desempenho, amigáveis ​​e ferramentas de análise de dados. Depois de entender as funções fundamentais e como utilizá -las, os pandas são uma ferramenta potente para alterar os dados. Em "Pandas", os métodos padrão para armazenar dados de forma tabular são os dados de dados. Podemos utilizar alguns métodos de “pandas” para obter os valores exclusivos na coluna de dados de dados “pandas”. Quando precisamos obter valores exclusivos nas colunas do quadro de dados e não queremos a duplicação de valores na coluna Dataframe "Pandas", podemos usar os métodos de que "pandas" fornece isso para fazer isso. Vejamos esses métodos neste guia, juntamente com alguns exemplos e saída para obter valores exclusivos na coluna de "pandas" do quadro de dados.

Métodos para obter valores exclusivos em colunas de dados de dados de “pandas”

Podemos utilizar dois métodos para obter os valores exclusivos nas colunas do quadro de dados "pandas". Abaixamos os valores duplicados e apenas obtemos os valores exclusivos nas colunas de dados de dados. Os métodos que os “pandas” prevêem para realizar esta tarefa são:

  • Utilizando o método exclusivo ().
  • Utilizando o método Drop_dupliactes ().

Agora, utilizaremos os dois métodos nos códigos "pandas" para obter os valores exclusivos nas colunas de dados de dados "pandas".

Exemplo # 01

O aplicativo "Spyder" é utilizado aqui para gerar esses códigos de "pandas" para utilizar os métodos que nos ajudam a obter os valores únicos nas colunas do quadro de dados "pandas". Devemos importar os módulos "pandas", que são necessários para o código "pandas", antes de criar o quadro de dados. Ao usar o termo "importar" e colocar "pandas como PD", importamos esses módulos.

Agora, com a ajuda de "PD", podemos obter rapidamente as funções ou métodos de "pandas". Em seguida, colocamos o "sujeito_data" no qual adicionamos "nome" e no "nome", estamos adicionando os dados do nome que são "Roman, William, Peter, Smith, John, Milli, Thomas e James". Em seguida, adicionamos os dados do assunto no "SubJ", que são "matemática, economia, ciência, matemática, estatísticas, estatísticas, estatísticas e computador". Em seguida, convertemos este "sujeito_data" no quadro de dados "sujeito_df" usando o "PD.DataFrame () ”Método. Colocamos “sujeito_df” no método “print ()” para que ele seja exibido no terminal.

Agora, queremos obter os valores exclusivos na coluna Dataframe "Pandas" "SubJ". Para esse fim, estamos usando o método "exclusivo ()" aqui e adicionamos o nome da coluna e também o nome do DataFrame, como mostrado abaixo. Adicionamos este método no "print ()" para que o resultado também seja exibido no terminal.

Agora, estamos pressionando o "Shift+Enter" para obter o resultado deste código e ele renderiza no terminal e também é mostrado aqui, que contém o quadro de dados com todos os valores. Este é o quadro de dados original que adicionamos no código e abaixo ele exibe os valores exclusivos da coluna "SubJ". Ele solta os valores duplicados e exibe os valores exclusivos da coluna "SubJ" do DataFrame.

Exemplo # 02

Criamos o "Sample_list", que contém algumas informações. Inserimos “Layla, 21, 28, 31, 14 e 39”, que aparecerá como a primeira coluna quando convertermos esta lista no DataFrame. Em seguida, adicionamos “lusy, 31, 25, 34, 26 e 21” como a segunda linha do DataFrame. Depois disso, temos “Peter, 38, 20, 20, 35 e 24” e “Layla 38, 23, 39 24, 23”, que será a terceira e quarta linhas do quadro de dados. Também inserimos mais três dados que são “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” e também “Peter, 21, 21, 31, 21, 29”.

Agora, estamos convertendo o "Sample_list" no "df_sample", que é o nome do DataFrame aqui, colocando o "PD.DataFrame () ”função. Além disso, definimos o nome das colunas deste quadro de dados e esses nomes são "Nome, ASS_1, ASS_2, ASS_3, ASS_4 e ASS_5". Em seguida, usamos o "print ()", que ajuda a exibir o quadro de dados "df_sample". Agora, estamos usando outro método neste exemplo para obter os valores exclusivos na coluna do quadro de dados. Este método é o método "Drop_duplicates ()" de "pandas".

No método "Drop_duplicates ()", definimos o nome da coluna em que queremos obter os valores exclusivos na coluna DataFrame do quadro. Estamos obtendo valores únicos da coluna "nome", soltando os valores duplicados nesta coluna com a ajuda do método "Drop_duplicates ()" e também renderizam esses valores exclusivos usando a função "print ()" aqui.

Os nomes duplicados são descartados e os valores exclusivos são renderizados após a aplicação do método "Drop_DUplicates ()". Você pode observar que o nome "Layla" aparece em três células da coluna "Nome". Mas quando o método "Drop_duplicates ()" é aplicado a esta coluna, todos os valores duplicados são descartados e um nome "Layla" apareceu na tela. Depois de soltar os valores duplicados, o novo DataFrame apareceu, que contém os valores únicos nesta coluna "nome". Dessa forma, podemos soltar os valores duplicados e obter o valor exclusivo na coluna do quadro de dados com a ajuda do método "Drop_duplicates ()".

Exemplo # 03

O mesmo dataframe é utilizado novamente e agora estamos aplicando o método "exclusivo ()" aqui. Com o método "exclusivo ()", colocamos o nome da coluna, bem como o nome do quadro de dados no qual queremos aplicar esse método "exclusivo ()" para obter os valores exclusivos. Isso apenas renderizará os valores únicos dessa coluna e não mostrará esses valores na forma de dataframe.

Aqui, o DataFrame contém sete valores na coluna "Nome", mas quando aplicamos o método "exclusivo ()" a esta coluna, apenas quatro valores apareceram e esses são os valores únicos dessa coluna. Não torna valores duplicados.

Exemplo # 04

O quadro de dados que criamos neste exemplo é o "f_g_df". Inserimos "my_fruits" e "my_vegs" neste documento de dados. A coluna "My_Fruits" contém "maçã, laranja, maçã, pêra, lichia, maçã, maçã, pêra e maçã". Em seguida, temos os "my_vegs", que contêm os nomes dos vegetais que são "pimenta, traga, cenoura, batata, batata, cenoura, cebola, alho e gengibre". Este DataFrame contém apenas duas colunas.

Agora, estamos obtendo os valores únicos em ambas as colunas com a ajuda do método "exclusivo ()". Mencionamos o nome do DataFrame. Em seguida, coloque o nome da coluna da coluna. Depois disso, utilizamos o método Append (). Neste anexo, colocamos novamente o nome do DataFrame e o nome da segunda coluna e colocamos o método "exclusivo ()". Isso obterá os valores únicos de ambas as colunas e depois anexará os valores exclusivos de ambas as colunas e as aparecerá na tela.

O DataFrame é renderizado primeiro contendo todos os valores. Depois disso, o método "exclusivo ()" é aplicado e os valores únicos de ambas as colunas são renderizados abaixo. Neste código, obtemos os valores exclusivos nas múltiplas colunas do quadro de dados usando o método "exclusivo ()".

Conclusão

A explicação completa de obter os valores únicos na coluna do quadro de dados é encontrada neste guia. Discutimos os métodos "exclusivos ()" e "Drop_duplicates ()", que nos ajudam a obter os valores exclusivos da coluna do DataFrame do quadro. Exploramos como usar esses métodos no código "pandas" usando esses métodos aqui em nossos códigos. Ilustramos exemplos diferentes neste guia e mostramos como obter os valores exclusivos de uma coluna usando o método "exclusivo ()", bem como o método "Drop_duplicates ()". Também exploramos como obter os valores exclusivos em várias colunas, utilizando o método "exclusivo ()" neste guia.