Os pandas contam distintos

Os pandas contam distintos
Este artigo explorará várias maneiras e métodos para determinar o número de itens exclusivos em um quadro de dados de pandas.

Dados de amostra

Antes de discutir como determinar o número de valores exclusivos em um quadro de dados, precisaremos de dados de amostra.

Um código de exemplo é mostrado abaixo:

# importar pandas
importar pandas como PD
df = pd.Quadro de dados(
'Salário': [120000, 100000, 90000, 110000, 120000, 100000, 56000],
'Departamento': ['Desenvolvedor de Jogos', 'Desenvolvedor de Banco de Dados', 'Desenvolvedor de Fronteiro', 'Desenvolvedor de Pilhas Full', 'Desenvolvedor de Database', 'Security Researcher', 'Cloud-Engineer']],
'Classificação': [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
índice = ['Alice', 'Michael', 'Joshua', 'Patricia', 'Peter', 'Jeff', 'Ruth'])
df

O código acima deve criar um amostra de quadro de dados que possamos usar neste tutorial. A forma tabular resultante dos dados é como mostrado:

#1 Pandas Método exclusivo

A função exclusiva () é o primeiro método que podemos usar para determinar o número de valores exclusivos em um quadro de dados.

A função leva uma série como entrada e retorna uma lista dos valores únicos.

Por exemplo, para calcular os itens exclusivos na coluna salarial, podemos fazer:

Impressão (PD.único (df ['salário']))

O código acima deve retornar os itens exclusivos na coluna 'salário'.

[120000 100000 90000 110000 56000]

Se você deseja o número de valores exclusivos, você pode obter o comprimento da lista como mostrado:

imprimir (f "itens únicos: len (pd.Único (df ['salário'])) ")

O código acima deve retornar:

Itens únicos: 5

#2 Pandas Nunique Função

A função Nunique () permite obter o número de valores exclusivos ao longo de um eixo especificado.

Um exemplo é como mostrado:

print (f "[número de itens/coluna exclusivos] \ n df.Nunique (eixo = 0) ")

O código acima deve retornar o número de itens exclusivos em cada coluna. A saída resultante é como mostrado:

[Número de itens/coluna exclusivos]
Salário 5
Departamento 6
Classificação 4
DTYPE: INT64

Você também pode buscar o número de itens exclusivos em uma coluna específica, como mostrado:

Imprimir (df.salário.Nunique ())

O exposto acima deve retornar o número de itens exclusivos na coluna salarial.

#3 pandas value_counts ()

Os pandas também nos fornecem a função value_count (). Esta função retorna o número de valores exclusivos em uma coluna especificada.

Um exemplo é como mostrado:

res = lista (df.salário.value_counts ())
imprima (f "itens exclusivos: len (res)")

A função value_counts () retorna a contagem de cada valor na coluna. Em seguida, convertemos o resultado em uma lista e obtemos o comprimento.

Isso deve obter o número de itens exclusivos na coluna:

Itens únicos: 5

Conclusão

Este artigo discutiu vários métodos e técnicas que podemos usar para determinar o número de valores exclusivos em um quadro de dados de pandas.