Dados de amostra
Antes de discutir como determinar o número de valores exclusivos em um quadro de dados, precisaremos de dados de amostra.
Um código de exemplo é mostrado abaixo:
# importar pandasO código acima deve criar um amostra de quadro de dados que possamos usar neste tutorial. A forma tabular resultante dos dados é como mostrado:
#1 Pandas Método exclusivo
A função exclusiva () é o primeiro método que podemos usar para determinar o número de valores exclusivos em um quadro de dados.
A função leva uma série como entrada e retorna uma lista dos valores únicos.
Por exemplo, para calcular os itens exclusivos na coluna salarial, podemos fazer:
Impressão (PD.único (df ['salário']))O código acima deve retornar os itens exclusivos na coluna 'salário'.
[120000 100000 90000 110000 56000]Se você deseja o número de valores exclusivos, você pode obter o comprimento da lista como mostrado:
imprimir (f "itens únicos: len (pd.Único (df ['salário'])) ")O código acima deve retornar:
Itens únicos: 5#2 Pandas Nunique Função
A função Nunique () permite obter o número de valores exclusivos ao longo de um eixo especificado.
Um exemplo é como mostrado:
print (f "[número de itens/coluna exclusivos] \ n df.Nunique (eixo = 0) ")O código acima deve retornar o número de itens exclusivos em cada coluna. A saída resultante é como mostrado:
[Número de itens/coluna exclusivos]Você também pode buscar o número de itens exclusivos em uma coluna específica, como mostrado:
Imprimir (df.salário.Nunique ())O exposto acima deve retornar o número de itens exclusivos na coluna salarial.
#3 pandas value_counts ()
Os pandas também nos fornecem a função value_count (). Esta função retorna o número de valores exclusivos em uma coluna especificada.
Um exemplo é como mostrado:
res = lista (df.salário.value_counts ())A função value_counts () retorna a contagem de cada valor na coluna. Em seguida, convertemos o resultado em uma lista e obtemos o comprimento.
Isso deve obter o número de itens exclusivos na coluna:
Itens únicos: 5Conclusão
Este artigo discutiu vários métodos e técnicas que podemos usar para determinar o número de valores exclusivos em um quadro de dados de pandas.