Os pandas obtêm valor mais frequente

Os pandas obtêm valor mais frequente
O objetivo deste artigo é mostrar o valor mais frequente em um conjunto de números. Para somar o número de vezes que um elemento ou número aparece, a função value_counts () do python é usada. O método mode () pode ser usado para obter o elemento mais frequentemente ocorrido. Se você deseja maneiras diferentes de obter os valores mais frequentes no Python, este artigo possui todas as diretrizes.

Qual é o método value_counts () em python?

Os valores exclusivos de um objeto Pandas são contados usando o método de contagem de valor (). No Python, geralmente empregamos essa técnica para disputa de dados, bem como exploração de dados.

O método value_counts () pode funcionar com uma variedade de objetos de pandas. Série Pandas, Dataframes de Pandas e colunas de dados de dados são exemplos desses (que são objetos da série Pandas).

No entanto, dependendo do tipo de objeto com o qual você está trabalhando, como implementa o método value_counts () diferirá ligeiramente.

Outros argumentos opcionais podem ser usados ​​para alterar a funcionalidade do método value_counts ().

Sintaxe da função da série Pandas ()

Em uma série de pandas, o valor mais comum é simplesmente o modo da série. O método da série Pandas () é usado para adquirir informações sobre o modo. A sintaxe é a seguinte. Os modos da série são devolvidos em ordem classificada.

# df ['coluna'].modo()

Sintaxe da função pandas value_counts ()

Para buscar o maior valor de contagem, use as funções pandas value_counts () e idxmax () simultaneamente. A sintaxe é a seguinte:

# df ['coluna'].value_counts ().idxmax ()

Agora, vejamos alguns exemplos práticos para ver como você pode alcançar os valores mais frequentes seguindo quais etapas.

Exemplo 1:

Devemos primeiro estabelecer o quadro de dados antes de prosseguir para as etapas de determinar o valor mais frequente com o modo (). Este é um DataFrame com um campo de categoria que usaremos para o restante do tutorial. O DataFrame 'd_frame' contém os nomes ('Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill') e Informações da equipe ('A', 'B', ' C ',' d ',' e ',' a ',' b ',' a ',' b ',' a '). A coluna "Team" do DataFrame é um campo de categoria com valores que denotam a equipe designada para cada aluno.

O módulo Pandas é importado no início do código no código de referência abaixo. O DataFrame é então gerado e apresentado na tela.

Importar pandas
d_frame = pandas.Quadro de dados(
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipe': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b']
)
Imprimir (d_frame)

Na imagem abaixo, os nomes dos alunos são exibidos juntamente com o nome da equipe ao qual eles foram designados.

Mostraremos como usar a função Mode () para determinar o valor mais frequente. O modo, que é uma estatística descritiva, é basicamente o valor mais comum no conjunto de dados. Isso lhe dará informações sobre a equipe que tem mais estudantes.

Importamos o módulo Pandas primeiro e geramos o quadro de dados, como você pode ver no código. Os nomes dos alunos e da equipe estão incluídos no DataFrame.

Importar pandas
d_frame = pandas.Quadro de dados(
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipe': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b']
)
Print (d_frame ['equipe'].modo())

Dá uma série Pandas mais o modo da coluna. Porque "A" e "B" são os valores mais frequentes no campo "Team", obtemos "A" e "B" como o modo.

Observe que você pode adquirir o modo de cada coluna em um quadro de dados de pandas usando o método Mode ().

Exemplo 2:

Mostraremos como usar o value_counts () para obter o valor mais frequente neste exemplo. A função value_counts () pode ser usada para obter contagens e, em seguida, a função idxmax () pode ser usada para obter o valor com a maior parte da contagem.

O restante do código, exceto a última linha, é idêntico ao acima. Ele demonstra como a função (value_counts) é usada para descobrir o valor com a contagem mais alta.

Importar pandas
d_frame = pandas.Quadro de dados(
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipe': ['a', 'b', 'c', 'd', 'e', ​​'a', 'a']
)
Print (d_frame ['equipe'].value_counts ().idxmax ())

Veja a tela resultante abaixo. Temos o valor na coluna "equipe" com a contagem máxima de valor.

Exemplo 3:

Este exemplo demonstrará o que acontecerá se o DataFrame contiver os valores que ocorrem com mais frequência. Vamos alterar o quadro de dados para que a coluna "equipe" contenha modos repetidos. Mudamos o valor de "Rob" da "equipe" de "D" para "B" aqui.

Importar pandas
d_frame = pandas.Quadro de dados(
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipe': ['a', 'b', 'c', 'd', 'e', ​​'a', 'f']
)
d_frame.em [3, 'equipe'] = 'b'
Imprimir (d_frame)

Agora temos modos recorrentes, como você pode ver. "A" aparece duas vezes na coluna "Team" em nosso cenário.

O nome da equipe para o aluno 'Rob' foi alterado de “D” para “A” na imagem que o acompanha.

Exemplo 4:

Vamos ver o que o valor conta () e os métodos idxmax () retornam. Atualizamos os valores do quadro de dados neste exemplo de código. Observe que a equipe “A” e “B” aparecem duas vezes. Depois disso, usamos o valor.as funções contings () e idxmax () para determinar o valor mais comum no quadro de dados. Aqui está o código de referência.

Importar pandas
d_frame = pandas.Quadro de dados(
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipe': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b']
)
Print (d_frame ['equipe'].value_counts ().idxmax ())

Observe que, mesmo que existam muitos modos presentes, esse método retorna apenas um único valor. Isso aconteceu porque a função idxmax () oferece apenas um resultado: “Se vários valores correspondem ao máximo, o título de uma linha com esse valor é retornado.”Para recuperar o valor mais comum em uma série de pandas, você precisa aplicar a função 'mode ()' da série Pandas.

Conclusão:

Neste artigo, analisamos como encontrar o valor mais frequente em uma coluna ou série de pandas usando certos exemplos. Discutimos uma variedade de funções que podem ser usadas para atingir esse objetivo. Mode (), contagens de valor () e idxmax () são alguns desses métodos. Se você é novo nesse conceito e precisa de um guia passo a passo para começar, não vá além deste artigo.