Pandas Groupby Max

Pandas Groupby Max
"Panda" é uma biblioteca Python. O "Groupby" é usado para agrupar os dados que consistem em uma ou mais de uma coluna de acordo com as categorias que fornecem rótulos para cada mapeamento de grupo. No quadro de dados do Pandas Python, se você deseja encontrar o valor "max" de um grupo específico conforme necessário, você pode fazer isso simplesmente usando a função "Grupo por () e max ()". Isso ajuda a encontrar os valores máximos sem agitação como nas empresas; Os dados estão em uma grande escala que se torna difícil de lidar manualmente. E se você quiser encontrar uma área específica de todos os dados? Torna -se difícil fazer as estatísticas por conta própria. Ele consumirá muito tempo, bem como a paciência de um particular, então, em vez disso, use as funções do grupo Max no Pandas Dataframe. No quadro de dados do Pandas Python, se você deseja encontrar o valor "max" do grupo, pode fazer isso simplesmente usando a função "Grupo por () e max ()".”

Sintaxe
# df.grupo ('column_name').max ()

O "DF" representa o quadro de dados aqui, o grupo seguiu com o nome da coluna, onde você deve escrever o nome da coluna em que deseja trabalhar. "Max" escrito no final, é para a detecção dos valores máximos na coluna selecionada de “df.”

O grupo máximo de colunas únicas e múltiplas em pandas pode ser realizada de maneiras diferentes. Vamos fazê -los um por um.

Discutiremos e cobriremos todas as seguintes maneiras:

  • Groupby Max - coluna única
  • Groupby Max - várias colunas
  • Groupby Max - Usando a função pivô
  • Groupby Max - Usando uma função agregada
  • Groupby Max - Usando a função Reset_index (colunas únicas e múltiplas)

Criando o DataFrame para a implementação da função Groupby Max

Primeiro, vamos criar um quadro de dados para aplicar as funções e entender cada método claramente. O DataFrame "DF" aqui consiste em cidades, produtos e suas vendas. Precisamos de uma ferramenta Python para executar nossos códigos. Aqui, o software usado é Spyder para a implementação. Você precisa baixá -lo primeiro diretamente do Google, atender ao requisito de instalação após o processo de instalação e iniciar a ferramenta. Abra o arquivo e comece a executar seu código, o que é fácil à medida que avança. A descrição de todas as maneiras de usar o Código do Grupo MAX Panda Python é definida brevemente nos exemplos abaixo.

Para o domínio Python, os pandas como "PD" e Numpy como "NP" são as bibliotecas importadas no código de exemplo. O Numpy é usado para os dados numéricos no Python, enquanto os pandas são usados ​​para a interpretação dos dados.

Usando a seguinte linha de código, estaremos trabalhando em cada um dos exemplos que cobrem:

# df1 = pd.DataFrame (Data, Columns = ['Cities', 'Products', 'Sales']))

De acordo com o quadro de dados, as colunas são cidades, produtos e suas vendas; Da mesma forma, a sintaxe consiste nos três na representação da coluna.

O código deve aparecer assim na tela do console.

A saída mostra a lista de colunas que consistem em cidades, produtos e o número de vendas. Ele também mostra o número de série particularmente.

Exemplo # 01: Groupby Max Pandas - coluna única

Iniciando a implementação prática da coluna única do Groupby Max usando o código Python no quadro de dados do Pandas, precisamos de uma ferramenta específica e, para isso, usaremos o Spyder, como mencionado anteriormente na descrição acima. Agora, depois de abrir o Spyder no seu laptop/desktop, você precisa da extensão do arquivo como “.Py ”É a referência do Python porque nosso código está na linguagem Python.

Agora, iniciando a parte do código, há uma palavra panda que também é a primeira palavra do nosso artigo, então isso significa que algo com a biblioteca dos pandas deve ser implementado para isso; Precisamos escrever "Panda" como "PD", que importará todos os recursos da Biblioteca Panda em nosso arquivo de trabalho.

O grupo de colunas único, Max, funciona chamando "groupby ()" e escrevendo o nome da coluna que você deseja do seu quadro de dados, que é "cidades" no "df" seguido com a seleção do campo para a estimativa máxima "max () ”Função.

A saída é a única coluna “cidades” como selecionamos, mostrando os valores máximos de cada.

Exemplo # 02: Groupby Max Pandas - Várias colunas

Agora, abra o novo arquivo para o exemplo de implementação de várias colunas no Groupby Max, pois você pode encontrar o valor máximo de cada grupo que se refere a diferentes colunas do seu "DF" no grupo Pandas Max. Selecione as colunas; Aqui, você pode selecionar mais de uma coluna, pois ele levanta as várias colunas do seu "df" conforme sua necessidade.

O código usado para o grupo múltiplo Max é:

A saída, como você pode ver, exibe os valores máximos de ambas as colunas.

Exemplo # 03: Groupby Max Pandas - Usando a função Pivot

Novamente, abrindo um novo arquivo para o exemplo de funcionamento da função pivô em Groupby Max Pandas. A função pivot () é organizar seu "df" em uma boa forma representável. Você pode trabalhar nisso com colunas únicas ou múltiplas como quiser. Aqui, a implementação está no grupo de várias colunas, mas se você quiser fazer o grupo de pivô de coluna única, Max Panda, precisará adicionar uma coluna no grupo () adicionar em vez de várias colunas; Você pode obter a representação simples da coluna também.

O Pivot () no Código Max Grupo Pandas é:

Usando a função pivot (), a tela de saída parece indivíduos estabelecidos.

Exemplo # 04: Groupby Max - Usando uma função agregada

Você precisa abrir outro arquivo do arquivo e ir para o novo arquivo. Agora, procuramos o exemplo usando a função agregada no grupo por Max Pandas. A função agregada no código, que escrevemos como agg (), trabalha tomando o "máximo" como entrada, que executará o grupo Max em seu "DF" e fará uma estrutura definitiva do seu "df".

O grupo de funções agregadas Max Panda para o código de coluna múltipla é:

A função agg () permite toda a agregação da coluna possível com valores máximos.

Exemplo # 05: Groupby Max - Usando a função Reset_index (para colunas únicas e múltiplas)

O índice de redefinição por seu nome explica que sua função está redefinindo o índice e também fornecerá um novo índice para o quadro de dados, tornando-o uma estrutura mais adequada.

O código para a função RESET_Index única coluna em pandas é:

Aqui, a redefinição do "df" é feita com a função RESET () da coluna selecionada, que é as cidades que mostram os valores máximos.

Para as múltiplas colunas RESET_FUNCTION em pandas, o código é:

A saída exibe as duas colunas redefinindo o "df" nos pandas usando o grupo de funções RESET ().

Conclusão

A função Max Groupby Max é muito útil e simplista. Como pode detectar o valor máximo da coluna de seleção usando o “.Max () ”função e pode calcular o máximo dos valores no quadro de dados. Neste artigo, explicamos todos os métodos pelos quais o grupo de função max () funciona (), i.e., Groupby Max em colunas únicas e múltiplas, e podemos redefinir o índice de ambos, da mesma forma que o agregado e a função pivô, trabalhando para sua melhor explicação com exemplos para uma melhor compreensão. Cada parte deste tutorial enfatiza o entendimento e a limpeza fácil dos conceitos.