PANDAS AGG

PANDAS AGG
"Pandas" fornece a função "agg ()". Usando a função "agg ()", podemos utilizar diferentes funções. Ele é realizado no eixo do índice de linha, que é inserido automaticamente no quadro de dados. O comportamento padrão das funções Numpy "agg ()" (média, mediana, prod, soma, std, var), que avaliam o agg () da matriz achatada, é distinta desse comportamento. Podemos adicionar dados com a ajuda da função agg (). Este guia utilizará a função "pandas agg ()" e mostrará o funcionamento dessa função "agg ()" em "pandas".

Sintaxe

A sintaxe desta função é:

#quadro de dados.Agg (Func, Axis, Args, Kwargs)

Exemplo # 01

Temos o aplicativo "Spyder" para executar nossos códigos "pandas". Ao desenvolver o código "pandas", devemos "importar" os métodos "pandas" como o "PD". Este "PD" nos permite acessar os métodos ou funções dos "pandas", adicionando "PD" em vez de "pandas". Geramos os dados e os armazenamos em "Data1". Escrevemos "x1" e em "x1". Adicionamos "60", "50" e "40". Temos "Y1" e adicionamos "900", "1212" e "51". Nós também colocamos "z1". Nisso, inserimos "200", "300" e "800". Mudamos esse "Data1" no "DataFrame" e escrevemos "PD" com o "DataFrame", para que nos apoiará para acessar essa função de "pandas".

Passamos "Data1" como o parâmetro do "PD.Quadro de dados ()". Ele gera "dataframe" para nós e também usa a variável aqui "DFA", que armazena esse quadro de dados. Em seguida, adicionamos “Print (DFA)” para renderizar isso. Abaixo, utilizamos a função "agg ()" para executar algumas operações neste quadro de dados. Estamos aplicando "soma" nesta função "agg ()". O resultado que obtemos após a soma é armazenado na variável "ANS". Também imprimimos esta soma colocando a “print ()”.

Também colamos a saída aqui. Esta saída é extraída no terminal "Spyder" pressionando "Shift+Enter". Primeiro, ele exibe os dados conforme inserido no código e adiciona os valores de "x1", então, exibe no "x1" abaixo. Os valores do "Y1" também são adicionados e o resultado é exibido na coluna "Y1". Por fim, a operação da soma também é realizada nos valores do "Z1". O resultado após a soma é renderizado na coluna "Z1".

Exemplo # 02

Produzimos o quadro de dados depois de importar os "pandas" como o "PD". O DataFrame é chamado "Data". Inserimos três linhas primeiro e adicionamos "9, 8, 7" à primeira linha; "4, 5, 6" para a segunda fila; e também “1, 2, 3” para a terceira fila. Em seguida, inserimos o nome do cabeçalho em cada coluna, utilizando a palavra -chave "colunas". Atribuímos "A1" como o cabeçalho da primeira coluna. "A2" como cabeçalho da segunda coluna. E "A3" para a terceira coluna. Imprimos os "dados" no terminal do aplicativo Spyder.

Colocamos o nome do DataFrame "Data" e utilizamos o método "agg ()" com este "dados". Temos duas funções que queremos aplicar ao DataFrame: "Sum" e "Min". "Sum" adicionará os números de cada coluna separadamente. "Min" encontrará o valor mínimo da coluna. Em seguida, ele armazenará a soma e o valor mínimo no "resultado" que criamos. Finalmente, ele imprimirá o "resultado", pois inserimos a "impressão" também.

A soma da coluna "A1" é "14" e o valor mínimo desta coluna é "1". A soma da segunda coluna "A2" é "15". Seu valor mínimo é "2". A soma da última coluna "A3" é "16" e o valor mínimo que temos para esta coluna é "3", que é exibido.

Exemplo # 03

Repetimos a primeira linha neste exemplo e construímos o DataFrame "Info". Em seguida, coloque dados em linhas como "3, 8, 7" é inserido aqui na primeira linha. "4, 1, 6" e "7, 2,3" são inseridos na segunda e terceira linhas, respectivamente. Também atribuímos alguns nomes de índices a todas as colunas como "col1", "col2" e "col3" para a primeira, segunda e terceira coluna, respectivamente. Renderizamos esta "informação" usando "impressão". Estamos aplicando diferentes agregações às colunas.

No método "agg ()", mencionamos o nome da coluna e depois colocamos a operação que queremos aplicar à coluna mencionada. Quanto a "col1", usamos as operações "soma" e "min". Nas operações "col2", aplicamos "min" e "max". Mas não mencionamos o "COL3" para que nenhuma função AGG seja aplicada ao "col3". Também usamos a variável "final" para armazenar esse resultado e depois renderizá -la.

A "soma" e "min" são aplicadas ao "col1", mas no "max" ele imprime "nan" porque não aplicamos o "max" a este "col1". Em seguida, os valores "min" e "max" de "col2" estão aqui, mas o bloco de soma contém "nan" como aplicamos apenas "max" e "min" a este "col2". O "COL3" não está aqui porque não aplicamos nenhum método "agg ()" a este "col3".

Exemplo # 04

Estamos aplicando funções diferentes nas colunas e também atualizamos o nome do índice após o resultado. Para isso, construímos o DataFrame "Raw Data" e temos três linhas contendo alguns números que são "22, 82, 27" na primeira linha; “14, 23, 36” aqui na segunda fila; e "77, 29, 34" está na terceira linha. Os nomes das colunas que adicionamos são "Data1", "Data2" e "Data2". Abaixo, temos o método "print ()".

Agora, utilizamos o método "agg ()" dos "pandas" e definimos "X" que é usado para renomear o nome do índice da linha após aplicar a função de agregação na coluna "Data1". Aplicamos a função "max" a "Data1". Selecionamos "y" para substituir o nome do índice da linha após executar a função de agregação. Para "Data2", empregamos a função "min". Em "Data3", colocamos a função "média" e definimos o nome do índice da linha como "Z", que é substituído após aplicar a função de agregação. Então, também temos o "print ()" para que o "cálculo" seja exibido para nós.

Em "Data1", apenas a função "max" é aplicada e os dois valores restantes são "nan". Além disso, o valor do índice é alterado para "x". A coluna "Data2" apenas exibe o resultado da função "Min" e os valores restantes são "nan" e seu nome de linha de índice é "y" para isso. Agora, a única média é aplicada ao "Data3" e seu índice de linha é alterado para "Z".

Conclusão

Este guia está na função "Agg" em "pandas". Explicamos que a função "agg" que é usada em pandas para aplicar diferentes funções. Estabelecemos quatro instâncias, às quais aplicamos o método "Agg".

.