Este artigo demonstrará como somar todas ou colunas específicas em um quadro de dados de pandas usando Python. O DataFrame.A função sum () será usada junto com alguns parâmetros úteis nos numerosos exemplos deste tutorial.
O 'dataframe.A função Sum () 'em pandas retorna a soma total para o eixo especificado. Se a entrada for um eixo do índice, a função adiciona os valores de cada coluna individualmente. Em seguida, faz o mesmo para cada coluna, retornando uma série armazenando a soma dos dados/valores em cada coluna. Além disso, ele suporta calcular a soma do quadro de dados ignorando os valores ausentes.
Sintaxe
Pandas.Dataframe_object.soma (eixo = nenhum, skipna = nenhum, nível = nenhum, numeric_only = nenhum, min_count = 0, ** kwargs)
Parâmetros
Retornar
DataFrame (se o nível especificado) ou série.
Quadro de dados
Para todos os exemplos, usaremos o seguinte DataFrame de 'análise'. Possui 12 linhas com 5 colunas.
Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Exibir o DataFrame - Análise
Impressão (análise)
Saída
nome de identificação pontos3 pontos1 pontos2
0 23 Sravan 1000 34 56
1 23 Sravan 700 11 0
2 23 Sravan 20 4 2
3 21 Siva 400 32 45
4 21 Siva 100 456 78
5 23 Sravan 0 90 12
6 21 Siva 400 32 45
7 20 Sahaja 120 1 67
8 23 Sravan 0 90 12
9 22 Suryam 450 76 56
10 22 Suryam 40 0 1
11 22 Suryam 12 45 0
Aqui, as colunas 'ID', 'Point3', 'Points2' e 'Point1' são numéricas e verifique se você precisa carregar o quadro de dados para todos os exemplos que estamos discutindo neste tutorial.
Cenário 1: Soma de todas as colunas
Podemos aplicar diretamente Sum () no DataFrame para retornar a soma dos valores em cada coluna.
Pandas.Dataframe_object.soma()
Exemplo
# Retorne a soma dos valores em todas as colunas
impressão (análise.soma())
Saída
Id 264
Nome Sravansravansravansivasivasravansivasahajasrav…
Pontos3 3242
Pontos1 871
Pontos2 374
Explicação
Você pode ver que a soma dos valores em cada coluna é retornada.
Cenário 2: soma de coluna particular
Se você deseja retornar a soma dos valores em uma coluna específica, precisará especificar o nome da coluna e o objeto DataFrame.
Pandas.Dataframe_object ['coluna'].soma()
Exemplo
Vamos retornar a soma dos valores nas colunas 'Point1', 'Points2' e 'Points3'.
# Retorne a soma dos valores na coluna Points1
Impressão (Análise ['Point1'].soma())
# Retorne a soma dos valores na coluna Points2
Impressão (Análise ['Points2'].soma())
# Retorne a soma dos valores na coluna Points3
Imprimir (análise ['pontos3'].soma())
Saída
871
374
3242
Explicação
Cenário 3: soma entre linhas
Se você deseja retornar a soma dos valores em cada linha, precisar.
Pandas.Dataframe_object [[coluna/s…]].soma (eixo = 1)
Exemplo
Vamos retornar a soma dos valores de 'pontos1', 'pontos2' e 'pontos3' em todas as linhas e armazenar o resultado na coluna 'soma'.
# Retorne a soma dos valores em cada linha
Análise ['Sum'] = Análise [['Points1', 'Points2', 'Points3']]].soma (eixo = 1)
Impressão (análise)
Saída
nome de identificação pontos3 pontos1 pontos2 soma
0 23 Sravan 1000 34 56 1090
1 23 Sravan 700 11 0 711
2 23 Sravan 20 4 2 26
3 21 Siva 400 32 45 477
4 21 Siva 100 456 78 634
5 23 Sravan 0 90 12 102
6 21 Siva 400 32 45 477
7 20 Sahaja 120 1 67 188
8 23 Sravan 0 90 12 102
9 22 Suryam 450 76 56 582
10 22 Suryam 40 0 1 41
11 22 Suryam 12 45 0 57
Explicação
Agora, a nova coluna - 'Sum' detém a soma de três pontos.
Também podemos adicionar linhas sem usar sum (). Usando o operador "+", podemos alcançar a funcionalidade anterior.
Exemplo
Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Adicionar valores nas colunas Point1 e Point2 e armazenar o resultado na coluna '2 adicionada'
Análise ['2 Adicionada'] = Análise ['Point1']+Análise ['Points2']
# Adicionar valores em pontos1, pontos2 e pontos2Columns e armazenar o resultado na coluna '3 adicionada'
Análise ['3 Adicionada'] = Análise ['Points1']+Análise ['Points2']+Análise ['Points3']
Impressão (análise)
Saída
nome de identificação 3 pontos1 pontos2 2 adicionado 3 adicionado
0 23 Sravan 1000 34 56 90 1090
1 23 Sravan 700 11 0 11 711
2 23 Sravan 20 4 2 6 26
3 21 Siva 400 32 45 77 477
4 21 Siva 100 456 78 534 634
5 23 Sravan 0 90 12 102 102
6 21 Siva 400 32 45 77 477
7 20 Sahaja 120 1 67 68 188
8 23 Sravan 0 90 12 102 102
9 22 Suryam 450 76 56 132 582
10 22 Suryam 40 0 1 1 41
11 22 Suryam 12 45 0 45 57
Cenário 4: Sum () com Groupby ()
Se você deseja devolver a soma dos valores para grupos individuais, é necessário usar o grupo () com sum (). Portanto, o grupo () é usado para agrupar os valores da coluna em uma coluna específica, e Sum () retornará a soma em cada grupo.
Pandas.Dataframe_object.grupo ('grouping_column').soma()
Exemplo
Vamos agrupar as linhas com base na coluna Nome e retornar a soma dos valores em cada grupo para todas as colunas.
Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Grupo as linhas com base na coluna de nomes e retorna a soma dos valores em cada grupo para todas as colunas
impressão (análise.grupo ('nome').soma())
Saída
ID PONTS3 PONTS1 PONTOS2
nome
SAHAJA 20 120 1 67
Siva 63 900 520 168
Sravan 115 1720 229 82
Suryam 66 502 121 57
Explicação
Portanto, existem 4 grupos na coluna 'nome'. Para cada grupo, a soma de ID, pontos3, pontos1 e pontos2 é devolvida.
Conclusão
Tentamos ensiná -lo a calcular a soma nos quadros de dados usando o método pandas sum (). Discutimos a adição de valores em termos de remar e colunas nos exemplos deste post. Além disso, você aprendeu a adicionar colunas condicionalmente e como somar os valores depois de agrupar a coluna do DataFrame. Agora, você poderá somar as colunas do quadro de dados ou somar os valores na coluna DataFrame por você mesmo.