Coluna de soma pandas

Coluna de soma pandas

Este artigo demonstrará como somar todas ou colunas específicas em um quadro de dados de pandas usando Python. O DataFrame.A função sum () será usada junto com alguns parâmetros úteis nos numerosos exemplos deste tutorial.

O 'dataframe.A função Sum () 'em pandas retorna a soma total para o eixo especificado. Se a entrada for um eixo do índice, a função adiciona os valores de cada coluna individualmente. Em seguida, faz o mesmo para cada coluna, retornando uma série armazenando a soma dos dados/valores em cada coluna. Além disso, ele suporta calcular a soma do quadro de dados ignorando os valores ausentes.

Sintaxe

Pandas.Dataframe_object.soma (eixo = nenhum, skipna = nenhum, nível = nenhum, numeric_only = nenhum, min_count = 0, ** kwargs)

Parâmetros

  1. eixo: colunas (1), índice (0)
  2. Skipna: Ignore os valores de Na/nula ao calcular o resultado.
  3. nível: Se o eixo especificado for hierárquico (um multi-índice), conte um nível de índice específico antes de converter para uma série.
  4. numeric_only: Apenas as colunas flutuantes, int e booleanas são aceitáveis. Se não for, tente usar tudo; Caso contrário, apenas dados numéricos. Para série, não implementado.
  5. min_count: O número de valores possíveis necessários para concluir a operação. O resultado será NA se houver menos valores não-NA presentes do que min_count.

Retornar

DataFrame (se o nível especificado) ou série.

Quadro de dados

Para todos os exemplos, usaremos o seguinte DataFrame de 'análise'. Possui 12 linhas com 5 colunas.

Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Exibir o DataFrame - Análise
Impressão (análise)

Saída

nome de identificação pontos3 pontos1 pontos2
0 23 Sravan 1000 34 56
1 23 Sravan 700 11 0
2 23 Sravan 20 4 2
3 21 Siva 400 32 45
4 21 Siva 100 456 78
5 23 Sravan 0 90 12
6 21 Siva 400 32 45
7 20 Sahaja 120 1 67
8 23 Sravan 0 90 12
9 22 Suryam 450 76 56
10 22 Suryam 40 0 ​​1
11 22 Suryam 12 45 0

Aqui, as colunas 'ID', 'Point3', 'Points2' e 'Point1' são numéricas e verifique se você precisa carregar o quadro de dados para todos os exemplos que estamos discutindo neste tutorial.

Cenário 1: Soma de todas as colunas

Podemos aplicar diretamente Sum () no DataFrame para retornar a soma dos valores em cada coluna.

Pandas.Dataframe_object.soma()

Exemplo

# Retorne a soma dos valores em todas as colunas
impressão (análise.soma())

Saída

Id 264
Nome Sravansravansravansivasivasravansivasahajasrav…
Pontos3 3242
Pontos1 871
Pontos2 374

Explicação

Você pode ver que a soma dos valores em cada coluna é retornada.

Cenário 2: soma de coluna particular

Se você deseja retornar a soma dos valores em uma coluna específica, precisará especificar o nome da coluna e o objeto DataFrame.

Pandas.Dataframe_object ['coluna'].soma()

Exemplo

Vamos retornar a soma dos valores nas colunas 'Point1', 'Points2' e 'Points3'.

# Retorne a soma dos valores na coluna Points1
Impressão (Análise ['Point1'].soma())
# Retorne a soma dos valores na coluna Points2
Impressão (Análise ['Points2'].soma())
# Retorne a soma dos valores na coluna Points3
Imprimir (análise ['pontos3'].soma())

Saída

871
374
3242

Explicação

  1. A soma dos valores na coluna Point1 é 871.
  2. A soma dos valores na coluna Point2 é 374.
  3. A soma dos valores na coluna Point3 é 3242.

Cenário 3: soma entre linhas

Se você deseja retornar a soma dos valores em cada linha, precisar.

Pandas.Dataframe_object [[coluna/s…]].soma (eixo = 1)

Exemplo

Vamos retornar a soma dos valores de 'pontos1', 'pontos2' e 'pontos3' em todas as linhas e armazenar o resultado na coluna 'soma'.

# Retorne a soma dos valores em cada linha
Análise ['Sum'] = Análise [['Points1', 'Points2', 'Points3']]].soma (eixo = 1)
Impressão (análise)

Saída

nome de identificação pontos3 pontos1 pontos2 soma
0 23 Sravan 1000 34 56 1090
1 23 Sravan 700 11 0 711
2 23 Sravan 20 4 2 26
3 21 Siva 400 32 45 477
4 21 Siva 100 456 78 634
5 23 Sravan 0 90 12 102
6 21 Siva 400 32 45 477
7 20 Sahaja 120 1 67 188
8 23 Sravan 0 90 12 102
9 22 Suryam 450 76 56 582
10 22 Suryam 40 0 ​​1 41
11 22 Suryam 12 45 0 57

Explicação

Agora, a nova coluna - 'Sum' detém a soma de três pontos.

Também podemos adicionar linhas sem usar sum (). Usando o operador "+", podemos alcançar a funcionalidade anterior.

Exemplo

  1. Adicione valores nas colunas Points1 e Point2 e armazene o resultado no '2 adicionado'coluna.
  2. Adicione valores nas colunas Points1, Points2 e Point3 e armazene o resultado no '3 adicionado'coluna.
Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Adicionar valores nas colunas Point1 e Point2 e armazenar o resultado na coluna '2 adicionada'
Análise ['2 Adicionada'] = Análise ['Point1']+Análise ['Points2']
# Adicionar valores em pontos1, pontos2 e pontos2Columns e armazenar o resultado na coluna '3 adicionada'
Análise ['3 Adicionada'] = Análise ['Points1']+Análise ['Points2']+Análise ['Points3']
Impressão (análise)

Saída

nome de identificação 3 pontos1 pontos2 2 adicionado 3 adicionado
0 23 Sravan 1000 34 56 90 1090
1 23 Sravan 700 11 0 11 711
2 23 Sravan 20 4 2 6 26
3 21 Siva 400 32 45 77 477
4 21 Siva 100 456 78 534 634
5 23 Sravan 0 90 12 102 102
6 21 Siva 400 32 45 77 477
7 20 Sahaja 120 1 67 68 188
8 23 Sravan 0 90 12 102 102
9 22 Suryam 450 76 56 132 582
10 22 Suryam 40 0 ​​1 1 41
11 22 Suryam 12 45 0 45 57

Cenário 4: Sum () com Groupby ()

Se você deseja devolver a soma dos valores para grupos individuais, é necessário usar o grupo () com sum (). Portanto, o grupo () é usado para agrupar os valores da coluna em uma coluna específica, e Sum () retornará a soma em cada grupo.

Pandas.Dataframe_object.grupo ('grouping_column').soma()

Exemplo

Vamos agrupar as linhas com base na coluna Nome e retornar a soma dos valores em cada grupo para todas as colunas.

Importar pandas
# Crie o DataFrame usando listas
Análise = pandas.Dataframe ([[23, 'sravan', 1000,34,56],
[23, 'Sravan', 700,11,0],
[23, 'Sravan', 20,4,2],
[21, 'Shiva', 400,32,45],
[21, 'Shiva', 100.456,78],
[23, 'Sravan', 00,90,12],
[21, 'Shiva', 400,32,45],
[20, 'Sahaja', 120,1,67],
[23, 'Sravan', 00,90,12],
[22, 'Suryam', 450,76,56],
[22, 'Suryam', 40,0,1],
[22, 'Suryam', 12,45,0]
], colunas = ['id', 'nome', 'pontos3', 'pontos1', 'pontos2'])
# Grupo as linhas com base na coluna de nomes e retorna a soma dos valores em cada grupo para todas as colunas
impressão (análise.grupo ('nome').soma())

Saída

ID PONTS3 PONTS1 PONTOS2
nome
SAHAJA 20 120 1 67
Siva 63 900 520 168
Sravan 115 1720 229 82
Suryam 66 502 121 57

Explicação

Portanto, existem 4 grupos na coluna 'nome'. Para cada grupo, a soma de ID, pontos3, pontos1 e pontos2 é devolvida.

Conclusão

Tentamos ensiná -lo a calcular a soma nos quadros de dados usando o método pandas sum (). Discutimos a adição de valores em termos de remar e colunas nos exemplos deste post. Além disso, você aprendeu a adicionar colunas condicionalmente e como somar os valores depois de agrupar a coluna do DataFrame. Agora, você poderá somar as colunas do quadro de dados ou somar os valores na coluna DataFrame por você mesmo.