Como realizar operação de agregação com mediana do grupo

Como realizar operação de agregação com mediana do grupo
Neste r tutorial, veremos como executar as operações de agregação agrupando os dados e retornando a mediana nas linhas agrupadas.

Esta operação deve ser realizada em um dataframe. Vamos criar o quadro de dados com sete linhas e cinco colunas.

#Crie um mercado de dados que possui 7 linhas e 5 colunas.
Mercado = dados.quadro (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'm3', 'm4', 'm3'), market_place = c ('Índia', 'EUA', 'Índia', 'Austrália', 'EUA',
'Índia', 'Austrália'), Market_type = C ('Grocery', 'Bar', 'Grocery', 'Restaurent',
'Grocery', 'Bar', 'Grocery'), Market_squarefeet = C (120.342.220.110.342.220,110))
#Display O mercado de dados do mercado
Impressão (mercado)

Resultado

Agora, retornaremos a mediana em uma coluna agrupando os valores semelhantes em outra coluna.

Método 1: agregado ()

Aqui, usamos a função agregate () que leva três parâmetros.

Sintaxe

agregado (dataframe_object $ agrupado, list (dataframe_object $ agrupamento), diversão = mediana)

Parâmetros

  1. O primeiro parâmetro leva a coluna variável (agrupada) que retorna a mediana por grupo.
  2. O segundo parâmetro leva uma coluna única ou múltipla (agrupamento) em uma lista de que os valores são agrupados nessas colunas.
  3. O terceiro parâmetro se diverte, o que leva a função mediana para devolver a mediana nos valores agrupados.

Exemplo 1
Neste exemplo, agrupamos os valores na coluna Market_place e obtemos a mediana na coluna Market_squarefeet agrupada pela coluna Market_place_place.

#Crie um mercado de dados que possui 7 linhas e 5 colunas.
Mercado = dados.quadro (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'm3', 'm4', 'm3'), market_place = c ('Índia', 'EUA', 'Índia', 'Austrália', 'EUA',
'Índia', 'Austrália'), Market_type = C ('Grocery', 'Bar', 'Grocery', 'Restaurent',
'Grocery', 'Bar', 'Grocery'), Market_squarefeet = C (120.342.220.110.342.220,110))
#Obtenha a mediana dos pés quadrados em grupo agrupando Market_place
Impressão (agregado (mercado $ market_squarefeet, list (mercado $ market_place), diversão = mediana))

Resultado

Podemos ver que os valores semelhantes (Austrália, Índia e EUA) na coluna Market_place são agrupados e devolvidos a mediana dos valores agrupados na coluna Market_square Feet.

Exemplo 2
Neste exemplo, agrupamos os valores na coluna Market_type e obtemos a mediana na coluna Market_squarefeet agrupada pela coluna Market_type.

#Crie um mercado de dados que possui 7 linhas e 5 colunas.
Mercado = dados.quadro (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'm3', 'm4', 'm3'), market_place = c ('Índia', 'EUA', 'Índia', 'Austrália', 'EUA',
'Índia', 'Austrália'), Market_type = C ('Grocery', 'Bar', 'Grocery', 'Restaurent',
'Grocery', 'Bar', 'Grocery'), Market_squarefeet = C (120.342.220.110.342.220,110))
#Obtenha a mediana dos pés quadrados em grupo agrupando Market_type
Impressão (agregado (mercado $ market_squarefeet, list (mercado $ market_type), diversão = mediana)))

Resultado

Podemos ver que os valores semelhantes (bar, supermercado e restaurante) na coluna Market_type são agrupados e devolvidos a mediana dos valores agrupados na coluna Market_square Feet.

Exemplo 3
Neste exemplo, agrupamos os valores nas colunas Market_type e Market_place e obtemos a mediana na coluna Market_squarefeet agrupada pelas colunas Market_Type e Market_place_Place.

#Crie um mercado de dados que possui 7 linhas e 5 colunas.
Mercado = dados.quadro (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3', 'm4', 'm3',
'M4', 'm3'), market_place = c ('Índia', 'EUA', 'Índia', 'Austrália', 'EUA', 'Índia', 'Austrália'),
Market_type = C ('Grocery', 'Bar', 'Grocery', 'Restaurent', 'Grocery', 'Bar', 'Grocery'),
market_squarefeet = C (120.342.220.110.342.220.110))
#Obtenha a mediana dos pés quadrados em grupo agrupando Market_place e Market_type
Print (agregado (mercado $ market_squarefeet, list (mercado $ market_place, mercado $ market_type), diversão = mediana))

Resultado

Podemos ver que os valores semelhantes das duas colunas foram agrupados e devolveram a mediana em cada valor agrupado na coluna Market_square pés.

Método 2: DPLYR

Aqui, usamos a função group_by () com sumarise_at () função disponível na biblioteca DPLYR para executar a função group_by () com a operação mediana.

Sintaxe

dataframe_object%>% group_by (agrupamento)%>% summarise_at (vars (agrupado), list (nome = mediana))

Onde:

  1. group_by () leva um parâmetro, eu.e. coluna de agrupamento
  2. Summarise_at () leva dois parâmetros:
  1. O primeiro parâmetro leva a coluna variável (agrupada) que retorna a mediana por grupo.
  2. O segundo parâmetro leva a função mediana através da lista.

Finalmente, resumimos primeiro com a mediana e carregamos -a no grupo. Em seguida, carregamos a coluna agrupada no objeto DataFrame.

Retorna um Tibble.

Exemplo 1
Neste exemplo, agrupamos os valores na coluna Market_place e obtemos a mediana na coluna Market_squarefeet agrupada pela coluna Market_place_place.

Biblioteca ("DPLYR")
#Obtenha a mediana dos pés quadrados em grupo agrupando Market_place
print (mercado %> % group_by (market_place) %> % summarise_at (vars (market_squarefeet), list (nome = mediana))))

Resultado

Podemos ver que os valores semelhantes (Austrália, Índia e EUA) na coluna Market_place são agrupados e devolveram a mediana de cada valor agrupado na coluna Market_square Feet.

Exemplo 2
Neste exemplo, agrupamos os valores na coluna Market_type e obtemos a mediana na coluna Market_squarefeet agrupada pela coluna Market_type.

Biblioteca ("DPLYR")
#Obtenha a mediana dos pés quadrados em grupo agrupando Market_type
print (mercado %> % group_by (market_type) %> % summarise_at (vars (market_squarefeet), list (nome = mediana))))

Resultado

Podemos ver que os valores semelhantes (bar, supermercado e restaurante) na coluna Market_type são agrupados e devolvidos a mediana em cada valor agrupado na coluna Market_square pés.

Conclusão

É possível agrupar as colunas únicas ou múltiplas com as outras colunas numéricas para retornar a mediana da coluna numérica usando a função agregate (). Da mesma forma, podemos usar a função groupby () com a função Summarise_AT () para agrupar os valores semelhantes em uma coluna e retornar a mediana dos valores agrupados em relação a outra coluna.