Excluir linhas de quadro de dados

Excluir linhas de quadro de dados
Suponha que exista uma situação para excluir linhas em um quadro de dados R. Como você vai fazer isso?

Este artigo mostrará maneiras diferentes de excluir linhas de um quadro de dados.

Vamos criar um quadro de dados de mercado com quatro linhas e cinco colunas.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#Display O mercado de dados do mercado
Impressão (mercado)

Resultado:

Você pode ver o quadro de dados do mercado na seguinte imagem:

Cenário 1: Remova uma única linha

Estamos removendo uma única linha do quadro de dados nesse cenário. Com base no número da linha ou no índice de linha, podemos removê -lo. Em R, a indexação começa em 1.

Aqui, não selecionaremos o índice de linha através do operador “-“ menos) que queremos remover.

Sintaxe:

dataframe_object [-row,]

Onde,

"Linha" refere -se à posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos a primeira e a quarta linhas separadamente e exibiremos as linhas restantes em um quadro de dados de mercado para cada cenário.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#Remove 1ª linha e exibir linhas restantes em um DataFrame
Imprimir (mercado [-1,])
#Remove 4ª fila e exibir linhas restantes em um DataFrame
Imprimir (mercado [-4,])

Resultado:

Cenário 2: Remova várias linhas

Nesse cenário, estamos removendo várias linhas do quadro de dados. Com base nos números de linha ou índices de linha, podemos removê -los. Em R, a indexação começa em 1.

Método 1: Remova linhas específicas

Aqui, não selecionaremos os índices de linha que queremos removê-los especificando-os em um vetor através do “-“ Operador (menos).

Sintaxe:

dataframe_object [-c (linha,…),]

Onde,

"Linha" refere -se à posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Removeremos a segunda, terceira e quarta linhas do quadro de dados do mercado neste exemplo.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#Remove 2,3 e 4 linhas do mercado de dados do mercado
Impressão (mercado [-C (2, 3, 4),]))

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Método 2: Remova as linhas no intervalo

Aqui, não selecionaremos os índices de linha no intervalo que queremos remover especificando esses intervalos em um vetor através do operador “-“ menos).

Sintaxe:

dataframe_object [-c (primeiro: último),]

Onde,

“Primeiro” refere -se à primeira posição da linha, e “último” refere -se à última posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos as linhas da segunda posição para a quarta posição.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#remove linhas de 2 para 4 índice.
Imprimir (mercado [-C (2: 4),]))

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Método 3: Remova as linhas até o último

Aqui, não selecionaremos os índices de linha em um intervalo, através do operador “-“ (menos), queremos remover especificando esses intervalos em um vetor. nrow () retornará o último índice de linha, para que possamos remover linhas especificando isso como a última posição.

Sintaxe:

dataframe_object [-c (primeiro: nrow (dataframe_object)),]

Onde,

"Primeiro" refere -se à primeira posição da linha, e "nrow ()" refere -se à última posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos as linhas da segunda posição até o final do quadro de dados.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#Remove linhas de 2 para o final da linha
Imprimir (mercado [-C (2: nrow (mercado)),]))

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Abordagem 3: Remova linhas com subconjunto ()

Método Subset () na programação R filtra as linhas com base na condição. Se a condição for "falsa", essas linhas serão removidas do quadro de dados e retornam às linhas restantes.

Sintaxe:

subconjunto (dataframe_object, condição)

Parâmetros:

São necessários dois parâmetros.

  1. Dataframe_object é o quadro de dados.
  2. Condição refere -se a declarações lógicas ou expressivas.

Exemplo

Neste exemplo, selecionaremos linhas onde,

  1. market_id maior que 2
  2. Market_place é a Índia
  3. market_squarefeet - menor ou igual a 230
#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#select linhas onde market_id maior que 2
print ("linhas com market_id maior que 2:")
Imprimir (subconjunto (Market, Market_id> 2)))
#select linhas onde market_place é a Índia
Print ("Linhas com Market_place é a Índia:")
Imprimir (subconjunto (Market, Market_place == 'Índia')))
#select linhas onde market_squarefeet - menor ou igual a 230.
print ("Linhas com market_squarefeet menor ou igual a 230:")
Imprimir (subconjunto (Market, Market_squareFeet<=230 ))

Resultado:

Conclusão

Neste artigo, aprendemos que poderia ser possível excluir uma ou múltipla linhas especificando posições de linha. Se você deseja remover linhas condicionalmente, pode usar o método subcet () e especificar a condição dentro dele.