Excluir linhas de quadro de dados

Suponha que exista uma situação para excluir linhas em um quadro de dados R. Como você vai fazer isso?

Este artigo mostrará maneiras diferentes de excluir linhas de um quadro de dados.

Vamos criar um quadro de dados de mercado com quatro linhas e cinco colunas.

Resultado:

Você pode ver o quadro de dados do mercado na seguinte imagem:

Cenário 1: Remova uma única linha

Estamos removendo uma única linha do quadro de dados nesse cenário. Com base no número da linha ou no índice de linha, podemos removê -lo. Em R, a indexação começa em 1.

Aqui, não selecionaremos o índice de linha através do operador “-“ menos) que queremos remover.

Sintaxe:

dataframe_object [-row,]

Onde,

"Linha" refere -se à posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos a primeira e a quarta linhas separadamente e exibiremos as linhas restantes em um quadro de dados de mercado para cada cenário.

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#Remove 1ª linha e exibir linhas restantes em um DataFrame
Imprimir (mercado [-1,])
#Remove 4ª fila e exibir linhas restantes em um DataFrame
Imprimir (mercado [-4,])

Resultado:

Cenário 2: Remova várias linhas

Nesse cenário, estamos removendo várias linhas do quadro de dados. Com base nos números de linha ou índices de linha, podemos removê -los. Em R, a indexação começa em 1.

Método 1: Remova linhas específicas

Aqui, não selecionaremos os índices de linha que queremos removê-los especificando-os em um vetor através do “-“ Operador (menos).

Sintaxe:

dataframe_object [-c (linha,…),]

Onde,

"Linha" refere -se à posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Removeremos a segunda, terceira e quarta linhas do quadro de dados do mercado neste exemplo.

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Método 2: Remova as linhas no intervalo

Aqui, não selecionaremos os índices de linha no intervalo que queremos remover especificando esses intervalos em um vetor através do operador “-“ menos).

Sintaxe:

dataframe_object [-c (primeiro: último),]

Onde,

“Primeiro” refere -se à primeira posição da linha, e “último” refere -se à última posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos as linhas da segunda posição para a quarta posição.

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Método 3: Remova as linhas até o último

Aqui, não selecionaremos os índices de linha em um intervalo, através do operador “-“ (menos), queremos remover especificando esses intervalos em um vetor. nrow () retornará o último índice de linha, para que possamos remover linhas especificando isso como a última posição.

Sintaxe:

dataframe_object [-c (primeiro: nrow (dataframe_object)),]

Onde,

"Primeiro" refere -se à primeira posição da linha, e "nrow ()" refere -se à última posição da linha.

Vamos ver um exemplo para demonstrar esse cenário.

Exemplo

Neste exemplo, removeremos as linhas da segunda posição até o final do quadro de dados.

Resultado:

Podemos ver que a linha-1 restante é devolvida.

Abordagem 3: Remova linhas com subconjunto ()

Método Subset () na programação R filtra as linhas com base na condição. Se a condição for "falsa", essas linhas serão removidas do quadro de dados e retornam às linhas restantes.

Sintaxe:

subconjunto (dataframe_object, condição)

Parâmetros:

São necessários dois parâmetros.

Dataframe_object é o quadro de dados.
Condição refere -se a declarações lógicas ou expressivas.

Exemplo

Neste exemplo, selecionaremos linhas onde,

market_id maior que 2
Market_place é a Índia
market_squarefeet - menor ou igual a 230

#Crie um mercado de dados que possui 4 linhas e 5 colunas.
Mercado = dados.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c
",
market_squarefeet = c (120.342.220.110))
#select linhas onde market_id maior que 2
print ("linhas com market_id maior que 2:")
Imprimir (subconjunto (Market, Market_id> 2)))
#select linhas onde market_place é a Índia
Print ("Linhas com Market_place é a Índia:")
Imprimir (subconjunto (Market, Market_place == 'Índia')))
#select linhas onde market_squarefeet - menor ou igual a 230.
print ("Linhas com market_squarefeet menor ou igual a 230:")
Imprimir (subconjunto (Market, Market_squareFeet<=230 ))

Resultado:

Conclusão

Neste artigo, aprendemos que poderia ser possível excluir uma ou múltipla linhas especificando posições de linha. Se você deseja remover linhas condicionalmente, pode usar o método subcet () e especificar a condição dentro dele.

Windows OS

Qual é a diferença entre o Windows Top 10 Home e Pro

A versão Pro é para usuários profissionais e possui mais ferramentas administrativas, enquanto a ver...

Evan Mueller

Sqlite

Como usar o aplicativo da Web do Viewer SQLite

SQLITE Viewer Web App oferece excelentes recursos para visualizar os bancos de dados SQLite online n...

Carl Hintz DDS

Força de vendas

Salesforce Apex - Lista

Tutorial prático sobre a coleção Lista na linguagem de programação do Apex e seus métodos e como ins...

Carl Hintz DDS