Remova colunas em R

Remova colunas em R
“Um quadro de dados contém freqüentemente colunas que não são relevantes para sua investigação. Para facilitar a enfatiza as colunas restantes, essas colunas devem ser removidas do conjunto de dados. Ao fornecer nomes de etiquetas e eixos relacionados ou definindo diretamente nomes de índice ou colunas, as colunas podem ser eliminadas. Rótulos em vários estágios podem ser removidos usando um multi-índice designando o nível.

Em R, você pode ocasionalmente precisar eliminar uma ou várias colunas especificadas de um quadro de dados. Felizmente, existe algum método interno do módulo R que simplifica. A queda de colunas de um conjunto de dados é simplesmente um método de remoção de colunas desnecessárias do quadro de dados. Neste post, examinaremos vários métodos distintos para remover colunas por título de um conjunto de dados em r.”

Como remover as colunas dos quadros de dados no R no Ubuntu 20.04?

O mecanismo de queda da coluna em R permite remover colunas desnecessárias de um quadro de dados. Em R, você pode soltar uma coluna pelo seu nome de várias maneiras. Este artigo mostra como remover uma coluna de um quadro de dados através de diferentes casos em muitos métodos diferentes.

Exemplo # 1: Usando o método de subconjunto para remover colunas em r no Ubuntu 20.04

Usando o método Subset () com o símbolo “-“ que significa que a queda de variáveis, é uma das maneiras mais simples de soltar colunas. Esta função na linguagem de programação R é usada para criar subconjuntos de um quadro de dados e remover colunas de um quadro de dados. A sintaxe do subconjunto em r é assim: subconjunto (df, expr). Onde df é o quadro de dados e o expr é denotado como a expressão para o subconjunto.

No script de exemplo, criamos o quadro de dados "Data1" que contém quatro colunas x1, x2, x3 e x4. O registro é inserido dentro dessas colunas. Ao executar o comando data1, o quadro de dados é impresso, mostrando os nomes das colunas com as entradas que eles têm. Depois disso, criamos uma variável data2 e chamamos o método de subconjunto dentro dele. O método de subconjunto toma os dados1 como uma entrada e a condição de seleção para soltar as colunas x1 e x3.

Quando o Data2 é executado, ele gera o novo quadro de dados, que possui todas as colunas, exceto o X1 e X3, pois essas colunas são removidas com o método de subconjunto.

Exemplo # 2: Usando o método de nome para remover colunas em r no Ubuntu 20.04

Esta técnica cria um vetor de caracteres em que os nomes de colunas são armazenados. Mais tarde, instruímos R a escolher todas as variáveis, exceto as indicadas na queda da coluna. A negação é denotada pelo “!”Símbolo. O método nomes () em r é usado para buscar ou modificar o nome do objeto. Este método aceita o objeto como um parâmetro, que pode ser uma matriz, vetor ou quadro de dados, bem como o valor que será usado para nomear o objeto. O comprimento do vetor de valor fornecido deve corresponder exatamente ao comprimento do objeto a ser nomeado e retorna todos os nomes de colunas.

No script R acima, estabelecemos o quadro de dados dentro da variável “DF.”O quadro de dados é impresso na tela e, como você pode ver, esse quadro de dados possui quatro campos com entradas distintas. Em seguida, incluímos o comando Drop e especificamos os nomes das colunas dentro do vetor. A nova variável é criada como "new_df", onde o método de nome é invocado e, para o método name (), passamos nosso quadro de dados "DF.”Observe que usamos o % em % operador após o método do nome e o comando Drop à direita do % em % operador.

A execução do código acima gera o seguinte quadro de dados em que as colunas Y2 e Y3 foram removidas.

Exemplo # 3: Usando o método Selecionar para remover colunas em R no Ubuntu 20.04

Usaremos o select () neste método importando o pacote DPLYR para r e especificando o argumento para omitir as colunas do conjunto de dados. Em essência, essa função apenas salva as variáveis ​​que você especifica.

Incluímos o pacote DPLYR para acessar o método de seleção. Além disso, construímos o quadro de dados do qual podemos remover as colunas. O quadro de dados é gerado no formulário tabular ao executar o comando mydata, pois o quadro de dados é armazenado dentro dessa variável. Depois disso, na próxima imagem rápida, implantamos o método de seleção em que o quadro de dados é especificado como um argumento, e também o nome da coluna A1 com o sinal de menos é fornecido.

O prompt R interpreta esse comando de método selecionado e produz o quadro de dados, que possui a coluna A1 excluída.

Exemplo # 4: Usando o método Selecionar para remover colunas pelas posições da coluna em R em Ubuntu 20.04

Passaremos a posição do índice da coluna como um vetor para o método de seleção com um sinal negativo para remover a posição de coluna por coluna, como visto abaixo.

Aqui, incluímos o módulo DPLYR primeiro. E então, inserimos o quadro de dados interno R “Iris.”O quadro de dados da íris é exibido e possui várias colunas, como mostrado no prompt de R. Podemos remover qualquer uma das colunas dentro do quadro de dados da íris, especificando o índice da coluna. Para isso, temos o método select () para o qual passamos o quadro de dados e o valor do índice para o vetor. A coluna 3,4 e 5 é removida da íris do quadro de dados, que é exibida abaixo.

Exemplo # 5: Usando o método Selecionar para remover colunas pelo caráter inicial e final da coluna em R no Ubuntu 20.04

Também podemos escolher colunas, dependendo de seus personagens iniciais e finais aqui. A função start_with () retorna a coluna que começa com o personagem fornecido. Para usar o método start_with (), precisamos seguir a sintaxe fornecida pelo idioma R, que é selecionado (DataFrame, -starts_with ("Substring"))). Onde o DataFrame denota a fonte, DataFrame e substring denotam o caractere ou string que o precede.

Selecionamos a estrutura de dados de dentes neste exemplo, pois possui três colunas impressas na tela. Agora, na próxima etapa, temos um método start_with () dentro do comando select. O método start_with () com um sinal menos leva o nome da coluna que começa com a “dose” no quadro de dados do dente de dentes. Ele removeu a coluna “dose” do quadro de dados quando este comando selecionado foi executado.

O end_with () é uma função que retorna a coluna que contém o personagem fornecido no final. A sintaxe que utilizamos para o método end_with () é o seguinte: SELECT (DataFrame, -nds_with ("Substring"))). Onde dataframe refere -se ao quadro de dados de entrada e substring refere.

Assim como o método start_with () acima, passamos a coluna “Supp” do dente de estrutura de dados para o método ends_with () com o sinal de menos. Este método também removeu a coluna que termina com o “supino.”

Conclusão

A linguagem de programação R foi usada para demonstrar a abordagem de remover colunas de um quadro de dados. Vimos o método de subconjunto e nome interno do R, que removeu as colunas. Em R, você pode soltar uma coluna usando o operador menos antes do método de seleção. Além disso, o método select () no módulo DPLYR em r é usado para escolher ou remover colunas com base nas condições como o início, as extremidades e as colunas de queda com base na localização são apresentadas com exemplos.