Crie um DataFrame em R

Crie um DataFrame em R
Em R, os quadros de dados são o objeto mais frequentemente utilizado para armazenar dados. É uma coleção de vetores de comprimentos idênticos. Um DataFrame é uma tabela ou uma estrutura que se assemelha a uma matriz bidimensional, onde cada coluna representa o valor de uma única variável, enquanto os valores de cada coluna são representados em uma única linha.

Um DataFrame deve atender a algumas características que mencionamos neste parágrafo. As colunas no quadro de dados devem ser nomeadas e não deixadas vazias. Cada linha no quadro de dados deve ser nomeada exclusivamente.

Criando dados de dados em r

A programação R fornece vários métodos para criar um DataFrame. Podemos construir um quadro de dados utilizando os vetores de outro quadro de dados e importando um arquivo. Neste artigo, discutiremos essas técnicas que o ajudarão a aprender o conceito de criar um quadro de dados em r.

Usando vetores para fazer um dados de dados em r

A programação r permite construir um quadro de dados usando vetores que são iguais em tamanho. Para esse fim, R fornece uma função interna “Dados.quadro()".Esta função pode capturar tantos vetores quanto desejamos.

A seguir, a sintaxe para chamar esta função:

df <- data.frame(v1, v2, v3, v4)

Em qualquer dataframe, Uma coluna é representada por cada vetor e o número de linhas será determinado pelo comprimento de qualquer vetor.

Existem 2 maneiras de gerar um quadro de dados usando vetores, um criando os vetores necessários e depois passando para os “dados.estrutura () ”função. E o substituto adicional é fornecer diretamente os vetores aos “dados.Frame () ”função e atribua valores a eles dentro dos aparelhos de função.

Ajudaremos você a entender os dois métodos demonstrando exemplos práticos em rstudio no Ubuntu 20.04.

Realizaremos um exemplo para fazer um quadro de dados de vetores. Primeiro criaremos vetores e depois passaremos todos eles como um parâmetro dos “dados.quadro()".

No programa que demonstramos na imagem acima, usamos quatro vetores. Todos os vetores são criados usando a função "c ()". O primeiro vetor que geramos é "nome", que armazenará os nomes de 3 pessoas com valores do tipo de personagem. O segundo vetor é "linguagem" e armazena os nomes de 3 linguagens de programação. Ele também armazena tipos de dados de caracteres. Nosso terceiro vetor é "idade", que armazena tipos de dados numéricos. O último vetor, "gênero", também armazena 3 valores do tipo de dados de caracteres. Todos os 4 vetores são passados ​​para os “dados. Frame () ”funcionam como seu parâmetro. O quadro de dados "df" armazenou a saída dos "dados.quadro () ”função nele. Na última etapa do código, usamos a instrução "print ()" para exibir a saída.

O DataFrame resultante possui 4 colunas, cada uma com o mesmo tamanho de vetores.

O outro método alternativo para gerar um quadro de dados em r usando os vetores é que você pode fornecer aos vetores valores dentro dos “dados.estrutura () ”função.

Esse trecho de código simplesmente criou vetores e atribuiu valores a eles dentro do corpo dos “dados.Frame () ”” função e armazenou essa função no DataFrame “DF."" Print () "exibiu a saída.

A tabela resultante produz a mesma saída, que pode ser vista na imagem abaixo.

Vale a pena repetir que, para gerar um quadro de dados a partir de uma lista de vetores, cada vetor na lista deve ter a mesma quantidade de elementos; caso contrário, o script reportará um erro.

Usando outros quadros de dados para criar um quadro de dados

Criar um DataFrame usando dois ou mais dados de dados é outra técnica aplicada na programação R. Podemos fazer pelo agrupamento de colunas de um DataFrame para outro e também para se juntar às linhas.

Executaremos dois programas aqui, um para o agrupamento horizontal e o outro para agrupamento vertical.

Para as colunas, a função que usaremos é “cbind ().”Vamos criar 2 dados de dados primeiro e depois combiná -los usando a função“ cbind () ”.

No primeiro pedaço de código, 2 colunas serão construídas e os valores são armazenados no DataFrame "DF1".

A tabela resultante produz a mesma saída, que pode ser vista na imagem abaixo.

Outro dataframe, "df2", é gerado com 2 colunas, "idade" e "gênero.”

A tabela resultante produz a mesma saída, que pode ser vista na imagem abaixo.

Um DataFrame "DF3" é construído e utiliza a função "cbind ()" para combinar a "df1" e "df2".

A saída final mostra uma tabela gerada pela fusão dos 2 quadros de dados.

Da mesma forma, para criar as linhas de quadro de dados, podemos usar a função "rbind ()". Dentro da função "rbind ()", passaremos os 2 dados de dados como parâmetros. Esta função concatenará os 2 frutos de dados verticais menores em uma tabela inteira. Lembre -se de que o número de linhas deve ser o mesmo para todos os quadros de dados que você criará.

Lendo um arquivo em um quadro de dados

Além de gerar um quadro de dados, há mais algumas coisas que você pode fazer. Podemos importar um conjunto de dados tabulares e salvá -lo como um DataFrame. É o método mais frequente para construir um quadro de dados na programação R.

Criamos um arquivo CSV, armazenamos valores em formato tabular e o chamamos de “Tabela.CSV.”Salvamos este arquivo em nossa pasta“ documentos ”. Em RStudio, vamos lê -lo usando o “Leia.CSV () ”função como um novo DataFrame chamado“ Tabela.”

Para ler um arquivo CSV no RStudio, a primeira coisa que você precisa fazer é configurar seu diretório de trabalho atual. Ao usar a função "getwd ()", você pode localizar seu diretório de trabalho atual. Na próxima etapa, você deve definir seu diretório para onde salvou o “.Arquivo CSV ”. Se você não considerar essas etapas, receberá um erro ao lutar para ler o arquivo.

Depois de definir corretamente o caminho do diretório de trabalho atual para o diretório em que você armazenou seu arquivo CSV, agora você usará o “Leia.função cs () ”. Escreva o ".Nome do arquivo CSV ”com uma marca (" ") dentro do" Leia.CSV () ”e use um DataFrame com o nome que você deseja armazenar seus valores.

Os dados que armazenamos em nosso arquivo CSV são exibidos aqui.

Conclusão

No tópico de hoje, exploramos a criação de dados de dados. DataFrames são estruturas necessárias da programação R. Discutimos maneiras diferentes de construir seus quadros de dados em rstudio no Ubuntu 20.04 Ambiente elaborando cada um com um exemplo útil. Colocar a prática prática nesses códigos de exemplo não apenas o apresentará à necessidade de usar os quadros de dados, mas também as maneiras alternativas de construí-los.