Combine colunas em r

Combine colunas em r
“Há uma diversidade de cenários em que os conjuntos de dados são divididos em inúmeras tabelas e várias razões pelas quais esse pode ser o caso. Às vezes é mais simples coletar informações em pedaços menores, enquanto em algumas situações, é melhor minimizar o tamanho do arquivo. Independentemente de por que os conjuntos de dados são fragmentados em tabelas separadas, eles devem ser estruturados de uma maneira que haja um mínimo de uma coluna semelhante entre as duas tabelas, permitindo que elas sejam combinadas, se necessário.Existem três estratégias principais que examinaremos para reduzir sua carga de trabalho e garantir que cada coluna e parâmetro importantes de seus diferentes conjuntos de dados seja integrada adequadamente.Depois de passar por todas as técnicas e seus códigos de exemplo práticos correspondentes, você poderá fazer uma forte aderência ao conceito de combinar colunas em r.”

Combinando colunas em r

R nos fornece várias maneiras de combinar colunas de um dataframe. Neste artigo, nós o familiarizaremos com 3 deles; Usando a função "paste ()", usando a função "Unite ()" e usando a função "str_c ()".

Combine colunas por função "paste ()"

Um dos métodos para combinar colunas de um quadro de dados em r é usar a função "paste ()". Esta função funciona combinando colunas de dois dados diferentes, bem como dentro do mesmo DataFrame.

Antes de nos concentrarmos em sua implementação, primeiro, precisamos entender a sintaxe da função "paste ()".

# Paste (dados $ c1, dados $ c2, set = "")

A sintaxe para a função "paste ()" possui 3 parâmetros. "Data" é o nome do quadro de dados que você inseriria, e "C1" é o nome da coluna daquele dataframe. "C2" refere -se a outro nome da coluna no quadro de dados que você precisa combinar com o primeiro. Enquanto "setembro" significa um separador que separa duas colunas e ("") refere -se a qualquer coisa que um separador precise adicionar entre as 2 colunas. Aqui é usado para adicionar espaço entre as duas colunas enquanto se junta a elas.

Criamos um DataFrame com 3 colunas; "FirstName", "LastName" e "Age.”Ao utilizar a função“ c () ”, atribua valores a todas as colunas. O "FirstName" e o "SungName" têm valores do tipo de dados de caracteres, enquanto a coluna "Age" armazenou valores do tipo de dados numéricos. Criamos um quadro de dados chamado "Info" e armazenamos os valores dos "dados.quadro () ”função nele. A instrução “print ()” exibirá o quadro de dados que acabamos de criar.

Na tela de saída, você pode ver uma tabela com 3 colunas.

Agora vamos utilizar a função "paste ()". Primeiro, escreva o nome do DataFrame em que você armazenou valores; Enquanto o chamamos de "Info", adicione um operador "$" ao lado, que usamos para escolher uma coluna ou alocar um novo valor a uma coluna. Prosseguindo, fazendo uma nova coluna com o nome "FullName", ao qual atribuiremos os valores combinados das 2 colunas diferentes. Dentro da função "paste ()", mencione o nome do DataFrame com um operador "$" e a coluna que você deseja selecionar. Depois de colocar uma vírgula, escreva o nome do DataFrame, o operador "$" e a segunda coluna que você deseja mesclar. “(Sep =“ ”)” adicionará espaço entre as duas colunas enquanto as combina.

A imagem abaixo mostra as duas tabelas; o primeiro com o quadro de dados inicial e o outro com uma coluna combinada “FullName.”

Você pode remover o quadro de dados anterior, eliminando a primeira instrução "print ()".

A saída pode ser encontrada na imagem abaixo.

Combine colunas por função "Unite ()"

Outro método para ingressar nas colunas na programação R é usando a função "Unite ()". Precisamos carregar o pacote que possui esta função que é o pacote "Tidyr".

Para usar a função "Unite ()", a sintaxe que seguiremos é:

# Unite (nome de dataframe, nome combinado da coluna, c (column1, column2))

Onde "DataFrame Nome" é o DataFrame que você inserirá. “Nome da coluna combinada” é o nome da coluna onde você deseja armazenar os dados mesclados. E dentro da função "C ()" estão "Column1" e "Column2", as colunas que você precisa para combinar.

No exemplo em questão, instalamos o pacote "Tidyr" da biblioteca R da R. Criou um DataFrame da mesma maneira que o criamos no exemplo acima. Queremos combinar 2 colunas; "FirstName" e "SalvName.“Dentro da função“ Unite () ”, escreveremos o nome de DataFrame, que é“ Info.”Então o nome da coluna onde os valores combinados da coluna serão armazenados como“ FullName."Usando a função" c () "para chamar as 2 colunas a serem combinadas. Finalmente, a instrução "print ()" exibirá a saída.

Uma nova coluna com o nome "Nome Fullname", armazenando valores de fusão de colunas "FirstName" e "LastName".

Combinando colunas por função "str_c ()"

Agora estamos juntando várias colunas com o método str_c (). Para isso, inicialmente, precisamos instalar o pacote “Stringr.”

A função “str_c ()” funciona com esta sintaxe:
Str_c (dataframe $ colun1, "", dataframe $ colun2)

"DataFrame" é o quadro de dados que criamos. "Column1" e "Column2" são as 2 colunas que queremos concatenar. Se você notou, há espaço ("") entre os nomes das colunas. Se não adicionarmos esse espaço adicional, isso fundirá as duas colunas sem espaço.

Aqui está um exemplo do que fizemos.

No início, carregamos um pacote "Stringr" que nos permitirá usar a função "str_c ()". Usamos o DataFrame criado nos exemplos acima e, com as mesmas etapas mencionadas anteriormente, armazenamos seus valores em um novo DataFrame chamado “Info.”

Dentro da função "STR_C ()", pegamos os nomes de ambas as colunas como "info $ primeironame" e "info $ lastname" e adicionamos espaço entre eles para que eles não se misturem quando concatenados.

Você pode ver a coluna combinada resultante do exemplo demonstrado acima.

Conclusão

Combinar colunas na programação R é um conceito super fácil e útil. Isso pode ser feito por várias técnicas usando o rstudio no Ubuntu 20.04. Fizemos um esforço para apresentá -lo aos métodos e técnicas que podem ser utilizados para a concatenação de colunas em r. Ao demonstrar códigos de exemplo e elaborar todos os pequenos detalhes, nosso objetivo e objetivo intencional é guiá -lo de maneira mais simples e confiável para aprender e aproveitar a combinação de colunas na programação R.