Introdução ao RStudio no Ubuntu Linux

Introdução ao RStudio no Ubuntu Linux
Este tutorial ilustrará como instalar o RStudio no Ubuntu 20.04.

O RSTUDIO fornece um ambiente de desenvolvimento integrado para lidar. O RSTUDIO é um ambiente de computação ideal para gerar visualizações estatísticas detalhadas e, como tal, é usado por estatísticos em todo o mundo.

O RSTUDIO também está disponível como um programa de software e como um aplicativo de servidor, usado por uma variedade de diferentes distribuições Linux e para Windows e MacOS.

Baixe a linguagem de programação R (pré -requisitos)

RSTUDIO APLICAÇÃO DE ÁRNESSA DE ENQUERAÇÃO PRECISA A linguagem de programação R para funcionar em Distros Linux. É necessário baixar uma versão R que seja compatível com seu sistema operacional Linux. Você pode baixá -lo usando um repositório de software.

1- Download R com o navegador da web

Se você não conseguir obter r do centro de software, significa que o repositório deve ser atualizado primeiro. Você pode simplesmente pular tudo isso e baixá -lo da web digitando neste link:

https: // cran.estúdio.com

Na caixa de pesquisa no seu navegador da web. A página inicial deles deve se parecer com a captura de tela abaixo:

2- Download R do terminal Linux

Inicie o terminal da CLI, digite o comando abaixo e pressione Enter:

Em seguida, execute uma atualização com os comandos abaixo:

Atualização $ sudo apt-get

Este comando buscará as atualizações de R e adquirirá todos os arquivos relevantes do repositório principal do Ubuntu.

Em seguida, emita o seguinte comando para instalar R:

O comando acima passa pela listagem do pacote, revelando a quantidade de espaço em disco que ele preencherá, depois pede confirmação. Aperte a tecla 'Y' no seu teclado para continuar com a instalação.

A saída provavelmente confirmará a instalação.

Você pode procurar na caixa de pesquisa, conforme ilustrado abaixo:

Instalando o RStudio no Ubuntu 20.04 com terminal de comando

Com a linguagem de programação do host instalada, agora podemos proceder para instalar o RSTUDIO. Para demonstrar a instalação, usaremos o terminal da linha de comando.

Acender o terminal e emitir o seguinte

$ sudo apt-get install gdebi-core

Você será solicitado a inserir a senha raiz. Depois de inserir a senha, a instalação do pacote começará

$ wget https: // download1.rstudio.org/desktop/bionic/amd64/rstudio-1.3.1093-AMD64.Deb

O pacote online RStudio já está conectado e está sendo transferido para o seu disco rígido.

Você será solicitado a inserir a senha raiz novamente. Digite a senha para obter a lista de pacotes lida e carregada.

O instalado solicitará permissão para continuar, pressione a tecla Y no seu teclado.

A saída verificará a instalação, como mostrado abaixo.

Introdução ao RSTUDIO:

Para lançar o RSTUDIO, vá até a caixa de pesquisa e procure rstudio. Você o verá em uma das listas, como mostrado abaixo:

Clique no ícone RStudio para iniciá -lo.

Investigando conjuntos de dados com rstudio

Com o RSTUDIO, você pode visualizar quaisquer dados na forma de gráficos, tabelas e gráficos.

Para entender como os dados são representados visualmente em RStudio, vamos pegar a população do censo da amostra de 2010 para cada CEP como exemplo.

O processo de análise de dados pode ser vagamente reduzido às quatro etapas a seguir:

1-Import dados brutos

Você pode importar os dados brutos diretamente da web para o RStudio, fazendo -os sistematicamente na janela do console com o comando abaixo:

$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Com o comando executado, o RStudio obterá os dados como um arquivo CSV da Web, e o conteúdo será atribuído à variável CPD.

Outra maneira de importar dados para RStudio é baixar manualmente o conjunto de dados para o seu harddrive e depois abrindo o conteúdo com o recurso de dados de importação do RSTUDIO.

Vá para a opção Importar o conjunto de dados na guia Environment e selecione o arquivo do conjunto de dados para fazer upload. Clique em OK e você será exibido a caixa de diálogo sobre o conjunto de dados. É aqui que você estará especificando os parâmetros, bem como os nomes e decimais. Quando terminar, basta clicar em importar e o conjunto de dados será adicionado ao rstudio, e uma variável será atribuída ao seu nome.

Para ver quais conjuntos de dados estão em uso, emita o comando abaixo com a variável atribuída a um conjunto de dados:

$ View (CPD)

2 -manipulando os dados

Agora que você importou o conjunto de dados, há muito que você pode fazer para transformar esses dados. Os dados são manipulados através de recursos de transformação. Suponha que você queira fazer uma turnê para uma determinada matriz dentro do conjunto de dados. Se fossemos para a coluna total da população em nosso conjunto de dados, entraríamos no comando abaixo:

$ cpd $ população total

Os dados também são recuperáveis ​​na forma de um vetor:

$ CPD [1,3]

A função de subconjunto em RStudio nos permite consultar o conjunto de dados. Digamos que precisamos destacar as linhas onde a proporção masculina / feminina é positiva. Para escolher essas linhas, você emitiria o seguinte comando:

$ a <- subset(cpd , Total Males > Total fêmeas)

No comando acima, o primeiro parâmetro que atribuímos tinha que ser a variável atribuída ao conjunto de dados ao qual aplicamos a função. A condição booleana é considerada o segundo parâmetro. Além disso, a condição booleana deve ser avaliada para cada linha. Serve como o fator decisivo sobre se uma linha deve ou não fazer parte da saída.

3 -Usando as funções médias no conjunto de dados

O RSTUDIO possui funções específicas para calcular médias no conjunto de dados:

$ médio (CPD $ total do sexo masculino) - calcula a média simples
$ mediana (CPD $ TOTAL FEMAL) - Dá a mediana para uma coluna
$ quantil (CPD $ total população) -dão o quantil para uma coluna
$ var (CPD $ TOTAL MASS) -elimina a variação de uma coluna
$ SD (CPD $ TOTAL FURIM

Para obter o relatório resumido no conjunto de dados, você também pode executar qualquer uma dessas funções em todo o conjunto de dados.

$ resumo (CPD)

4 -criando um gráfico para o conjunto de dados

Se você vai trabalhar com o RStudio com frequência, você achará sua ferramenta de visualização muito engenhosa. Você pode criar um gráfico a partir de qualquer conjunto de dados importado com o enredo e outras funções de visualização no rstudio.

Para gerar um gráfico de dispersão para o conjunto de dados, você emitiria o seguinte comando:

$ plot (x = s $ total machos, y = s $ total fêmea, tipo = 'p')

Agora, vamos discutir os parâmetros envolvidos aqui. Em cada parâmetro, S refere -se ao subconjunto do conjunto de dados original e, ao adicionar "P", você está indicando que deseja que a saída seja plotada.

Você também pode representar seu conjunto de dados na forma de um histograma:

$ hist (CPD $ total de famílias)

Da mesma forma, para obter um gráfico de barras do conjunto de dados importado:

$ contagens <- table(cpd$Total Population)
$ barplot (contagem, main = "distribuição total da população",
$ xlab = "Número de totalpopulação")

Gerenciando dados em séries temporais de espaçamento desigual

Para gerenciar dados com séries temporais de espaçamento desigual, você deve integrar o pacote do zoológico com o RSTUDIO. Para obter o pacote do zoológico, vá para o canto inferior direito da tela em RStudio e para o componente do pacote. O pacote do zoológico converte os dados irregulares de séries temporais em objetos de zoológico. Os argumentos inseridos para criar objetos de zoológico são os dados, que são primeiro, seguidos pelo valor a ser ordenado por.

Os objetos do zoológico fornecem suporte de facilidade de uso. Tudo o que você precisa fazer é digitar “plotagem” e será exibido todos os métodos de plotagem que você pode usar com esse pacote de zoológico.

Se você se estiver confuso sobre o que uma certa função rstudio tem a oferecer, insira o nome dessa função e siga -o com “?”Para ver o prompt no menu de ajuda. Além disso, pressionar o espaço Ctrl+após um nome de função produz a janela de conclusão automática.

Empacotando

Este tutorial ilustrou como você pode configurar o RStudio no Ubuntu 20.04 e cobriu o básico da representação estatística e manipulação com RStudio. Se você deseja utilizar melhor o rstudio, familiarizando -se com o básico da programação R deve ser um bom primeiro passo. RStudio é uma ferramenta poderosa e possui aplicações em muitos setores em todo o mundo: inteligência artificial e mineração de dados, para citar alguns.

Conhecer a Nitty-Gritty de R Programming é uma curva de aprendizado, mas vale a pena o esforço.