Pessoas de dispersão em r

Pessoas de dispersão em r
“Representações visuais de dados incluem gráficos e gráficos. Seu objetivo como cientista de dados é fazer todo o sentido de vastas quantidades de informação. Três procedimentos estão envolvidos na análise de dados. Obter dados, limpeza e alteração dos dados é uma parte importante do processo. Para avaliar ainda mais os dados, construa uma exibição visual a partir dele. As visualizações de dados com o enredo são ferramentas tremendas para facilitar a compreensão complicada. Mas primeiro, vamos passar por alguns princípios fundamentais de plotagem, como parcelas de dispersão. Um gráfico de dispersão é um diagrama que apresenta os níveis de duas variáveis ​​numéricas em um conjunto de dados como pontos geométricos dentro de um diagrama cartesiano.”

Qual é o enredo dispersor na linguagem de programação R no Ubuntu 20.04?

Comparar variáveis ​​é feito usando gráficos de dispersão. Quando precisamos saber o que mais uma variável é influenciada por outra, precisamos comparar as duas variáveis. O gráfico de dispersão é um grupo de pontos pontilhados nos eixos X e Y que representam dados distintos de dados. O layout dos pontos gerados demonstra uma correlação entre duas variáveis ​​quando seus valores são exibidos ao longo do eixo x e Y-eixo.

Sintaxe do gráfico de dispersão na linguagem de programação R no Ubuntu 20.04

Em R, você pode fazer um gráfico de dispersão em vários métodos. Plot (x, y), nos quais os parâmetros x e y são vetores numéricos que especificam as posições (x, y) na plotagem, é a função mais básica.

plot (x, y, main, xlab, ylab, xlim, ylim, eixos)

Como mencionado acima, x qualquer parâmetros X é obrigatório para representar graficamente o gráfico de dispersão, mas o gráfico de dispersão também suporta alguns parâmetros opcionais, que são descritos da seguinte forma:

x: As coordenadas horizontais estão definidas com esta opção.

y: As coordenadas verticais estão definidas com esta opção.

xlab: O rótulo do eixo horizontal.

ylab: O rótulo do eixo vertical.

principal: O tópico do gráfico é definido pelo parâmetro principal.

xlim: O parâmetro Xlim é usado para representar valores x.

ylim: A opção ylim é usada para plotar valores de y.

eixos: Esta opção determina se o gráfico deve incluir os dois eixos.

Como construir o gráfico de dispersão no r no Ubuntu 20.04?

Vejamos um exemplo para mostrar como podemos usar a função da plotagem para criar um gráfico de dispersão. Utilizaremos o conjunto de dados de amostra em nossos exemplos, que é um conjunto de dados pré -configurado no ambiente r.

Exemplo # 1: Usando o método da plotagem para construir o gráfico de dispersão R no Ubuntu 20.04

O método plot () na linguagem de programação R pode ser usado para fazer um gráfico de dispersão.

Para construir o gráfico de dispersão, precisamos do conjunto de dados. Então, aqui, inserimos os dados do conjunto de dados do idioma R. Selecionamos as duas colunas deste conjunto de dados para fazer o gráfico de dispersão. As primeiras entradas são mostradas no conjunto de dados usarrests. Então, temos a função da plotagem em que as duas entradas, x e y, estão definidas. Para a entrada X, a coluna “assassinato” é selecionada e, para a entrada Y, temos a coluna “Urbanpop”. Algumas entradas opcionais são passadas dentro da função, como os rótulos para X e Y são definidos com o XLAB e YLAB. Dentro da faixa Xlim e Ylim, os valores dos parâmetros X e Y são definidos. Além disso, o título do gráfico de dispersão é definido chamando a opção de "principal.”

A saída do gráfico de dispersão é gerada abaixo.

Exemplo # 2: Usando o método do par para construir as matrizes da plotagem de dispersão R no Ubuntu 20.04

Utilizamos uma matriz de gráficos de dispersão quando temos várias variáveis ​​e queremos correlacionar uma variável com os outros. As matrizes de scatterplot são criadas usando o método de pares ().

Aqui, selecionamos a amostra do conjunto de dados do idioma r. Em seguida, imprima as seis principais entradas do conjunto de dados da íris. Para as colunas da íris do conjunto de dados, aplicamos o método do par. Cada coluna será emparelhada com a coluna restante na função do par.

As métricas de gráfico de dispersão são visualizadas na figura a seguir.

Exemplo # 3: Usando valores ajustados em um gráfico de dispersão em r no Ubuntu 20.04

Você pode expandir o gráfico adicionando um novo nível de dados. Na regressão linear, você pode visualizar o valor ajustado. Para construir um gráfico de dispersão, usamos os métodos GGPlot () e Geom_Point () do pacote GGPlot2.

Comece com este exemplo; Nós importamos o módulo GGPLOT2 de R de R. Em seguida, utilizamos o método GGPlot, onde o nome do conjunto de dados “mtcars” é dado. A função "AES" é usada dentro do método GGPlot para criar os logs para os parâmetros X e Y. Para regressão linear, um conjunto adicional de recursos, "stat_smooth", é usado. O método de suavização é controlado pela opção Stat_ Smooth (). O erro padrão (SE) é mantido falso e a linha do tamanho é definida como o valor 1.

Exemplo # 4: Usando um nome dinâmico para o título da plotagem de dispersão em R no Ubuntu 20.04

Ainda não colocamos nenhum dado nas parcelas. Gráficos informativos são necessários. Sem recorrer a documentação extra, o leitor deve ser capaz de entender a mensagem por trás da análise de dados apenas olhando para o enredo. Como resultado, são necessários bons rótulos ao usar parcelas. Os rótulos podem ser adicionados usando a função Labs ().

Temos uma variável aqui como scatter_graph ao qual o método ggplot é atribuído. O ggplot definiu seu parâmetro o mesmo que o exemplo acima, mas para um conjunto de dados diferente. O conjunto de dados usado aqui é a íris. Em seguida, utilizamos novamente a variável scatter_garph e, desta vez, definimos os nomes dinâmicos para o enredo dispersor.

Você pode ver as informações adicionais no gráfico de dispersão dentro da figura a seguir.

Exemplo # 5: Usando o método 3dsCatterPlot para construir o gráfico de dispersão em R no Ubuntu 20.04

O pacote Scatterplot3D permite fazer um gráfico de dispersão tridimensional. Scatterplot3D é uma técnica útil que usa (x, y, z) sintaxe.

Incluímos o módulo ScatterPlot3D dentro do nosso script R acima. Agora, podemos usar a função Scatterplot3D. Para a função ScatterPlot3D, passamos três parâmetros que são as colunas selecionadas do dente de dados do conjunto de dados.

O gráfico de dispersão 3D é renderizado no snap do gráfico seguinte.

Conclusão

Este artigo tem como objetivo resumir você sobre o enredo de dispersão em R. Gráficos de dispersão são gráficos de dispersão usados ​​para exibir pontos de dados de parâmetros (geralmente dois, mas três são possíveis). O objetivo principal do enredo de dispersão R é ajudar a visualizar os dados e se as variáveis ​​numéricas têm algum relacionamento. Vimos várias abordagens que nos ajudam a criar o gráfico de dispersão da maneira mais fácil. Cada método tem sua funcionalidade e é muito fácil de entender.