Regressão linear em r

Regressão linear em r
Um dos métodos de análise de dados mais utilizados é a regressão. O aprendizado de máquina está avançando, e com ele vem um algoritmo bem conhecido: a regressão linear. Este artigo o familiarizará com como usar a função de regressão linear do R. Os modelos de regressão se encaixam nos dados observáveis ​​para interpretar associações com as variáveis. Você pode usar a técnica para determinar como uma variável dependente muda como as variáveis ​​independentes.

A exploração de regressão é uma técnica estatística popular para estabelecer um modelo de relacionamento entre duas variáveis. Uma dessas variáveis ​​é chamada de variável preditora e seu valor é determinado através de estudos. A variável de resposta é a outra variável, e a variável preditora permite obter um valor.

Qual é a regressão linear na linguagem de programação R no Ubuntu 20.04?

As duas variáveis ​​estão ligadas por uma equação na regressão linear, onde o poder exponencial de ambas as variáveis ​​é uma. Quando descrito como um gráfico, uma conexão linear indica uma linha reta em matemática. Uma curva é formada por uma conexão não linear na qual o valor exponencial de qualquer variável não é equivalente a um.

Sintaxe da regressão linear na equação matemática:
A regressão linear possui a equação matemática subsequente:

y = ax+b

Sintaxe da regressão linear na linguagem de programação R:
Em R, a sintaxe básica para realizar uma análise de regressão é a seguinte:

lm (y ~ x)

Onde y é o item que contém a variável a ser prevista, que é dependente, e x é a fórmula do modelo matemático. O comando lm () retorna os coeficientes X, mas não possui outros dados estatísticos. Podemos usar a função lm () para criar um modelo de relacionamento entre o preditor e a variável de resposta.

Como a regressão linear é usada em r no Ubuntu 20.04

A seguir, estão as quatro etapas para estabelecer um relacionamento:

  • Usando os métodos lm () em r, construa um modelo de relacionamento.
  • Colete os coeficientes primeiro do modelo que você construiu e use -os para criar a equação matemática.
  • Para descobrir a imprecisão média na previsão, obtenha um resumo do modelo de relacionamento também conhecido como resíduos.
  • Use a função previc () em r para prever o novo valor para a interceptação x.

Exemplo #1: Obtenha os coeficientes de regressão criando um modelo de relacionamento

Aqui, criamos o modelo de relacionamento simples das duas variáveis ​​para executar a regressão usando a função lm (). Isso nos dá os coeficientes do modelo de relacionamento. Vamos demonstrar isso usando o seguinte script:

Como mostrado no exemplo anterior, declaramos uma variável "A" que é inicializada com algum número aleatório como representação vetorial. Em seguida, criamos outra variável à qual também atribuímos com a coleção dos números aleatórios. A função lm () é chamada dentro da nova relação variável. Para essa função lm (), passamos as variáveis ​​"A" e "B" para gerar as relações entre elas. Para a função de impressão, a variável de relação é passada para mostrar a saída.

Quando o código de regressão anterior é executado, ele mostra a regressão dos resultados do coeficiente da variável "a".

Exemplo #2: Obtenha um resumo de relacionamento

O método resumo () em r pode ser usado para visualizar os resultados do modelo. Esta função cria uma tabela com as entradas mais essenciais do modelo linear.

Aqui, criamos a variável "A" para a qual atribuímos a coleção de alguns números. Há outra variável "B" que também tem algum número aleatório. Essas variáveis ​​agora são chamadas dentro da função lm () que é armazenada na relação variável. Aqui, a variável "B" é a variável dependente que deve ser prevista. Na função de impressão, temos uma função de resumo para a relação de regressão. Passamos a variável de relação dentro da função de resumo como uma entrada.

Esta tabela de saída resume a fórmula que gerou os resultados ("chamada") e descreve os resíduos do modelo ("resíduos"), que representam como todo o modelo se encaixa nos dados reais. A tabela de "coeficientes" vem a seguir. A primeira linha mostra as estimativas de interceptação em Y, enquanto a segunda linha mostra o coeficiente de regressão do modelo.

Exemplo # 3: Usando a função de previsão para novos valores

Usamos a função de previsão na regressão linear para os novos valores. Esta função leva dois parâmetros ao objeto e os dados recém -criados, que são o vetor. A fórmula que já foi produzida com a função lm () é chamada de objeto. O vetor novo dados compreende o novo valor para a variável preditora.

Como refletido na imagem anterior, criamos dois vetores, "V1" e "V2". Então, chamamos esses vetores na função lm (). O vetor "V1" é a variável prevista e o "V2" é a variável de resposta. Então, com a nova variável "X", encontramos o novo valor com o "V1" é igual a 150. A função prevista pega o objeto "x" e os resultados da função lm ().

Quando o script R anterior é executado, ele gera os seguintes resultados:

Exemplo #4: Renderize o gráfico de regressão linear

Também podemos criar o gráfico de regressão do revestimento em r. Visualizamos o gráfico de regressão linear do script a seguir:

Criamos a variável preditora e resposta como "x" e "y". Então, nós os chamamos dentro da função lm (). O arquivo png da plotagem é criado onde o gráfico é visualizado. Em seguida, estilizamos nosso gráfico de regressão linear com algumas entradas na função da plotagem.

Você pode ver o gráfico de regressão linear da seguinte maneira:

Conclusão

O artigo regressão linear em R acaba aqui. A regressão linear é um tópico muito vasto, mas entregamos todas as explicações possíveis necessárias para este tópico. A ligação entre duas variáveis ​​pode ser estimada usando regressão linear. Aqui, cobrimos alguns exemplos de regressão linear. Temos a função lm () usada na regressão linear. Em seguida, compreendemos a função de resumo da regressão linear. A função de previsão também é demonstrada e também representamos a regressão linear graficamente.