Regressão logística círculo

Regressão logística círculo
A popularidade do aprendizado de máquina e das ciências dos dados tem aumentado todos os dias desde a quantidade de dados produzidos, algoritmos eficientes para gerenciar e trabalhar com esses dados, e a força do poder de computação continua a aumentar. Classificação de dados com o método de regressão logística é uma das áreas essenciais e básicas do aprendizado de máquina. Neste artigo, explicaremos o que é a classificação de dados, o que é regressão logística e como eles são implementados em um programa Python. Demonstraremos alguns exemplos e explicaremos cada parte individualmente para ajudá -lo a entender como você pode implementar a regressão logística no Python.

O que é classificação?

Primeiro, para implementar qualquer coisa no Python ou em qualquer outra linguagem de programação, você precisa entender sua funcionalidade básica para que você possa escrever com eficiência o código para ele. Então, vamos explicar o conceito de classificação primeiro e depois seguir para a implementação da regressão logística usando as funções da biblioteca scipy.

Na ciência de dados e no aprendizado de máquina, a classificação é um subcampo de aprendizado de máquina supervisionado que faz previsões sobre a categoria ou classe à qual uma entidade pertence com base em seus atributos. Ele analisa a coleta de observações descrevendo matematicamente a dependência entre dados de entrada e saída. Ele cria uma conexão ou link entre variáveis ​​dependentes e independentes e faz isso trabalhando com ambos. Pode ser usado em vários campos de tecnologia e ciência para vários propósitos, como reconhecimento de imagem, classificação de texto, etc.

O que é regressão logística?

A regressão logística é uma técnica de aprendizado de máquina supervisionado para classificação comparável à regressão linear e é membro da classe de classificadores lineares. É um método muito conveniente, descomplicado e rápido para interpretar os resultados. Ele não pode ser usado apenas para classificação binária, mas também problemas de multiclasse. Em matemática, a regressão logística funciona com logaritmo natural e funções sigmóides. A função sigmóide é a curva em forma de S de uma variável que possui 0 ou 1 em quase todos os domínios. Enquanto o logaritmo natural é o logaritmo de um número para sua base.

O que é regressão logística no Scipy Python?

A idéia por trás da regressão logística é a mesma no Scipy Python, como discutimos anteriormente. A biblioteca Scipy fornece a função Logistic () para calcular a regressão logística no programa Python. Explicaremos alguns casos comuns de regressão logística com a ajuda de exemplos. Mas antes disso, vamos aprender e entender a sintaxe da função logística fornecida pela biblioteca scipy.

Sintaxe da função Scipy Logistic () em Python

A função Logistic () da Biblioteca Scipy é usada para gerar as variáveis ​​aleatórias contínuas e funciona com os métodos da classe RV_CONTUNUUY. Ele herda todos os métodos, recursos e funcionalidades da classe RV_CONTUNUous para concluir os detalhes específicos da regressão logística. A função Logistic () usa a seguinte função de densidade de probabilidade:

Que é um caso especial de genlogístico com c = 1. Consulte a sintaxe da função logística com os métodos da classe RV_CONTINUUIS abaixo:

Aqui, o objeto 'Logistic_Gen' refere -se a um dos métodos da classe RV_CONTINUous. Alguns dos métodos da classe RV_Contínuos são PPF, PDF, CDF, LOGPDF, RVS, SF, ISF, etc. Agora, vamos para a seção Exemplos para aprender como implementar a função Logistic () em um programa Python.

Exemplo 1:

Considere o código de amostra fornecido abaixo para entender o funcionamento da função Logistic () da Biblioteca Cipy. Aqui, estamos implementando a função Logistic () com métodos PPF e PDF. O PPF representa a função de porcentagem de pontos, que é usada para obter o percentil dos dados e o PDF significa função de densidade de probabilidade e é usada para obter a densidade de probabilidade dos dados. Veja o código de amostra fornecido abaixo e então explicaremos cada parte passo a passo:

importar numpy como np
de Scipy.estatísticas de importação logística
importar matplotlib.pyplot como plt
fig, ax = pLT.subparcelas (1, 1)
x = np.Linspace (logística.PPF (0.02),
logística.PPF (0.98), 100)
machado.plotagem (x, logística.pdf (x),
'r', lw = 8, alfa = 0.4, Label = 'Logístico PDF')
RV = Logistic ()
machado.plotagem (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
machado.Legenda (loc = 'Best')
plt.mostrar()

Vamos falar sobre as bibliotecas primeiro e depois o resto do programa. Precisamos da biblioteca Numpy para gerar e armazenar os dados em um objeto Numpy. Precisamos que a biblioteca scipy use a função de seu pacote de estatísticas. Precisamos da biblioteca Matplotlib para plotar os dados em um gráfico. Portanto, importamos as três bibliotecas juntamente com seus pacotes e funções associados que precisaremos de mais. Depois disso, o tamanho 1 x1 para plotar o gráfico é definido pela subtrama (1, 1). A variável x mantém os dados para a função de densidade de probabilidade, que fornecerá o PDF logístico. O PDF logístico foi congelado no RV variável e ambos os resultados foram passados ​​para a função plot (), então exiba -os no gráfico. Agora, vamos ver o gráfico gerado abaixo:

Exemplo 2:

Anteriormente, implementamos a função PDF para gerar regressão logística e depois congelá -la. Agora vamos comparar o resultado do método CDF com o método PDF neste exemplo. Considere o código de amostra fornecido no trecho de código abaixo:

importar numpy como np
de Scipy.estatísticas de importação logística
importar matplotlib.pyplot como plt
fig, ax = pLT.subparcelas (1, 1)
x = np.Linspace (logística.PPF (0.02),
logística.PPF (0.98), 100)
machado.plotagem (x, logística.pdf (x),
'r', lw = 8, alfa = 0.4, Label = 'Logístico PDF')
RV = Logistic ()
machado.plotagem (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
vals = logística.ppf ([0.001, 1, 0.999])
NP.AllClose ([0.001, 1, 0.999], logística.CDF (vals))
r = logística.RVs (tamanho = 1000)
machado.Hist (r, densidade = true, Histtype = 'StepFilled', alfa = 0.5)
machado.Legenda (loc = 'Best', frameOn = false)
plt.mostrar()

A primeira seção do programa é a mesma que definimos no exemplo anterior. A implementação do método CDF foi adicionada a este programa. Para comparar a linha do PDF logístico, geramos o histograma do método CDF. Vamos ver o gráfico fornecido na captura de tela abaixo:

Exemplo 3:

Vamos implementar outro método da classe RV_CONTUNUous para entender o funcionamento da função Logistic (). Considere o código de amostra fornecido no trecho de código abaixo:

importar numpy como np
de Scipy.estatísticas de importação logística
importar matplotlib.pyplot como plt
fig, ax = pLT.subparcelas (1, 1)
x = np.Linspace (logística.PPF (0.02),
logística.PPF (0.98), 100)
machado.plotagem (x, logística.pdf (x),
'r', lw = 8, alfa = 0.4, Label = 'Logístico PDF')
RV = Logistic ()
machado.plotagem (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
vals = logística.ppf ([0.001, 1, 0.999])
NP.AllClose ([0.001, 1, 0.999], logística.logcdf (vals))
r = logística.RVs (tamanho = 1000)
machado.Hist (r, densidade = true, Histtype = 'StepFilled', alfa = 0.5)
machado.Legenda (loc = 'Best', frameOn = false)
plt.mostrar()

Usamos o mesmo programa que fizemos nos exemplos anteriores, acabamos de substituir o método CDF pelo método logcdf. Agora, vamos comparar os resultados do método CDF e do método logcdf comparando as saídas de ambos os programas. Veja o resultado dado abaixo:

Conclusão

Este guia deu uma rápida visão geral da função de regressão logística fornecida pela Scipy Library. Uma abordagem supervisionada de aprendizado de máquina oferecida no grupo de classificação é a regressão logística. A regressão logística é uma de suas técnicas importantes, e a classificação também é uma aplicação importante do aprendizado de máquina. Demonstramos alguns exemplos para mostrar como implementar a função Logistic () da Biblioteca Cipy.