Python plotly Tutorial

Python plotly Tutorial
A Plotly é uma empresa de análise conhecida por desenvolver análises em tempo real, estatísticas e ferramentas gráficas para aplicativos baseados na Web e scripts independentes de python. Nesta lição, examinaremos exemplos básicos com plota. Esses gráficos podem ser usados ​​em apresentações, pois são totalmente interativos e prontos para brincar com.

Há também uma opção para salvar um design de gráfico offline para que eles possam ser exportados facilmente. Existem muitos outros recursos que facilitam muito o uso da biblioteca:

  • Salvar gráficos para uso offline como gráficos vetoriais que são altamente otimizados para fins de impressão e publicação
  • Os gráficos exportados estão no formato JSON e não no formato da imagem. Este JSON pode ser carregado em outras ferramentas de visualização, como o Tableau, facilmente ou manipuladas com python ou r
  • Como os gráficos exportados são JSON na natureza, é praticamente muito fácil incorporar esses gráficos em um aplicativo da web
  • Plotly é uma boa alternativa para matplotlib para visualização

Para começar a usar o pacote plotly, precisamos nos registrar uma conta no site mencionado anteriormente para obter uma chave de usuário e API válida com a qual podemos começar a usar suas funcionalidades. Felizmente, um plano de preços gratuitos está disponível para plotagem com o qual obtemos recursos suficientes para fazer gráficos de grau de produção.

Instalando plotagem

Apenas uma nota antes de começar, você pode usar um ambiente virtual para esta lição que podemos ser feitos com o seguinte comando:

python -m virtualenv plotly
fonte numpy/bin/ativação

Depois que o ambiente virtual estiver ativo, você pode instalar a biblioteca plotly dentro do Env virtual, para que exemplos que criamos a seguir possam ser executados:

pip instalar plotly

Faremos uso de Anaconda e Jupyter nesta lição. Se você quiser instalá -lo em sua máquina, veja a lição que descreve “como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seus comentários se você enfrentar algum problema. Para instalar o plotly com a Anaconda, use o seguinte comando no terminal da Anaconda:

conda install -c plotly plotly

Vemos algo assim quando executamos o comando acima:

Depois que todos os pacotes necessários forem instalados e feitos, podemos começar usando a biblioteca da plotagem com a seguinte instrução de importação:

importar plotly

Depois de fazer uma conta no plotly, você precisará de duas coisas - nome de usuário da conta e uma chave da API. Pode haver apenas uma chave da API pertencente a cada conta. Portanto, mantenha -o em algum lugar seguro, como se você o perdesse, você terá que regenerar a chave e todos os aplicativos antigos usando a chave antiga pararão de funcionar.

Em todos os programas Python que você escreve, mencione as credenciais da seguinte maneira para começar a trabalhar com a plotly:

plotly.ferramentas.set_credentials_file (nome de usuário = 'nome de usuário', api_key = 'your-api-chave')

Vamos começar com esta biblioteca agora.

Introdução com a plotly

Faremos uso das seguintes importações em nosso programa:

importar pandas como PD
importar numpy como np
Importar Scipy como SP
importar plotly.plotly como py

Nós utilizamos:

  • Pandas para ler arquivos CSV de maneira eficaz
  • Numpy para operações tabulares simples
  • Círculo para cálculos científicos
  • Plotly para visualização

Para alguns dos exemplos, usaremos os próprios conjuntos de dados da Plotly disponíveis no GitHub. Por fim, observe que você também pode ativar o modo offline para plotagem quando precisar executar scripts de plotagem sem uma conexão de rede:

importar pandas como PD
importar numpy como np
Importar Scipy como SP
importar plotly
plotly.desligada.init_notebook_mode (conectado = true)
importar plotly.offline como py

Você pode executar a seguinte declaração para testar a instalação da plotagem:

Imprimir (plotagem.__versão__)

Vemos algo assim quando executamos o comando acima:

Finalmente baixamos o conjunto de dados com os pandas e o visualizamos como uma tabela:

importar plotly.figura_factory como ff
df = pd.read_csv ("https: // cru.GithubUserContent.com/plotly/conjuntos de dados/mestre/escola_
ganhos.CSV ")
tabela = ff.create_table (df)
py.iplot (tabela, nome do arquivo = 'tabela')

Vemos algo assim quando executamos o comando acima:

Agora, vamos construir um Gráfico de barras Para visualizar os dados:

importar plotly.Graph_Objs como Go
dados = [vá.Bar (x = df.Escola, y = df.Mulheres)]
py.iplot (dados, nome do arquivo = 'Women-Bar')

Vemos algo assim quando executamos o trecho de código acima:

Quando você vê o gráfico acima com o Jupyter Notebook, você receberá várias opções de zoom dentro/fora de uma seção específica do gráfico, Box & Lasso Select e muito mais.

Gráficos de barras agrupados

Vários gráficos de barras podem ser agrupados para fins de comparação com muita facilidade com plotagem. Vamos usar o mesmo conjunto de dados para isso e mostrar variação de presença de homens e mulheres nas universidades:

Mulheres = Vá.Bar (x = df.Escola, y = df.Mulheres)
homens = vá.Bar (x = df.Escola, y = df.Homens)
Dados = [homens, mulheres]
layout = vá.Layout (Barmode = "Grupo")
fig = vá.Figura (dados = dados, layout = layout)
py.iplot (fig)

Vemos algo assim quando executamos o trecho de código acima:

Embora isso pareça bom, os rótulos no canto superior direito não estão, correto! Vamos corrigi -los:

Mulheres = Vá.Bar (x = df.Escola, y = df.Mulheres, nome = "mulheres")
homens = vá.Bar (x = df.Escola, y = df.Homens, nome = "homens")

O gráfico parece muito mais descritivo agora:

Vamos tentar mudar o Barmode:

layout = vá.Layout (Barmode = "Relativo")
fig = vá.Figura (dados = dados, layout = layout)
py.iplot (fig)

Vemos algo assim quando executamos o trecho de código acima:

Gráficos de pizza com plotagem

Agora, tentaremos construir um gráfico de pizza com plotly que estabeleça uma diferença básica entre a porcentagem de mulheres em todas as universidades. O nome das universidades serão os rótulos e os números reais serão usados ​​para calcular a porcentagem de todo. Aqui está o trecho de código para o mesmo:

rastreio = vá.Torta (rótulos = df.Escola, valores = df.Mulheres)
py.iplot ([rastreio], nome do arquivo = 'torta')

Vemos algo assim quando executamos o trecho de código acima:

O bom é que o plotly vem com muitos recursos de zoom dentro e fora e muitas outras ferramentas para interagir com o gráfico construído.

Visualização de dados de séries temporais com plotagem

Visualizar dados de séries temporais é uma das tarefas mais importantes que aparecem quando você é analista de dados ou engenheiro de dados.

Neste exemplo, usaremos um conjunto de dados separado no mesmo repositório do GitHub que os dados anteriores não envolveram dados estampados especificamente. Como aqui, planejaremos a variação do estoque de mercado da Apple ao longo do tempo:

Financial = Pd.read_csv ("https: // cru.GithubUserContent.com/plotly/conjuntos de dados/mestre/
Finance-Charts-Apple.CSV ")
dados = [vá.Dispersão (x = financeiro.Data, y = financeiro ['aapl.Fechar'])]
py.iplot (dados)

Vemos algo assim quando executamos o trecho de código acima:

Depois de passa o mouse sobre a linha de variação do gráfico, você pode específico detalhes de ponto:

Podemos usar botões de zoom dentro e fora para ver dados específicos a cada semana também.

Gráfico Ohlc

Um gráfico OHLC (aberto de baixo fechamento baixo) é usado para mostrar variação de uma entidade em um período de tempo. Isso é fácil de construir com o PyPlot:

Do DateTime Import DateTime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
Close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
datas = [DateTime (ano = 2013, mês = 10, dia = 10),
DateTime (ano = 2013, mês = 11, dia = 10),
DateTime (ano = 2013, mês = 12, dia = 10),
DateTime (ano = 2014, mês = 1, dia = 10),
DateTime (ano = 2014, mês = 2, dia = 10)]
rastreio = vá.OHLC (x = datas,
open = open_data,
High = High_Data,
Low = low_data,
close = close_data)
Dados = [rastreio]
py.iplot (dados)

Aqui, fornecemos alguns pontos de dados de amostra que podem ser inferidos da seguinte forma:

  • Os dados abertos descrevem a taxa de estoque quando o mercado foi aberto
  • Os dados altos descrevem a maior taxa de estoque alcançada ao longo de um determinado período de tempo
  • Os dados baixos descrevem a menor taxa de estoque alcançada ao longo de um determinado período de tempo
  • Os dados próximos descrevem a taxa de estoque de fechamento quando um determinado intervalo de tempo terminou

Agora, vamos executar o trecho de código que fornecemos acima. Vemos algo assim quando executamos o trecho de código acima:

Esta é uma excelente comparação de como estabelecer comparações de tempo de uma entidade com a sua própria e compará -la com suas realizações altas e baixas.

Conclusão

Nesta lição, analisamos outra biblioteca de visualização, plotly, que é uma excelente alternativa ao matplotlib em aplicativos de grau de produção que são expostos como aplicativos da web, o plotly é uma biblioteca muito dinâmica e rica em recursos para fins de produção, então isso é definitivamente uma habilidade que precisamos ter debaixo do cinto.

Encontre todo o código -fonte usado nesta lição no GitHub. Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @linuxhint.