Como plotar dados em pandas python

Como plotar dados em pandas python
A visualização de dados desempenha um papel importante na análise de dados. Pandas é uma forte biblioteca de análise de dados em Python para ciência de dados. Fornece várias opções para visualização de dados com .Método plot (). Mesmo se você é iniciante, pode plotar facilmente seus dados usando a biblioteca de pandas. Você precisa importar os pandas e matplotlib.Pacote PyPlot para visualização de dados.

Neste artigo, exploraremos vários métodos de plotagem de dados usando o Pandas Python. Executamos todos os exemplos no editor de código -fonte do Pycharm usando o matplotlib.pacote pyplot.

Plotagem em pandas python

Em pandas, o .plot () tem vários parâmetros que você pode usar com base em suas necessidades. Principalmente, usando o parâmetro 'gentil', você pode definir que tipo de enredo você criará.

A sintaxe para plotar dados usando pandas python

A sintaxe a seguir é usada para plotar um quadro de dados no Pandas Python:

# importar pandas e matplotlib.Pacotes PyPlot
importar pandas como PD
importar matplotlib.pyplot como plt
# Prepare dados para criar dados de dados
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4',…],
'Column2': ['field1', 'field2', 'field3', 'field4',…]

var_df = pd.DataFrame (Data_frame, Columns = ['Columm1', 'Column2]))
Imprimir (variável)
# ploting bar de barra
var_df.trama.barra (x = 'column1', y = 'column2')
plt.mostrar()

Você também pode definir o tipo de trama usando o parâmetro do tipo da seguinte forma:

var_df.plot (x = 'column1', y = 'column2', tipo = 'bar')

Os objetos do Pandas DataFrames têm os seguintes métodos de plotagem para plotagem:

  • Plotagem de dispersão: trama.dispersão ()
  • Plotagem de barra: trama.bar (), enredo.Barh () onde H representa o enredo de barras horizontais.
  • Plotagem de linha: trama.linha()
  • Plotting de torta: trama.torta()

Se um usuário usa apenas o método plot () sem usar nenhum parâmetro, ele cria o gráfico de linha padrão.

Agora elaboraremos alguns tipos importantes de trama em detalhes com a ajuda de alguns exemplos.

Plotagem de dispersão em pandas

Nesse tipo de plotagem, representamos o relacionamento entre duas variáveis. Vamos dar um exemplo.

Exemplo

Por exemplo, temos dados de correlação entre duas variáveis ​​GDP_Growth e Oil_price. Para plotar a relação entre duas variáveis, executamos a seguinte parte do código em nosso editor de código -fonte:

importar matplotlib.pyplot como plt
importar pandas como PD
gdp_cal = pd.Quadro de dados(
'Gdp_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, colunas = ['Oil_price', 'gdp_growth']))
Impressão (DF)
df.plot (x = 'Oil_price', y = 'gdp_growth', Kind = 'Scatter', color = 'Red')
plt.mostrar()

Gráficos de linha plotagem em pandas

O gráfico de gráficos de linha é um tipo básico de plotagem no qual dadas as informações são exibidas em uma série de pontos de dados que são mais conectados por segmentos de linhas retas. Usando os gráficos de linha, você também pode mostrar as tendências das informações horas extras.

Exemplo

No exemplo abaixo mencionado, tomamos os dados sobre a taxa de inflação do ano passado. Primeiro, prepare os dados e depois crie o DataFrame. O seguinte código -fonte plota o gráfico de linha dos dados disponíveis:

importar pandas como PD
importar matplotlib.pyplot como plt
infl_cal = 'ano': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.Dataframe (infl_cal, colunas = ['ano', 'infl_rate']))
quadro de dados.plot (x = 'ano', y = 'infl_rate', tipo = 'linha')
plt.mostrar()

No exemplo acima, você precisa definir o tipo = 'linha' para a plotagem do gráfico de linha.

Método 2# usando o plot.Método da linha ()

O exemplo acima, você também pode implementar usando o seguinte método:

importar pandas como PD
importar matplotlib.pyplot como plt
inf_cal = 'ano': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, colunas = ['inflation_rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2011])
quadro de dados.trama.linha()
plt.Título ('Resumo da taxa de inflação dos últimos 11 anos')
plt.ylabel ('inflation_rate')
plt.xlabel ('ano')
plt.mostrar()

O gráfico de linha a seguir será exibido após a execução do código acima:

Plotagem de gráfico de barras em pandas

A plotagem do gráfico de barras é usada para representar os dados categóricos. Nesse tipo de enredo, as barras retangulares com alturas diferentes são plotadas com base nas informações fornecidas. O gráfico de barras pode ser plotado em duas direções horizontais ou verticais diferentes.

Exemplo

Tomamos a taxa de alfabetização de vários países no exemplo a seguir. DataFrames são criados nos quais 'country_names' e 'alfabetacia_rate' são as duas colunas de um quadro de dados. Usando pandas, você pode plotar as informações na forma do gráfico de barras da seguinte forma:

importar pandas como PD
importar matplotlib.pyplot como plt
lit_cal =
'Country_names': ['Paquistão', 'EUA', 'China', 'Índia', 'Reino Unido', 'Áustria', 'Egito', 'Ucrânia', 'Saudia', 'Austrália',
'Malásia'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.Dataframe (lit_cal, colunas = ['country_names', 'litr_rate']))
impressão (data_frame)
quadro de dados.trama.bar (x = 'country_names', y = 'litr_rate')
plt.mostrar()

Você também pode implementar o exemplo acima usando o seguinte método. Defina o tipo "bar" para a plotagem do gráfico de barras nesta linha:

quadro de dados.plot (x = 'country_names', y = 'litr_rate', tipo = 'bar')
plt.mostrar()

Plotagem de gráfico de barras horizontais

Você também pode plotar os dados sobre barras horizontais executando o seguinte código:

importar matplotlib.pyplot como plt
importar pandas como PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.Dataframe (data_chart, colunas = ['litr_rate'], index = ['paquistão', 'EUA', 'China', 'Índia', 'Reino Unido', 'Áustria', 'Egito', 'Ucrânia', 'Saudia' , 'Austrália',
'Malásia'])
df.trama.Barh ()
plt.Título ('Taxa de alfabetização em vários países')
plt.ylabel ('country_names')
plt.xlabel ('litr_rate')
plt.mostrar()

Em df.trama.Barh (), o Barh é usado para a plotagem horizontal. Depois de executar o código acima, o gráfico de barras a seguir exibe na janela:

Plotagem de gráfico de pizza em pandas

Um gráfico de pizza representa os dados em forma gráfica circular na qual os dados são exibidos em fatias com base na quantidade fornecida.

Exemplo

No exemplo a seguir, exibimos as informações sobre 'Earth_material' em diferentes fatias no gráfico de pizza. Primeiro, crie o DataFrame, então, usando os pandas, exiba todos os detalhes no gráfico.

importar pandas como PD
importar matplotlib.pyplot como plt
material_per = 'Earth_part': [71,18,7,4]
dataframe = pd.DataFrame (material_per, colunas = ['Earth_Part'], index = ['água', 'mineral', 'areia', 'metais']))
quadro de dados.trama.torta (y = 'Earth_part', figSize = (7, 7), Autopct = '%1.1f %% ', startangle = 90)
plt.mostrar()

O código -fonte acima plota o gráfico de torta dos dados disponíveis:

Conclusão

Neste artigo, você viu como plotar dados de dados em pandas python. Diferentes tipos de plotagem são realizados no artigo acima. Para plotar mais tipos, como caixa, hexbina, hist, KDE, densidade, área, etc., Você pode usar o mesmo código -fonte apenas alterando o tipo de plotagem.