Plotagem de dispersão de matplotlib em python

Plotagem de dispersão de matplotlib em python
O humano pode entender mais o visual em comparação com o formulário de texto. É por isso que as pessoas sempre sugerem desenhar o gráfico de big data para entendê -lo de uma maneira muito fácil. Existem diferentes tipos de gráficos disponíveis no mercado, como gráficos de barras, histogramas, gráficos de pizza, etc. Esses gráficos diferentes são usados ​​de acordo com o conjunto de dados e os requisitos. Por exemplo, se você tiver um conjunto de dados do desempenho da empresa nos últimos 10 anos, o gráfico de gráficos de barras fornecerá mais informações sobre o crescimento da empresa. Então, assim, a escolha do gráfico depende do conjunto de dados e dos requisitos.

Se você é um cientista de dados, às vezes você precisa lidar com o big data. Nesse big data, você está processando os dados, analisando os dados e depois gerando o relatório sobre isso. Para gerar o relatório sobre isso, você deve precisar de uma imagem clara dos dados, e aqui os gráficos são colocados no lugar.

Neste artigo, vamos explicar como usar o Plotagem de dispersão de matplotlib em python.

O Plotagem de dispersão é amplamente utilizado pela análise de dados para descobrir o relacionamento entre dois conjuntos de dados numéricos. Este artigo verá como usar o matplotlib.PyPlot para desenhar um gráfico de dispersão. Este artigo fornecerá detalhes completos que você precisa trabalhar no enredo de dispersão.

O matplotlib.Pypolt oferece maneiras diferentes de plotar o gráfico. Para plotar o gráfico como uma dispersão, usamos a função Scatter ().

A sintaxe para usar a função scatter () é:

matplotlib.Pyplot.dispersão (x_data, y_data, s, c, marcador, cmap, vmin, vmax, alfa, largura de linha, edgecolors)

Todos os parâmetros acima, veremos nos próximos exemplos para entender melhor.

importar matplotlib.pyplot como plt
plt.dispersão (x_data, y_data)

Os dados que passamos na dispersão x_data pertencem ao eixo x, e y_data pertence ao eixo y.

Exemplos

Agora, vamos plotar o gráfico Scatter () usando parâmetros diferentes.

Exemplo 1: Usando os parâmetros padrão

O primeiro exemplo é baseado nas configurações padrão da função scatter (). Acabamos de passar dois conjuntos de dados para criar um relacionamento entre eles. Aqui, temos duas listas: uma pertence às alturas (h) e outra corresponde aos seus pesos (W).

# scatter_default_arguments.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h (altura) e w (peso) dados
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# traçar um gráfico de dispersão
plt.dispersão (h, w)
plt.mostrar()

Saída: scatter_default_arguments.py

Na saída acima, podemos ver os dados de pesos (w) no eixo y e alturas (h) no eixo x.

Exemplo 2: plotagem de dispersão () com seus valores de rótulos (eixo x e eixo y) e título

Em exemplo_1, apenas desenhamos o gráfico de dispersão diretamente com as configurações padrão. Agora, vamos personalizar a função de plotagem de dispersão um por um. Então, antes de tudo, adicionaremos rótulos à trama, como mostrado abaixo.

# RABELS_TITLE_SCATTER_PLOT.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h e w dados
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# traçar um gráfico de dispersão
plt.dispersão (h, w)
# Defina os nomes de labas do eixo
plt.xlabel ("Peso (w) em kg")
plt.ylabel ("altura (h) em cm")
# Defina o título do nome do gráfico
plt.Título ("Plotagem de dispersão para altura e peso")
plt.mostrar()

Linha 4 a 11: Nós importamos a biblioteca matplotlib.PyPlot e crie dois conjuntos de dados para o eixo x e y. E passamos os dois conjuntos de dados para a função de plotagem de dispersão.

Linha 14 a 19: Definimos os nomes do eixo x e do eixo y. Também definimos o título do gráfico da plotagem para espalhar.

Saída: RABELS_TITLE_SCATTER_PLOT.py

Na saída acima, podemos ver que o gráfico de dispersão possui nomes de etiquetas de eixo e o título da plotagem dispersão.

Exemplo 3: Use o parâmetro do marcador para alterar o estilo dos pontos de dados

Por padrão, o marcador é uma rodada sólida, como mostrado na saída acima. Então, se queremos mudar o estilo do marcador, podemos alterá -lo através deste parâmetro (marcador). Até também podemos definir o tamanho do marcador. Então, vamos ver sobre isso neste exemplo.

# marker_scatter_plot.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h e w dados
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# traçar um gráfico de dispersão
plt.dispersão (H, W, Marker = "V", S = 75)
# Defina os nomes de labas do eixo
plt.xlabel ("Peso (w) em kg")
plt.ylabel ("altura (h) em cm")
# Defina o título do nome do gráfico
plt.Título ("Plotagem de dispersão onde a mudança de marcador")
plt.mostrar()

O código acima é o mesmo que explicado nos exemplos anteriores, exceto na linha abaixo.

Linha 11: Passamos no parâmetro marcador e um novo sinal usado pelo gráfico de dispersão para desenhar pontos no gráfico. Também definimos o tamanho do marcador.

A saída abaixo mostra pontos de dados com o mesmo marcador que adicionamos na função de dispersão.

Saída: Marker_Scatter_Plot.py

Exemplo 4: Altere a cor do gráfico de dispersão

Também podemos mudar a cor dos pontos de dados de acordo com a nossa escolha. Por padrão, ele mostra com cor azul. Agora, mudaremos a cor dos pontos de dados da plotagem de dispersão, como mostrado abaixo. Podemos mudar a cor do gráfico de dispersão usando qualquer cor que você desejar. Podemos escolher qualquer tupla RGB ou RGBA (vermelho, verde, azul, alfa). A faixa de valor de cada elemento de tupla estará entre [0.0, 1.0], e também podemos representar o RGB ou RGBA no formato hexadecimal como #ff5733.

# scatter_plot_colour.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h e w dados
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# traçar um gráfico de dispersão
plt.dispersão (H, W, Marker = "V", S = 75, C = "Red")
# Defina os nomes de labas do eixo
plt.xlabel ("Peso (w) em kg")
plt.ylabel ("altura (h) em cm")
# Defina o título do nome do gráfico
plt.Título ("Mudança de cor da plotagem de dispersão")
plt.mostrar()

Este código é semelhante aos exemplos anteriores, exceto a linha abaixo em que adicionamos a personalização de cores.

Linha 11: Passamos o parâmetro "C", que é para a cor. Atribuímos o nome da cor "vermelho" e obtivemos a saída na mesma cor.

Se você gosta de usar a tupla de cores ou hexadecimal, basta passar esse valor para a palavra -chave (c ou cor) como abaixo:

plt.dispersão (h, w, marcador = "v", s = 75, c = "#ff5733")

Na função de dispersão acima, passamos pelo código de cores hexadecimais em vez do nome da cor.

Saída: scatter_plot_colour.py

Exemplo 5: Mudança de cor da plotagem de dispersão de acordo com a categoria

Também podemos alterar a cor dos pontos de dados de acordo com a categoria. Então, neste exemplo, vamos explicar que.

# colour_change_by_category.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h e w os dados se reúnem de dois países
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Defina o nome do país 1 ou 2, que mostra a altura ou peso
# Os dados pertencem a qual país
country_category = ['country_2', 'country_2', 'country_1',
'country_1', 'country_1', 'country_1',
'country_2', 'country_2', 'country_1', 'country_2']
# mapeamento de cores
cores = 'country_1': 'laranja', 'country_2': 'azul'
colour_list = [cores [i] para i em country_category]
# Imprima a lista de cores
Imprimir (colour_list)
# traçar um gráfico de dispersão
plt.dispersão (h, w, marcador = "v", s = 75, c = colour_list)
# Defina os nomes de labas do eixo
plt.xlabel ("Peso (w) em kg")
plt.ylabel ("altura (h) em cm")
# Defina o título do nome do gráfico
plt.Título ("Mudança de cor da plotagem de dispersão para a categoria Wise")
plt.mostrar()

O código acima é semelhante aos exemplos anteriores. As linhas onde fizemos mudanças são explicadas abaixo:

Linha 12: Colocamos todos os pontos de dados na categoria de country_1 ou country_2. Essas são apenas suposições e não o verdadeiro valor para mostrar a demonstração.

Linha 17: Criamos um dicionário da cor que representa cada categoria.

Linha 18: Mapeamos a categoria de país com seu nome de cor. E a declaração de impressão abaixo mostrará resultados como este.

['azul', 'azul', 'laranja', 'laranja', 'laranja', 'laranja', 'azul', 'azul', 'laranja', 'azul']

Linha 24: Finalmente, passamos pelo Colour_list (linha 18) para a função de dispersão.

Saída: colour_change_by_category.py

Exemplo 6: Altere a cor da borda do ponto de dados

Também podemos mudar a cor da borda do ponto de dados. Para isso, temos que usar a palavra -chave da cor da borda ("edgecolor"). Também podemos definir a largura da linha da borda. Nos exemplos anteriores, não usamos nenhum edgecolor, que é por padrão nenhum. Então, ele não mostra nenhuma cor padrão. Adicionaremos a cor da borda no ponto de dados para ver a diferença entre os exemplos anteriores, gráfico de plotagem com o gráfico de pontos de dados da borda colorido gráfico.

# edgecolour_scatterplot.py
# importe a biblioteca necessária
importar matplotlib.pyplot como plt
# h e w dados
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# traçar um gráfico de dispersão
plt.dispersão (h, w, marker = "v", s = 75, c = "vermelho", edgecolor = 'preto', largura de linha = 1)
# Defina os nomes de labas do eixo
plt.xlabel ("Peso (w) em kg")
plt.ylabel ("altura (h) em cm")
# Defina o título do nome do gráfico
plt.Título ("Mudança de cor da plotagem de dispersão")
plt.mostrar()

Linha 11: Nesta linha, apenas adicionamos outro parâmetro que chamamos de edgecolor e largura de linha. Depois de adicionar os dois parâmetros, agora nosso gráfico de plotagem de dispersão se parece com algo, como mostrado abaixo. Você pode ver que a parte externa do ponto de dados agora está cercada com a cor preta com largura de linha = 1.

Saída: edgecolour_scatterplot.py

Conclusão

Neste artigo, vimos como usar a função de plotagem de dispersão. Explicamos todos os principais conceitos necessários para desenhar um enredo de dispersão. Pode haver outra maneira de desenhar o enredo de dispersão, como uma maneira mais atraente, dependendo de como usamos parâmetros diferentes. Mas a maioria dos parâmetros que abordamos era desenhar o enredo mais profissionalmente. Além disso, não use muitos parâmetros complexos, que podem confundir o significado real do gráfico.

O código deste artigo está disponível no link do Github abaixo:

https: // github.com/shekharpandey89/scatter-plot-matleplotlib.Pyplot