Se você é um cientista de dados, às vezes você precisa lidar com o big data. Nesse big data, você está processando os dados, analisando os dados e depois gerando o relatório sobre isso. Para gerar o relatório sobre isso, você deve precisar de uma imagem clara dos dados, e aqui os gráficos são colocados no lugar.
Neste artigo, vamos explicar como usar o Plotagem de dispersão de matplotlib em python.
O Plotagem de dispersão é amplamente utilizado pela análise de dados para descobrir o relacionamento entre dois conjuntos de dados numéricos. Este artigo verá como usar o matplotlib.PyPlot para desenhar um gráfico de dispersão. Este artigo fornecerá detalhes completos que você precisa trabalhar no enredo de dispersão.
O matplotlib.Pypolt oferece maneiras diferentes de plotar o gráfico. Para plotar o gráfico como uma dispersão, usamos a função Scatter ().
A sintaxe para usar a função scatter () é:
matplotlib.Pyplot.dispersão (x_data, y_data, s, c, marcador, cmap, vmin, vmax, alfa, largura de linha, edgecolors)Todos os parâmetros acima, veremos nos próximos exemplos para entender melhor.
importar matplotlib.pyplot como pltOs dados que passamos na dispersão x_data pertencem ao eixo x, e y_data pertence ao eixo y.
Exemplos
Agora, vamos plotar o gráfico Scatter () usando parâmetros diferentes.
Exemplo 1: Usando os parâmetros padrão
O primeiro exemplo é baseado nas configurações padrão da função scatter (). Acabamos de passar dois conjuntos de dados para criar um relacionamento entre eles. Aqui, temos duas listas: uma pertence às alturas (h) e outra corresponde aos seus pesos (W).
# scatter_default_arguments.pySaída: scatter_default_arguments.py
Na saída acima, podemos ver os dados de pesos (w) no eixo y e alturas (h) no eixo x.
Exemplo 2: plotagem de dispersão () com seus valores de rótulos (eixo x e eixo y) e título
Em exemplo_1, apenas desenhamos o gráfico de dispersão diretamente com as configurações padrão. Agora, vamos personalizar a função de plotagem de dispersão um por um. Então, antes de tudo, adicionaremos rótulos à trama, como mostrado abaixo.
# RABELS_TITLE_SCATTER_PLOT.pyLinha 4 a 11: Nós importamos a biblioteca matplotlib.PyPlot e crie dois conjuntos de dados para o eixo x e y. E passamos os dois conjuntos de dados para a função de plotagem de dispersão.
Linha 14 a 19: Definimos os nomes do eixo x e do eixo y. Também definimos o título do gráfico da plotagem para espalhar.
Saída: RABELS_TITLE_SCATTER_PLOT.py
Na saída acima, podemos ver que o gráfico de dispersão possui nomes de etiquetas de eixo e o título da plotagem dispersão.
Exemplo 3: Use o parâmetro do marcador para alterar o estilo dos pontos de dados
Por padrão, o marcador é uma rodada sólida, como mostrado na saída acima. Então, se queremos mudar o estilo do marcador, podemos alterá -lo através deste parâmetro (marcador). Até também podemos definir o tamanho do marcador. Então, vamos ver sobre isso neste exemplo.
# marker_scatter_plot.pyO código acima é o mesmo que explicado nos exemplos anteriores, exceto na linha abaixo.
Linha 11: Passamos no parâmetro marcador e um novo sinal usado pelo gráfico de dispersão para desenhar pontos no gráfico. Também definimos o tamanho do marcador.
A saída abaixo mostra pontos de dados com o mesmo marcador que adicionamos na função de dispersão.
Saída: Marker_Scatter_Plot.py
Exemplo 4: Altere a cor do gráfico de dispersão
Também podemos mudar a cor dos pontos de dados de acordo com a nossa escolha. Por padrão, ele mostra com cor azul. Agora, mudaremos a cor dos pontos de dados da plotagem de dispersão, como mostrado abaixo. Podemos mudar a cor do gráfico de dispersão usando qualquer cor que você desejar. Podemos escolher qualquer tupla RGB ou RGBA (vermelho, verde, azul, alfa). A faixa de valor de cada elemento de tupla estará entre [0.0, 1.0], e também podemos representar o RGB ou RGBA no formato hexadecimal como #ff5733.
# scatter_plot_colour.pyEste código é semelhante aos exemplos anteriores, exceto a linha abaixo em que adicionamos a personalização de cores.
Linha 11: Passamos o parâmetro "C", que é para a cor. Atribuímos o nome da cor "vermelho" e obtivemos a saída na mesma cor.
Se você gosta de usar a tupla de cores ou hexadecimal, basta passar esse valor para a palavra -chave (c ou cor) como abaixo:
plt.dispersão (h, w, marcador = "v", s = 75, c = "#ff5733")Na função de dispersão acima, passamos pelo código de cores hexadecimais em vez do nome da cor.
Saída: scatter_plot_colour.py
Exemplo 5: Mudança de cor da plotagem de dispersão de acordo com a categoria
Também podemos alterar a cor dos pontos de dados de acordo com a categoria. Então, neste exemplo, vamos explicar que.
# colour_change_by_category.pyO código acima é semelhante aos exemplos anteriores. As linhas onde fizemos mudanças são explicadas abaixo:
Linha 12: Colocamos todos os pontos de dados na categoria de country_1 ou country_2. Essas são apenas suposições e não o verdadeiro valor para mostrar a demonstração.
Linha 17: Criamos um dicionário da cor que representa cada categoria.
Linha 18: Mapeamos a categoria de país com seu nome de cor. E a declaração de impressão abaixo mostrará resultados como este.
['azul', 'azul', 'laranja', 'laranja', 'laranja', 'laranja', 'azul', 'azul', 'laranja', 'azul']Linha 24: Finalmente, passamos pelo Colour_list (linha 18) para a função de dispersão.
Saída: colour_change_by_category.py
Exemplo 6: Altere a cor da borda do ponto de dados
Também podemos mudar a cor da borda do ponto de dados. Para isso, temos que usar a palavra -chave da cor da borda ("edgecolor"). Também podemos definir a largura da linha da borda. Nos exemplos anteriores, não usamos nenhum edgecolor, que é por padrão nenhum. Então, ele não mostra nenhuma cor padrão. Adicionaremos a cor da borda no ponto de dados para ver a diferença entre os exemplos anteriores, gráfico de plotagem com o gráfico de pontos de dados da borda colorido gráfico.
# edgecolour_scatterplot.pyLinha 11: Nesta linha, apenas adicionamos outro parâmetro que chamamos de edgecolor e largura de linha. Depois de adicionar os dois parâmetros, agora nosso gráfico de plotagem de dispersão se parece com algo, como mostrado abaixo. Você pode ver que a parte externa do ponto de dados agora está cercada com a cor preta com largura de linha = 1.
Saída: edgecolour_scatterplot.py
Conclusão
Neste artigo, vimos como usar a função de plotagem de dispersão. Explicamos todos os principais conceitos necessários para desenhar um enredo de dispersão. Pode haver outra maneira de desenhar o enredo de dispersão, como uma maneira mais atraente, dependendo de como usamos parâmetros diferentes. Mas a maioria dos parâmetros que abordamos era desenhar o enredo mais profissionalmente. Além disso, não use muitos parâmetros complexos, que podem confundir o significado real do gráfico.
O código deste artigo está disponível no link do Github abaixo:
https: // github.com/shekharpandey89/scatter-plot-matleplotlib.Pyplot