Pandas Qcut

Carl Hintz DDS

“O“ Python ”contém muitas bibliotecas e, quando queremos analisar ou manipular dados, utilizamos essas bibliotecas“ Python ”, e os“ pandas ”também são a biblioteca. A biblioteca "pandas" é usada no campo de ciências de dados e também é usado em atividades de aprendizado de máquina. O quadro de dados "pandas" nos ajuda a salvar os dados. Em "Pandas", quando queremos o binning de dados, então utilizamos o método "qcut ()". O método "Qcut ()" é utilizado para converter recursos contínuos em categóricos. Podemos adicionar diferentes tipos de parâmetros neste método "qcut ()" para obter diferentes tipos de resultados. Este tutorial é tudo sobre o método "Qcut ()", e explicaremos com detalhes completos o método "Qcut ()" aqui. Explicaremos a você como fazemos o binning de dados com a ajuda da função "qcut ()" em "pandas" neste tutorial.”

Exemplo # 01

Aplicaremos o método "Qcut ()" nesses códigos, e faremos esses códigos no aplicativo "Spyder". Quando precisamos trabalhar com os "pandas", só podemos acessar suas funções quando importamos a biblioteca "pandas" em nossos códigos. Primeiro, colocamos "importação" e depois escrevemos "pandas como PD". Agora, temos que aplicar o método "qcut ()", então, para isso, estamos criando o DataFrame aqui. We construct “Random_df” containing “R_ID, R_name, and R_age” as its columns, and also in “R_ID”, we place “R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55, R_61, r_73 e r_81 ”. Então acrescentamos "Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob e Harper" na coluna "R_NAME". Depois disso, inserimos “21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 9, 37 e 40” na coluna “R_AGE”. Agora, usamos o "print ()", que contém "random_df", e ajudará a renderizar o quadro de dados "random_df". Acabamos de criar o DataFrame e não aplicar o método "qcut ()" ainda.

O ícone "Run" nos ajuda a executar os códigos. Quando pressionamos esse ícone "Run", o resultado deste código é exibido no terminal do aplicativo "Spyder". O "Random_df" DataFarme é mostrado como resultado do código que escrevemos neste exemplo. Agora, aplicaremos o método "qcut ()" e também mostraremos seu resultado.

Estamos bining os dados aqui. Estamos binando a coluna "r_age" e colocando o "PD.método qcut () ”, que é o método de“ pandas ”que ajuda na binning de dados. Neste método, inserimos o nome do DataFrame e também o nome da coluna no qual queremos aplicar este método "Qcut ()". Também definimos o valor de "Q" como "5" e é usado para cortar os dados da coluna "R_AGE" em cinco quantis iguais. Adicionamos o método "Qcut ()" no "Print ()", para que também exiba os dados de binning no terminal.

Aqui, os dados após o binning são exibidos e corta o "r_age" em cinco quantis. Ele também exibe as categorias em que os dados da coluna “r_age” são binned. A série categórica representa as caixas "r_age".

Também podemos ajustar o rótulo para essas caixas. Adicionamos esses rótulos de bin para facilitar a interpretação. Adicionamos uma coluna "r_age_qcut" à "random_df" na qual adicionamos os rótulos dessas caixas. Nós novamente utilizamos o “PD.Qcut () ”Método para rotulá -los. Adicionamos os rótulos que são “pouco, não tão pouco, medíocre, alto e mais alto” nele. Então colocamos novamente "Random_df" em "Print ()".

Todas as caixas são rotuladas e apresentadas neste resultado. A coluna "R_AGE_QCUT" é exibida neste quadro de dados em que os caixotes rotulados são mostrados.

Exemplo # 02

Para criar o DataFrame, primeiro adicionamos “notas”, que são “3, 6, 8, 7, 2, 5, 1, 9, 4, 7 e 8”. Então, adicionamos nomes de estudantes em "estudantes", que são "Peter, Bromley, James, David, Aliados, John, James, Samuel, William, Howard e Alexander". Em seguida, geramos o "GRITES_DF", onde adicionamos o "PD.DataFrame () ”Método e, neste método, colocamos“ std_name ”, que aparecerá como o nome da coluna e atribuímos valores de“ alunos ”a isso. Em seguida, definimos os "alunos_grades" como o nome da coluna do DataFrame e também atribuímos "notas" aqui, que criamos acima. Depois disso, temos o "Print ()" no qual adicionamos "graus_df" para imprimir.

O quadro de dados contendo duas colunas é exibido no resultado deste código. Agora, aplicaremos o método "QCUT ()" à coluna "Students_Grades" para bingar os dados dos valores desta coluna.

Adicionamos uma nova coluna "Grau" aqui na qual aplicamos "PD.qcut () ”para a coluna“ estudantes_grades ”e também usamos“ 4 ”para o valor do“ q ”, para que corte os dados em quatro quantis iguais. Depois disso, especificamos esses quantis aqui colocando valores em "Q", que são "0, .4, .8 e 1 ”. Então, também exibimos isso. Agora, estamos rotulando esses dados em binned, e os rótulos que adicionamos aqui são "D, C, A e B" e também são armazenados na coluna "Grade".

Aqui, os dados após o binning são exibidos aqui na coluna "Grade" e corta os dados da coluna "Students_Grades" em quatro quantis iguais.

O quadro de dados que obtemos depois de aplicar o método "qcut ()" e especificar os quantis é exibido neste resultado.

Agora, depois de adicionar os rótulos a esses caixotes.

Exemplo # 03

Também podemos aplicar o método "QCUT ()" aos dados do arquivo CSV. Para isso, primeiro lemos os dados do arquivo CSV com a ajuda do método "read_csv ()". Estamos lendo os dados do “Office2.Arquivo CSV ”e, em seguida, os dados deste arquivo são colocados no“ Office_DF ”. Este método converterá os dados do arquivo "Office2" no DataFrame e o salvará em "Office_DF". Em seguida, também mostramos esses dados colocando o "Office_df" no "print ()". Depois disso, adicionamos uma nova coluna chamada “Units_qcut”, à qual aplicamos a função “PD.qcut () ”para a coluna“ Unidades ”.

Além disso, definimos o valor da variável "Q" para "5", que dividirá os dados em cinco quantis iguais. Os dados, depois de cortar em 5 quantis iguais, são armazenados na coluna "Units_qcut", e esta coluna também é adicionada ao "Office_DF" e ao "Office_DF" renderizado aqui novamente usando "print ()". Agora estamos rotulando esses dados em binned, adicionando os rótulos no método "Qcut ()", que são "Unidade 1, Unidade 2, Unidade 3, Unidade 4 e Unidade 5" e armazenando -os na coluna "Rótulos" também. Também renderizamos esse quadro de dados no qual a coluna "rótulos" é adicionada.

Os dados que obtemos depois de ler o “Office2.O arquivo csv ”é renderizado aqui na forma de dataframe. Em seguida, a coluna “Units_qcut” é adicionada, na qual os valores binned da coluna “Unidades” são exibidos. Depois disso, também é adicionada a coluna "rótulos", que atribui os rótulos a esses valores binned. Tudo isso é feito usando o método "qcut ()" em "pandas".

Conclusão

Explicamos o método "Qcut ()" em detalhes neste tutorial, que ajuda a bingar os dados em "pandas". Discutimos que os dados são compartilhados de acordo com o valor “Q” Quantil que adicionamos no método “QCUT ()”, e também ajustamos os rótulos a esses dados em compartilhamento. Exploramos o método "QCUT ()" e aplicamos esse método às colunas do quadro de dados, e também aplicamos esse método "QCUT ()" aos dados do arquivo CSV após ler os arquivos CSV. Apresentamos o resultado de todos os códigos deste tutorial para explicar e mostrar claramente o resultado do método "Qcut ()".

Pitão

Pandas Read_CSV multiprocessamento

Para melhorar a velocidade de carregamento de dados, incluindo seus benefícios e limitações, o “PD.A...

Carl Hintz DDS

Docker

Qual é o objetivo de um docker-compor.Arquivo YML no Docker?

O principal objetivo de um “Docker-Compose.O arquivo YML ”é para simplificar o processo de implantaç...

Shaun Bogan

Pitão

Histograma Matplotlib 2D

Em Python, o “PLT.A função hist2d () ”do módulo“ PyPlot ”na biblioteca“ matplotlib ”é usada para plo...

Carl Hintz DDS