Pandas Rank

Pandas Rank
“Python oferece um grande número de bibliotecas. Quando se trata de "pandas", também queremos dizer a biblioteca Python. Isso nos beneficia em uma variedade de áreas, como ciências de dados e aprendizado de máquina, onde podemos usar a biblioteca "pandas". Além disso, ajuda na modificação e gerenciamento de dados. Podemos encontrar a "classificação" dos dados numéricos que inserimos no quadro de dados "pandas". O método "rank ()" está disponível na biblioteca "pandas" para encontrar a classificação dos dados numéricos. O método "rank ()" nos ajuda a calcular a classificação dos dados numéricos. Este método "rank ()" será explicado minuciosamente neste guia, juntamente com a forma como ele funciona. Também utilizaremos os métodos "rank ()" em nossos códigos aqui.”

Sintaxe

Quadro de dados.rank (eixo = 0, método = "média", numeric_only = Nenhum, na_option = "Keep", ascendente = true/false, pct = false)

Exemplo # 01

Spyder é a ferramenta que estamos usando para criar esses códigos "pandas" que estão presentes neste guia. Importar as bibliotecas é o primeiro passo que precisamos dar ao escrever o código "pandas". A palavra -chave "importação" é usada para importar a biblioteca. A biblioteca "pandas" é a biblioteca que precisa ser importada. Depois de digitar a "importação", digitamos "pandas como PD" aqui. Depois disso, criamos o quadro de dados. O "PD" mostra que o "DataFrame ()" é o método de "pandas", que chegamos aqui digitando "PD" com este método "DataFrame ()".

A primeira coluna é a coluna "Nome" e, nesta coluna, inserimos "Los Angeles, Nova York, França, Chicago, Denver, Delhi, Paris, Istambul e Boston". Em seguida, adicionamos a coluna "Parks", que contém o número de parques como "45, 58, 82, 90, 64, 75, 44, 81 e 59". Temos mais duas colunas aqui que são "hospitais" e "escolas". Na coluna “Hospitais”, adicionamos “125, 115, 92, 100, 84, 105, 98, 99 e 159” e na coluna “Escolas”, adicionamos “95, 158, 182, 99, 74, 115, 104, 81 e 99 ”. Agora, utilizamos o método "Print ()" para mostrar este DataFrame.

Podemos ver prontamente a saída de nossos códigos quando clicarmos no ícone "Executar" na ferramenta "Spyder". Aqui está o resultado deste código, e pode -se ver que apenas o quadro de dados que criamos é mostrado neste resultado. Agora, usaremos o método "rank ()" para obter a classificação dos dados numéricos.

Primeiro, criamos a nova coluna aqui, colocando o nome do DataFrame e inserimos o novo nome da coluna, que é "Hospital_rank", aqui. Em seguida, aplicamos o método "rank ()" à coluna "hospitais" e armazenamos o resultado na nova coluna que criamos aqui. Depois disso, colocamos o nome do DataFrame no "Print ()", para que a nova coluna também seja adicionada e renderizada na tela.

Ele fornece a classificação aos dados "hospitais" e o exibe em outra coluna que criamos acima. Exibe os valores de classificação. Dá o valor de classificação "1" aos menores valores e depois assim por diante.

Também aplicamos esse método "rank ()" à coluna "Escolas" e armazenamos os valores de classificação na coluna "School_rank" aqui. Não passamos nenhum parâmetro para esta função "rank ()", para que ela dê a classificação aos valores da coluna "escolas" em ordem crescente.

A coluna "School_rank" é exibida aqui e, nesta coluna, os valores de classificação são mencionados. Estes são os valores de classificação da coluna "Escolas" porque aplicamos esse método à coluna "Escolas".

Exemplo # 02

Aqui, "School_DF" é criado. Usamos “PD.Dataframe () "para gerar o quadro de dados em" pandas "e, como resultado, esse quadro de dados foi criado. Além disso, adicionamos algumas colunas, e essas colunas também têm dados. A coluna que adicionamos primeiro é a coluna "nome". Então “Resse, Collins, Layla, Cora, Bromley, Ellis, Kelly e Bromley” estão todos presentes nesta coluna. A coluna a seguir, obt_marks ”é onde adicionamos“ 150, 334, 39, 376, 585, 190, 453 e 669 ”". Aqui, a terceira coluna é rotulada como “obt_per” e entramos nas porcentagens “30%, 55%, 10%, 58%, 75%, 33%, 62%e 81%”.

Então temos a coluna "qualificada". Inclui os seguintes dados “não promovidos, promovidos, não promovidos, promovidos, promovidos, não promovidos, promovidos, promovidos”. Agora, imprimimos esse quadro de dados e, em seguida, adicionamos uma nova coluna com o nome "Student_rank" nesse quadro de dados e aplicamos a função "rank ()" na coluna "obt_marks". Também definimos o valor do parâmetro "ascendente" para "false".

Quando esse método "rank ()" se aplica aos dados da coluna "obt_marks", ele salva os valores de "classificação" na coluna "Student_rank", que é adicionada aqui a este DataFrame. Em seguida, imprimimos o DataFrame novamente, que também contém a coluna "School_rank".

A coluna "Student_rank" também é exibida no quadro de dados atualizado e mostra a classificação dos valores da coluna "obt_marks" em ordem decrescente porque definimos "false" como o valor do parâmetro "ascendente".

Exemplo # 03

Neste código, usamos o método "rank ()" para obter os valores de classificação da coluna "obt marcas". Além disso, mudamos o valor do parâmetro "ascendente" para "verdadeiro". Quando a coluna "Student_rank" deste Dataframe recebe dados da coluna "obt Marks" através do método "rank ()", os valores de "classificação" são salvos posteriormente aplicando o método "rank ()". O DataFrame é então impresso mais uma vez aqui.

Definimos "true" como o valor da opção "ascendente" no método "rank ()", portanto, a coluna "Student_rank", que está presente no quadro de dados modificado, exibe a classificação dos valores da coluna "obt_marks" em ordem ascendente.

Exemplo # 04

Agora, estamos aplicando a função "rank ()" e também classificando os dados depois de obter o valor da classificação. Aqui, encontramos os valores de classificação dos "obt_marks" dos alunos e não adicionamos nenhum parâmetro a esse método "rank ()". Então, depois de obter os valores de classificação em ordem crescente, armazenamos os valores que obtemos na coluna "Student_rank" após aplicar o método "rank ()". Nós classificamos esses valores com a ajuda do “classificar.Método valores () ”e coloque o nome da coluna cujos dados queremos classificar nele, e este nome da coluna é“ Student_rank ”aqui. Também colocamos "verdadeiro" como o valor do parâmetro "inplace". Em seguida, impressionamos novamente o "School_DF", que retornará a coluna "Student_rank".

Primeiro, ele exibe os valores de classificação na frente de cada linha na nova coluna, que é "Student_rank" aqui, e então classifica esses valores, que são renderizados na coluna "Student_rank" e também mostra os valores classificados e classificados no abaixo “School_df.”

Exemplo # 05

Agora, estamos aplicando o método "rank ()" ao arquivo CSV. Para fazer isso, temos que ler o arquivo CSV com a ajuda do “PD.leia () ”método. Então, colocamos esse método aqui, que lê os dados do arquivo CSV e o salva na variável "my_data" na forma de dataframe. Em seguida, inserimos uma coluna "Rank Unit" e os dados que obtemos depois de aplicar o método "rank ()" à coluna "Unidades" do arquivo CSV é salva nesta coluna. Depois disso, utilizamos o "print ()" para exibir o quadro de dados junto com a nova coluna, que adicionamos aqui.

Esses são os dados do arquivo CSV e você também pode observar que a coluna "Rank Unit" é exibida aqui, que contém os valores de classificação, e obtemos esses valores com a ajuda do método "rank ()".

Conclusão

Este guia tem como objetivo descrever a função "Pandas Rank" em detalhes. Descrevemos que utilizamos esse método para encontrar a classificação dos dados numéricos. Também usamos o método "rank ()" em nossos códigos aqui e mostramos os valores classificados em ordem crescente e descendente. Também classificamos os valores de "classificação" aqui em nossos códigos e explicamos esses códigos e esse método "rank ()" em detalhes. Também aplicamos esse método "rank ()" aos dados do arquivo CSV e explicamos como fazer isso. Este guia descreveu tudo sobre o método "rank ()" de "pandas" com explicação adequada.