Índice de classificação de pandas

Índice de classificação de pandas
"Pandas" é um dos pacotes de linguagem python que analisa melhor dados. Trabalhar com uma enorme escala de dados é agitado e difícil de gerenciar. Como existem muitos fatores pelos quais os dados passam, um deles é "classificar". Um dos principais trabalhos a serem concluídos é a classificação de dados. Os pandas têm uma função para classificar dados no quadro de dados usando seus valores. A função é Pandas "Sort_value". Isso ajuda a classificar milhões de quantidades de dados em alguns minutos. No valor de classificação dos pandas, os dados são classificados pela seleção das colunas em ordem ascendente ou descendente. Estaremos cobrindo tudo como os valores de classificação dos pandas podem ser executados. Usaremos a ferramenta "Spyder" para a implementação do código. Tem um ambiente de linguagem python.

Sintaxe

df.Sort_values

O "df" na sintaxe é uma abreviação do "DataFrame". A sintaxe acima classifica a coluna pelo valor no quadro de dados. Em vez de usar todo o DataFrame, ele opera com um rótulo específico do DataFrame. A seguir, são apresentados os métodos de valor de classificação dos pandas que implementaremos com exemplos:

  • Pandas Order Values ​​em ordem crescente pelas colunas especificadas.
  • Pandas classifica valores por várias colunas (caso I).
  • Pandas classifica valores por várias colunas (caso II).
  • Pandas classy valoriza nan no início.

Criação de um quadro de dados para a implementação de valores de classificação de pandas em exemplos

Depois de abrir o software "Spyder", importe a biblioteca de pandas como "PD". Agora, comece a criar um DataFrame. O DataFrame é de dados de "carros". Temos os nomes da marca: "BM", "nós", "HC" e "ZX". Também temos os preços desses carros, como "44000", "32000", "52000" e "23000" com seu ano de fabricação "2018", "2019", "2019" e "2020".

A saída mostra o quadro de dados criado com as colunas de marcas de carros, seu preço e seu ano de fabricação.

Exemplo 01: Valores da ordem dos pandas em ordem crescente pelas colunas especificadas

Neste exemplo, usaremos a função de valor de classificação dos pandas para ordenar os valores de dados. O DataFrame aqui consiste nos modelos de carros como "WW", "XX", "NN" e "TT" com seus preços "45000", "22000", "33000" e "55000" e seus anos de fabricação são "2018 "," 2019 "," 2020 "e" 2021 ". Os valores de classificação dos pandas funcionam com base em sua seleção de coluna especificada. Aqui, estaremos fazendo a classificação com base na coluna "marca", como você pode ver no código. Não escrevemos a ascensão no código porque você não precisa mencionar que, como por padrão, a função de classificação dos pandas o executa em ordem crescente.

O DataFrame exibe a classificação da coluna 'marca ”em ordem crescente.

Exemplo 02: Valores de classificação de pandas por coluna selecionada em ordem decrescente

No último exemplo, vimos como classificar valores em ordem crescente. Não queremos os dados classificados para ascender sempre. Às vezes, por demanda, queremos isso em ordem decrescente. Agora, faremos como classificar valores em ordem decrescente. Temos o DataFrame com dados de carros, como suas marcas: "yy", "qq", "pp" e "bb" com seus preços "38000", "45000", "22000" e "12000". Temos os anos de fabricação e "2019", "2020", "2021" e "2020". Selecionamos a mesma “coluna“ marca ”para classificar seus dados, com os nomes em ordem descendente simplesmente adicionando uma condição“ ascendente = false ”. O "no lugar = true" no código é uma palavra -chave que altera o comportamento padrão no método pandas.

A saída mostra o DF classificado da marca de coluna em ordem decrescente.

Exemplo 03: Valores de classificação de pandas por várias colunas (caso I)

Agora, estaremos fazendo um exemplo do valor de classificação dos pandas em várias colunas. Os dados que temos como nomes de marcas dos carros "LL", "KK", "HH" e "GG". Seus preços são "45000", "14000", "13000" e "56000" e os anos de fabricação são "2019", "2020", "2021" e "2018". Aqui selecionamos a coluna "Preço" e "Ano", pois precisamos fazer a classificação de várias colunas. Usamos a função Pandas "Sort_value" com o "DF" e as colunas selecionadas para a classificação.

Aqui, na saída, podemos ver que a coluna "preço" e "ano" é classificada com sucesso.

Exemplo 04: Valores de classificação de pandas por várias colunas (caso II)

No último exemplo, fizemos a classificação de dados em várias colunas. E se os dois anos tivessem o mesmo “ano” de fabricação? Aqui, estaremos reconhecendo esta situação. Os dados são de carros como "xx", "bb", "ee" e "dd" com seus preços como "12000", "15000", "19000" e "17000". Os anos do carro fabricados são "2021", "2019", "2020" e "2020". Como podemos ver, o “2020” apareceu duas vezes na fabricação. Nesta situação em que ano deve ser o primeiro dos dados, caso essa pergunta surja? Simplesmente, passará o ano se ambos forem iguais. Então, estaria verificando seu valor de preço. O que tem o preço mais baixo será o primeiro e o mais alto será depois disso. Com base nos valores atribuídos pelos dados, ele funcionará se esse tipo de condição acontecer. No código, selecionamos a coluna "Ano" e "Brand" para classificá -los por Pandas Class.

A tela é o valor classificado da marca e do ano. Aqui, vemos que o ano “2020” aparece duas vezes; primeiro com o preço "17000" e depois com o preço "19000".

Exemplo 05: Pandas Classal Value Nan no primeiro

Vamos importar o Numpy como NP neste caso. O Numpy é usado para os cálculos numéricos dos dados. "Nan" significa "não um número". Então, quando não há número atribuído nos dados que ele aparece como "nan". Faremos o exemplo de ter valores "nan" aparecem primeiro no quadro de dados. A função de classificação dos pandas é usada com a “Na_Position” = 'primeiro' ”, isso significa que a posição é definida como primeiro dos valores não disponíveis ou nulos no“ df ”. Escolhemos a coluna “Ano” para ter seus valores “nan” no topo do DataFrame.

A saída mostra o valor da NAN primeiro na coluna do ano.

Conclusão

O valor de classificação dos pandas é um método eficiente e muito benéfico. Cobrimos todos os métodos possíveis para classificar valores em pandas neste artigo: a ordem ascendente e descendente da coluna selecionada do quadro de dados. Fizemos a classificação de várias colunas, o que fizemos de duas maneiras: a maneira normal e a situação de aparência do ano semelhante. Por fim, fizemos a classificação dos valores "nan" primeiro no quadro de dados. Todo método de valor de classificação de pandas é digno por si só, pois o trabalho em uma enorme escala de classificação de dados é difícil e quase impossível, essa função dos pandas teve um enorme sucesso para a classificação de dados em todas as maneiras, de acordo com a necessidade.