Filtrar nan pandas

Filtrar nan pandas

Enquanto trabalham com um grande número de conjuntos de dados, os usuários geralmente encontram vários valores nulos ou nan. Os valores nulos representam os valores nulos em um conjunto de dados. No Python, os desenvolvedores também encontram valores de nan quando estão trabalhando com pandas em Python. Para filtrar esses valores nulos, o Python inclui diferentes funções.

Os resultados deste blog são:

  • O que é "pandas" em Python?
  • O que são valores de nan?
  • Como filtrar a linha específica do conjunto de dados que contém valor de nan usando dados de dados de pandas em python?
  • Como filtrar várias linhas do conjunto de dados que contém valor nan usando dados de dados de pandas em python?
  • Como filtrar todas as linhas do conjunto de dados que contém valor nan usando dados de dados de pandas em python?

O que é "pandas" em Python?

Em Python, “Pandas”É a biblioteca mais usada para trabalhar com o Float, DateTime, String, etc., tipos de conjuntos de dados. Possui várias funções para explorar, analisar, limpar e manipular dados desejados. Em outras palavras, permite que os usuários filtrem as linhas com os valores da NAN usando o “quadro de dados”Funções, como“quadro de dados.Dropna ()", e "quadro de dados.não nulo()" funções.

O que são valores de nan?

Quase todo conjunto de dados tem valores nulos, o nulo é um valor específico do ponto flutuante que significa “Não é um número”. Os dados vêm em várias formas e formas, incluindo valores em branco/ausentes que são representados como uma nan. Como outros idiomas de desenvolvimento, o Python também tem várias maneiras de representar os valores ausentes nos conjuntos de dados.

Como filtrar linhas de dados específicas do conjunto de dados que contêm valor nan, utilizando o quadro de dados do Pandas no Python?

Para filtrar linhas específicas do conjunto de dados que contém valores de nan, primeiro, criaremos um conjunto de dados contendo valores de NAN. Para fazer isso, importe o “Numpy", e "Pandas”Módulos da biblioteca e crie um novo conjunto de dados. Em seguida, verifique o conjunto de dados recém -criado:

importar pandas como PD
importar numpy como np
dataframe = pd.DataFrame ('Autores': ['Maria', 'Henry', 'Marry', NP.Nan, 'Alex'],
'Nome de usuário': ['FMN018', NP.Nan, 'FM012', 'MG002', 'MA025'],
'Experiência': ['1 ano', '2 anos', np.Nan, '6 meses', '9 meses']
)
quadro de dados

Como você pode ver, o conjunto de dados criado inclui vários valores de NAN:

Agora, use o “não nulo()”Função para filtrar a linha específica da coluna específica que contém valores de NAN:

DataFrame [DataFrame ['Experiência'].não nulo()]

Saída

Como filtrar várias linhas de dados do conjunto de dados que contêm valor nan, utilizando o quadro de dados do Pandas no Python?

Às vezes, os usuários precisam filtrar as várias linhas do conjunto de dados fornecido de mais de uma coluna. Para isso, especifique os nomes de colunas desejados e, em seguida, use o “todos()”Função com o“não nulo()”Função:

colunas = ['experiência', 'nome de usuário']
DataFrame [DataFrame [colunas].não nulo().todos (1)]

Pode -se observar que várias linhas são filtradas do conjunto de dados que contém valores de NAN das colunas especificadas:

Como filtrar todas as linhas do conjunto de dados que contém valor nan usando dados de dados de pandas em python?

Se os usuários desejam filtrar todas as linhas do conjunto de dados que contêm valores de nan usando o quadro de dados do Pandas em Python, o ““Dropna ()”A função pode ser usada:

quadro de dados.Dropna ()

Saída

Nós compilamos as maneiras mais fáceis de filtrar os valores de nan no Python.

Conclusão

Para filtrar as linhas com os valores de nan em Python, o “quadro de dados”Funções, como“quadro de dados.não nulo()", e "quadro de dados.Dropna ()”As funções são usadas. Este blog forneceu as diferentes maneiras de filtrar os valores da NAN no Python.