Amostra de dataframe
Neste tutorial, usaremos uma amostra de dados de dados com os dados abaixo armazenados em filmes.Arquivo CSV:
,título, release_year, imdb_ratingExcluir linhas com base na condição da coluna
Para excluir linhas com base em uma única condição em uma coluna especificada, podemos usar a função Drop (). Por exemplo, se queremos excluir qualquer linha em que o release_year esteja abaixo de 2012, podemos fazer:
df = df.Drop (df [df ['release_year'] < 2012].index, inplace=False)Neste exemplo, comandamos a função Drop para excluir todas as linhas onde o valor na coluna 'release_year' é menor que 2012. O parâmetro 'inplace' impede a função de modificar o quadro de dados original. Isso deve retornar:
Se você notou, as linhas na saída acima têm um valor release_ ano de 2012 e acima.
Excluir linhas com base em várias condições.
Também podemos emparelhar mais de uma condição ao remover linhas. Por exemplo, para remover as linhas onde a classificação é maior que 7.3 E o ano de lançamento é maior que 2018, podemos fazer:
df.Drop (df [(df ['release_year']> 2018) & (df ['imdb_rating']> = 7.3)].índice, inplace = false)O código acima nos permite usar o operador de ampérs e combinar várias condições.
Fechamento
O artigo demonstra como usar a função Pandas Drop () para remover linhas que correspondem às condições únicas ou múltiplas em um quadro de dados de pandas.