Os pandas removem linhas com condição

Os pandas removem linhas com condição
Este artigo discutirá como usar a função Pandas Drop () para excluir linhas que correspondem a uma condição específica.

Amostra de dataframe

Neste tutorial, usaremos uma amostra de dados de dados com os dados abaixo armazenados em filmes.Arquivo CSV:

,título, release_year, imdb_rating
0, Homem de Ferro, 2008,7.9
1, The Incredible Hulk, 2008,6.6
2, Homem de Ferro 2.2010,6.9
3, Thor, 2011,7.0
4, Capitão América: O Primeiro Vingador, 2011,6.9
5, os Vingadores, 2012,8.0
6, Homem de Ferro 3.2013,7.1
7, Thor: The Dark World, 2013,6.8
8, Capitão América: The Winter Soldier, 2014,7.8
9, Guardiões da Galáxia, 2014,8.0
10, Vingadores: Age of Ultron, 2015,7.3
11, Homem-Formiga, 2015,7.3
12, Capitão América: Guerra Civil, 2016,7.8
13, Doctor Strange, 2016,7.5
14, Guardiões da Galáxia: Volume 2.2017,7.6
15, Homem -Aranha: Homecoming, 2017,7.4
16, Thor: Ragnarok, 2017,7.9
17, Pantera Negra, 2018,7.3
18, Vingadores: Guerra do Infinito, 2018,8.4
19, Homem-Formiga e Wasp, 2018,7.0
20, Capitão Marvel, 2019,6.8
21, Vingadores: Endgame, 2019,8.4
22, Homem-Aranha: Longe de casa, 2019,7.4
23, viúva negra, 2021,6.7
24, Shang-Chi, 2021,7.4
25, Homem -Aranha: De jeito nenhum para casa, 2021,8.4
26, Doutor Strange: No Multiverso da Madness, 2022,7.5
Depois de baixado, carregue o arquivo CSV como mostrado abaixo:
importar pandas como PD
df = pd.read_csv ('filmes.csv ', index_col = [0])
df

Excluir linhas com base na condição da coluna

Para excluir linhas com base em uma única condição em uma coluna especificada, podemos usar a função Drop (). Por exemplo, se queremos excluir qualquer linha em que o release_year esteja abaixo de 2012, podemos fazer:

df = df.Drop (df [df ['release_year'] < 2012].index, inplace=False)
df

Neste exemplo, comandamos a função Drop para excluir todas as linhas onde o valor na coluna 'release_year' é menor que 2012. O parâmetro 'inplace' impede a função de modificar o quadro de dados original. Isso deve retornar:

Se você notou, as linhas na saída acima têm um valor release_ ano de 2012 e acima.

Excluir linhas com base em várias condições.

Também podemos emparelhar mais de uma condição ao remover linhas. Por exemplo, para remover as linhas onde a classificação é maior que 7.3 E o ano de lançamento é maior que 2018, podemos fazer:

df.Drop (df [(df ['release_year']> 2018) & (df ['imdb_rating']> = 7.3)].índice, inplace = false)
df

O código acima nos permite usar o operador de ampérs e combinar várias condições.

Fechamento

O artigo demonstra como usar a função Pandas Drop () para remover linhas que correspondem às condições únicas ou múltiplas em um quadro de dados de pandas.