Obtenha todas as linhas em um quadro de dados de pandas contendo uma substring dada

Obtenha todas as linhas em um quadro de dados de pandas contendo uma substring dada

Este artigo ilustrará como obter todas as linhas em um quadro de dados de pandas que contém uma determinada substring.

Amostra de dataframe

Neste exemplo, usaremos uma amostra de dados de dados fornecida no link abaixo:

1
Conjunto de dados de filmes.CSV

Depois de baixado, carregue o quadro de dados como mostrado;

1
df = pd.read_csv ('filmes.CSV ')

Verifique se a coluna contém

Vamos identificar as linhas que contêm uma substring específica. Para isso, usaremos a função contém () em pandas.

Por exemplo, para verificar se algum título contém a sequência 'Capitão' no DataFrame fornecido, podemos fazer o seguinte:

1
Imprimir (df ['título'].str.contém ('capitão'))

O código acima deve verificar se todas as linhas contêm a substring especificada e retornar os valores booleanos correspondentes.

Para linhas correspondentes, a função deve retornar verdadeira e falsa se o contrário.

Buscando linhas que combinam.

Embora o exemplo acima funcione, ele não retorna a linha e seus valores. Podemos expandir isso usando seus valores como índices para o DataFrame.

Um exemplo é como mostrado:

1
Imprimir (df [df ['title'].str.contém ('capitão')])

A função deve retornar as linhas correspondentes e seus valores correspondentes neste caso.

Verifique várias condições.

Podemos filtrar ainda mais os resultados, verificando se as linhas contiverem 'Capitão' e 'America.'

Pegue o código de exemplo mostrado abaixo:

1
2
new_df = df [df ['title'].str.contém ('capitão') e df ['title'].str.Contém ('America')]
new_df

Usamos o Operador para combinar duas condições booleanas neste exemplo.

O quadro de dados resultante é como mostrado:

Você também pode verificar se uma linha contém 'Capitão' ou 'America'.

1
2
new_df = df [df ['title'].str.contém ('capitão') | df ['título'].str.Contém ('America')]
new_df

Isso deve retornar um título que contém a string 'Capitão' ou 'America'. Os dados resultantes são mostrados:

Conclusão

Neste artigo, discutimos a verificação se uma linha contém uma substring dentro de um quadro de dados de pandas. Também abordamos como obter as linhas que correspondem a uma substring específica.