Filtro da série Pandas

Filtro da série Pandas

Uma série de pandas é uma matriz unidimensional com rótulos e valores de índice. Podemos filtrar uma série de pandas para condições especificadas quando necessário. Para filtrar a série, vamos empregar duas técnicas que são “Série.filtro () ”e“ Série.loc [] ”.

A sintaxe para “Série.o método filtro () ”é:

Para empregar a propriedade "LOC []", a sintaxe fornecida abaixo precisa ser seguida:

Exemplo # 1: Utilizando o método filtro () para filtrar uma série Pandas

Nesta ilustração, empregaremos o Pandas “Série.Método Filter () ”para filtrar uma série Pandas.

A ferramenta Spyder é lançada para criar códigos de exemplo. O requisito fundamental para construir o programa é o carregamento das bibliotecas necessárias. Nesse caso, apenas precisamos de um único pacote que seja denominado "pandas". Para introduzir esta biblioteca em nosso arquivo python, usamos um script de linha única “Importar pandas como PD”. Este script possui duas partes: os "importantes pandas" serão carregados no kit de ferramentas do Pandas em nosso arquivo de programa e a parte "como PD" do script fez "PD" para ser usado como alias de "pandas" no programa Python.

A próxima linha invocou o “PD.Método da série (). O "PD" refere -se a pandas, enquanto a "série" refere -se à inicialização do procedimento de construção da série. Empregamos esse método e especificamos alguns valores inteiros para criar uma série com esses valores. Os valores que fornecemos são "23", "34", "56", "39", "78", "61", "36", "92", "54" e "11". Inserimos 10 valores no “PD.Método da série ().

Além de especificar a matriz de valores, usamos o "nome". O argumento do "nome" define o rótulo para esta matriz de valores. Por isso, especificamos um rótulo para isso como "números inteiros". O “ps.A função Série () ”construirá uma série, mas não será capaz de manter esta série. Na próxima vez que invocarmos esse método no programa em particular, ele perderá a série criada anteriormente. Para obter esta série gerada atualmente, um objeto de série é criado e nomeado "Info" e atribuído o resultado gerado ao exercitar o "PD.Método da série (). Nossa série será armazenada no objeto da série "Info" e pode ser acessada depois, mencionando esse nome de objeto em qualquer lugar do programa.

A série será gerada com os valores especificados e a lista de índices padrão. Mas não queremos usar a lista seqüencial padrão. Em vez disso, precisamos colocar uma lista de índice definida pelo usuário. Para isso, criamos uma variável "pássaros" e a inicializamos com esses valores "Pigeon", "Parrot", "Sparrow", "Pea_cock", "Crow", "Owl", "King_fisher", "Swan", " Pomba "e" Wood_pecker ". O número de valores deve ser igual à contagem de valores para a série que é 10 porque esses valores serão definidos como a lista de índices.

Para converter esta lista de valores na lista de índices, utilizamos a “série.índice ”Propriedade. Aqui, o nome da nossa série é "Info" mencionado com o ".índice ”Propriedade. Em seguida, atribuído a ele os valores que a variável "pássaros" está segurando. A propriedade "índice" levará os valores e os definirá como a lista de índices para a série no lugar de uma lista seqüencial do índice. Fizemos uma série, nome de conjunto e lista de índices. Agora, queremos vê -lo na janela de saída. Isso pode ser feito empregando a função python “print ()”. Fornecemos nossa série "Info" como uma entrada para imprimir seu conteúdo.

Basta pressionar as teclas "Shift+Enter" para executar o programa. Isso exibirá a série de saída com os valores fornecidos e a lista de índices especificados no console python.

Agora, filtramos esta série utilizando a “série.filtro () ”função. Entre os parênteses do método, definiremos uma lista de valores a serem filtrados da série.

As séries.o método filtro () ”é chamado. Temos que fornecer o nome de nossa série no lugar da palavra "série". Nós escrevemos como “informação.filtro()". Aplicamos o método à série. Suponhamos que queremos pesquisar uma lista de etiquetas de índice para identificarmos esses rótulos de índice nesta função. Para identificar os rótulos do índice, usamos o argumento "itens". Este parâmetro "item" levará os valores para filtrar da série. Nós atribuímos dois rótulos de índice "Crow" e "Swan". Na série "info", ele procurará por esses dois rótulos de índice e, se encontrado, ela os extrairá com seus valores correspondentes. Em seguida, para armazenar a saída filtrada, temos a variável "alfa". A função "print ()" exibirá o resultado no terminal.

Na imagem anexada abaixo, podemos ver que dois registros foram colocados em exibição que possuíam os rótulos de índice especificados.

Agora, usaremos o mesmo método para filtrar os rótulos de índice com uma expressão regular específica.

Para isso, invocamos a “série.filtro () ”método. E dentro de seus aparelhos, o parâmetro "regex" é usado. Isso assumirá uma expressão para filtrar os rótulos do índice que o contêm. A expressão que especificamos para pesquisar é "_" (sublinhado) para descobrir os rótulos de índice que têm essa expressão neles. O resultado será armazenado na variável "beta" e exibido com o método "print ()".

A série filtrada está mostrando três registros cujos rótulos de índice tinham a expressão "_" neles.

Exemplo # 2: Utilizando a propriedade LOC () para filtrar uma série Pandas

Outro método para filtrar uma série de pandas por valor é a “série.loc [] ”propriedade. Vamos especificar uma condição dentro da “série.LOC [] ”Propriedade para extrair o registro que especifica a condição definida.

Primeiro importamos a biblioteca de pandas e depois empregamos o “PD. Função da série () ”para gerar uma série com esses valores“ 1 ”,“ 25 ”,“ 93 ”,“ 44 ”,“ 51 ”,“ 6 ”,“ 72 ”,“ 18 ”,“ 99 ”,“ 12 "," 64 "," 44 "," 16 "," 77 "," 19 "," 44 "e" 22 ". A série resultante é armazenada no objeto da série "Y". Para apresentá -lo na tela, passamos esse objeto para o método "print ()".

Isso nos produz a seguinte série como saída:

Nós invocamos a “série.LOC [] ”Propriedade e especificou uma condição dentro dela usando a função“ Lambda ”. A condição que definimos é para todo valor da série verificar se o valor é igual a "44". Em seguida, armazene o resultado gerado na variável "cond" e exibi -lo usando a função "print ()".

O resultado mostra 3 registros no índice "3", "11" e "15", que estão tendo um valor igual a 44.

Para a demonstração, aplicaremos uma condição "ou" com a propriedade "loc []".

Entre os parênteses da propriedade “Série.loc [] ", usamos a função" lambda "para especificar a condição que declara para extrair valores menores que 30. Ou os valores maiores que 50, onde "x" é qualquer valor na série "y". A variável "z" manterá a saída.

Aqui está a saída renderizada no instantâneo abaixo, mostrando apenas os valores que cumpriram a condição definida.

Conclusão

Neste artigo, elaboramos o conceito de filtrar uma série de pandas com condições particulares. Nós explicamos dois métodos para fazer isso: “Série.filtro () ”e a“ série.loc [] ”propriedade. A primeira ilustração explicou a “série.função filter () ”para filtrar os rótulos de índice em uma série de pandas, fornecendo a lista de etiquetas de índice e também usando a expressão regular presente nos rótulos do índice. O 2nd Instância trabalhou usando a “série.LOC [] ”Propriedade para pesquisar valores na série que cumprem a condição específica.