Exercícios de pandas para aprender

Exercícios de pandas para aprender
O módulo "pandas" é a ferramenta mais significativa disponível para os analistas e pesquisadores do Python Data e pesquisadores hoje em dia. A Biblioteca de Análise de Dados Python se concentra principalmente em dados tabulares. É uma biblioteca gratuita e de código aberto distribuído sob a licença BSD. Os pandas têm tantos aplicativos que pode ser mais fácil listar o que não podem realizar do que o que podem.

Ele tem principalmente duas formas: série e dataframe. A “série” contém dados sobre uma única variável e pode ser vista como um vetor com informações indexadas, enquanto “DataFrame” é uma estrutura de dados tabulares.

Neste tutorial, passaremos brevemente por alguns dos exercícios de pandas mais frequentemente utilizados para iniciantes. Você receberá um instantâneo do script python com a saída correspondente para cada exercício.

Biblioteca de importação

Para começar a trabalhar em exercícios de pandas, primeiro precisamos carregar a biblioteca "pandas" em nosso arquivo de projeto. A ferramenta que estamos usando para a implementação dos exercícios de pandas é "Spyder". Lançamos a ferramenta e carregamos a biblioteca de pandas no arquivo python escrevendo o script “Importar pandas como PD”. Temos um alias Pandas como "PD". Agora, "PD" pode ser usado em vez de "pandas" ao longo do programa.

Exercício # 1: convertendo uma lista em série

O primeiro exercício que escolhemos ensinar é gerar séries pandas a partir de uma lista.

Criamos uma variável "manequim" e atribuímos uma lista de valores como "1", "2", "3", "4", "5", "6" e "7". Nós invocamos o “PD.Série () ”função e passou a lista“ Dummy ”como um parâmetro. A série resultante será armazenada na variável "converter". Para exibir o conteúdo na tela, os pandas nos fornecem um método de "print ()". Exibimos a série "convert" utilizando a função "print ()".

O instantâneo de saída correspondente mostra que uma série foi gerada com índices padrão.

Exercício # 2: convertendo uma lista em uma série usando índices especificados

O primeiro exercício demonstrou com precisão a conversão de uma lista em uma série de pandas. Vimos na imagem de saída que a lista foi apresentada com a lista padrão de índices. Se você não deseja que sua série seja exibida com esses índices, você pode alterá -lo fornecendo índices especificados.

Usamos a lista da instância acima. Para converter a lista em série e definir os índices, chamamos de “PD.Série () ”função. Dois parâmetros foram transmitidos a esta função: list_name e index. O nome da lista "manequim" é fornecido. O argumento "índice" é usado para alterar a lista de índices padrão com o que o usuário deu. Nós personalizamos a lista de índices com os valores "A", "B", "C", "D", "E", "F" e "G". A série com uma lista de índice atualizada é armazenada na variável "converter" e depois exibida através da função "print ()".

Na imagem resultante, os índices padrão foram substituídos pela lista de índices fornecidos pelo usuário.

Exercício # 3: Convertendo listas em um DataFrame

No primeiro exercício, aprendemos a converter uma lista em uma série de pandas. Agora, veremos como converter listas em um quadro de dados de pandas.

Três listas foram geradas no script. Essas listas têm valores “['Harry', 25, 'Engineer']”, “['Roma', 32, 'Doctor'] e“ ['Elizia', 22, 'Artista'], respectivamente, respectivamente. Nós armazenamos essas listas em um objeto 2D List "L1". Agora, para converter “L1” em um quadro de dados de pandas, temos uma função de pandas “PD.Quadro de dados()". Esta função foi invocada e a lista 2D é fornecida como um parâmetro junto com outro parâmetro "colunas". DataFrame mostra dados na forma de tabelas com linhas e colunas, para que o parâmetro "colunas" coloque os rótulos nas colunas do quadro de dados. Cada lista possui 3 valores, o que significa que teremos 3 colunas no quadro de dados. Especificamos os rótulos como "nome", "idade" e "profissão". O DataFrame é armazenado no objeto DataFrame "Demo".

A execução do programa nos fornece um quadro de dados com 3 colunas com os rótulos e valores especificados que foram gerados a partir da lista 2D fornecida.

Exercício # 4: convertendo um dicionário em dataframe

Um dicionário de pandas é uma coleção de listas. Para aprender a conversão de um ditado em um DataFrame, primeiro precisamos criar um dicionário. Um dicionário "sample_dict" com 3 listas de valores foi criado. A primeira lista "Col1" tem valores "Harry", "Roma" e "Elizia". A lista "col2" armazena dados "25", "32" e "22". A lista "Col3" tem entradas "engenheiro", "médico" e "artista". Para construir um quadro de dados a partir do ditado "sample_dict", invocamos o "PD.DataFrame () ”Método e passou o dicionário como um parâmetro. Quando o “PD.DataFrame () ”o método é executado, ele levará o conteúdo do dicionário e o modificará para o quadro de dados. O quadro de dados convertido é armazenado no objeto DataFrame "Alterar" e é exibido no console utilizando o método "print ()".

Este programa, quando executado, produz a saída mostrada no instantâneo abaixo.

Exercício # 5: Especificando o índice no DataFrame

Quando exibimos o DataFrame ou uma série no terminal, ele está equipado principalmente com a lista de índices padrão que começa de "0" até o comprimento do conjunto de dados. Aprendemos a alterá -lo na série e você pode modificá -lo no quadro de dados também.

Usamos o quadro de dados gerado no exercício acima. Você pode ver que o DataFrame tem um índice de "0", "1" e "2". Vamos mudar esse comportamento padrão, fornecendo nossa lista de índices. Entre os aparelhos do “PD.DataFrame () ”Método, o nome do dicionário“ Sample_Dict ”e“ Index ”é fornecido. Os índices foram especificados como "x", "y" e "z".

O DataFrame com a lista de índice atualizado é exibido na tela.

Exercício # 6: Extraindo a coluna especificada em um quadro de dados

Para selecionar uma coluna específica em um quadro de dados, usaremos o quadro de dados anterior com os índices padrão. Depois de imprimir o quadro de dados inicial, utilizamos o “df.loc [índice, coluna] ”Método. Como queremos selecionar uma coluna, deixamos o local "índice" fornecendo ":" nela e fornecemos o nome da coluna "Col2" entre seus parênteses. A coluna selecionada é preservada na variável "Selecionar" e apresentada com o auxílio da função "print ()".

Este é o resultado do script acima:

Exercício # 7: Extraindo linhas específicas em um DataFrame

Certas linhas também podem ser selecionadas em um quadro de dados seguindo a mesma técnica que fizemos para a seleção de colunas com apenas uma exceção. Para seleção de linha, precisamos fornecer o índice no “PD.LOC [] ”Método e Coloque Colon“: ”No local da coluna. As linhas que selecionamos são "1" e "2".

As duas linhas selecionadas foram exibidas.

Exercício # 8: Preenchendo valores ausentes em um DataFrame

Criamos um DataFrame com alguns valores ausentes e o imprimimos na tela. Para preencher esses valores, invocamos o “df.Fillna () ”Método. O valor que queremos ser substituído pelas entradas nulas é "0". Então, nós o colocamos no “df.FILLNA () "BRACES da função. A variável "preenchimento" está armazenando o resultado e o método "print ()" será exibido.

Aqui você pode ver que os valores nulos agora são substituídos por 0.

Conclusão

Os pandas nos fornecem uma vasta variedade de opções para resolver problemas de análise de dados da vida real. Funciona principalmente com dados de dados e séries. Alguns exercícios mais comuns foram discutidos neste artigo sobre as funções da série de pandas, bem como as funções de dados de dados de pandas. Nós elaboramos 8 técnicas básicas de aprendizado de pandas. Os conceitos são compreendidos através da demonstração prática do script python na ferramenta Spyder. Todos esses exercícios são o melhor guia para iniciantes para começar com o Python Pandas Dataframes and Series.