Linha de acesso de pandas por índice

Linha de acesso de pandas por índice
“Pandas é uma biblioteca; Podemos dizer que é uma biblioteca de "código aberto" projetado principalmente para se mover de maneira eficiente e logicamente com dados relacionais ou rotulados. Oferece uma gama de estruturas e procedimentos de informação para trabalhar com séries temporais e informações quantitativas. A biblioteca Numpy serve como base para esta biblioteca. Pandas é rápido e oferece a seus usuários desempenho excepcional e eficiência. Temos quadros de dados em "pandas" que armazenam dados em forma de tabular, e também podemos acessar linhas em "pandas" por seus valores de índice. Acessar linhas por índice significa obter todos os dados da linha desejada, colocando seu valor de índice. Neste tutorial, acessaremos as linhas por índice e explicaremos aqui quais métodos são usados ​​para acessar linhas por índice em pandas.”

Métodos para acessar a linha por índice em pandas

"Pandas" fornece dois métodos diferentes para acessar as linhas por índice. Discutiremos esses métodos aqui neste guia, e esses métodos são:

  • Método loc [].
  • Método Iloc [].

Vamos fazer alguns códigos e utilizar ambos os métodos separadamente e verificar os resultados de como esses métodos são utilizados em "pandas".

Exemplo 01: Usando o DataFrame.Método loc []

Estamos abrindo o aplicativo "Spyder" para realizar esses exemplos, que são apresentados aqui neste tutorial. Estamos começando com nosso primeiro código aqui, importando os "pandas como PD", que é a parte mais importante aqui. Vamos acessar a função "pandas" simplesmente escrevendo "pd". Agora, criamos um quadro de dados e colocamos algumas linhas e colunas nele. O nome deste DataFrame é "Relatório" aqui.

Somos direcionados a adicionar alguns dados e colocamos "serial_no" como o nome da primeira coluna e adicionar "1", "2", "3", "4" e "5" a esta coluna "Serial_no". Depois disso, adicionamos a coluna "estudantes" e aqui temos "Smith", "Jack", "Joseph", "Robert" e "Cherry" nesta coluna. A próxima coluna é chamada "Professores" e adicionamos "Mia", "Thomas", "Emma", "Charles" e "Olivia". Agora vem a coluna "Assunto" e, nisso, estamos adicionando "inglês", "matemática", "it", "ciência" e "social" como os assuntos. E a última coluna que temos é a coluna "Credit_HRS". Colocamos “3”, “4”, “4”, “5” e “6” na coluna “credit_hrs”. E converter todos esses dados no quadro de dados abaixo, colocando “PD.DataFrame ”e armazenando -o em uma nova variável chamada“ Report1 ”. Depois disso, imprimimos este "Relatório1" DataFrame na tela do console, utilizando "print ()". Agora estamos definindo o "índice" deste quadro de dados, utilizando o método "set_index".

Aqui escolhemos “serial_no” como o índice. Abaixo disso, estamos utilizando o “DataFrame.método loc ”para obter as linhas que queremos. Aqui colocamos o nome do DataFrame, que é "Relatório1" e também colocamos o "serail_no" cujas linhas queremos acessar. Selecionamos "2" do "Serial_no" porque queremos selecionar a linha cujo "Serial_no" é "2". E armazenamos esta linha na variável "resultado". Depois disso, temos "impressão" para renderizar esta linha na tela do console de "Spyder".

Simplesmente pressionamos "Shift+Enter" e obtemos esse resultado do código. Aqui, ele seleciona a linha cujo "Serial_no" é "2" e esta linha contém "Jack", "Thomas", "Maths" e "4". Acessamos esta linha utilizando o “DataFrame.Método loc ”.

Exemplo 02

Usamos o código acima novamente, mas neste exemplo, selecionaremos mais de uma linha utilizando o “DataFrame.Método loc ”. Estamos criando dataframe e, depois de imprimir o DataFrame, definimos o índice. Em seguida, colocamos dois colchetes quadrados e colocamos dois "credit_hrs" diferentes nesses colchetes, como mostrado. Aqui, adicionamos "3, 5", para que retorneá dados de duas linhas cujos "credit_hrs" são "3" e "4". Estamos armazenando as duas linhas na variável "RSLT" e depois imprimindo -as usando "print ()".

Este resultado mostra que temos duas linhas aqui. O "credit_hrs" da primeira linha que acessamos aqui é "3" e o segundo é "5", como selecionamos "3" e "4" Credit_HRs por acessar essas duas linhas.

Exemplo 03: Usando o DataFrame.Método Iloc []

Aqui começamos este código e importamos os “pandas como PD”. O nome do DataFrame é "estoque" nesta instância. Somos instruídos a adicionar alguns dados, por isso nomeamos a primeira coluna como "itens" e inserir o "leite", "esponja", "bola", "borracha" e "puff" nessa coluna "itens". Depois disso, adicionamos a coluna "artigos de papelaria", na qual incluímos "ponteiro", "registro", "removedor", "tinta" e "marcador". A coluna "qualidade" é a próxima e estamos adicionando os valores de qualidade como "bom", "melhor", "soberbo", "média" e "bom".

Exibimos o "Stock" com o suporte da instrução "print ()". Agora, há o “DataFrame.Iloc [] "Método abaixo, e colocamos o valor do índice" 2 "para obter a linha do índice 2 e salvá -lo como uma variável" dados ". Depois disso, temos um "print ()" que renderiza esta linha no terminal do "Spyder".

A linha Index 2 contém três valores que são "bola", "removedor" e "soberbo". Então, ele acessa esta linha e renderiza abaixo.

Exemplo 04

Atualize o Exemplo 3 aqui e selecione dois valores de índice para acessar três linhas. O quadro de dados do "produto" é criado aqui com os mesmos dados do Exemplo 3 e também renderiza isso. Escolhemos três valores de índice diferentes aqui e os colocamos em dois colchetes quadrados. Escolhemos valores de índice "0", "2" e "4". Portanto, essas três linhas são selecionadas e armazenadas na variável "Data1". Renderizamos todas as três linhas também colocando a função "print ()" aqui.

Primeiro, você pode ver o quadro de dados completo e, abaixo, você pode observar que ele imprime as linhas selecionadas à medida que acessamos essas três linhas consumindo o “DataFrame.Iloc [] ”Método.

Exemplo 05

Novamente, temos um DataFrame aqui neste código com o nome "venda". Depois de exibir esse quadro de dados de "venda", colocamos diretamente o "DataFrame.Método ILOC ”na declaração de impressão. Então, ele acessará e também imprimirá as linhas acessadas. Aqui “: 3” é utilizado, o que significa que estamos acessando as três primeiras linhas aqui.

A saída renderiza todo o quadro de dados, bem como as três primeiras linhas do quadro de dados abaixo, pois acessamos essas três linhas, definindo -as no “DataFrame.Iloc [] ”Método.

Exemplo 06

Neste código, acessaremos as linhas alternativas. Depois de definir e imprimir o quadro de dados original, colocamos o “DataFrame.Método ILOC ”como o parâmetro da instrução de impressão e definir“ [:: 2] ”nele, o que representa que queremos acessar as linhas alternativas a partir deste Dados Dataframe. Ele acessará as linhas alternativas e também as imprimirá no terminal.

Veja esta saída e verifique se, depois de exibir o quadro de dados completo, ele acessa as linhas alternativas a partir deste quadro de dados e as exibe abaixo do DataFrame original.

Conclusão

Escrevemos este tutorial para ajudá -lo a entender como "acessar linhas por índice" em "pandas". Definimos dois métodos aqui, que são o “DataFrame.Método loc [] ”e o“ DataFrame.Método Iloc [] ”, e também realizamos vários exemplos nos quais utilizamos métodos e linhas de acesso de maneiras diferentes. Também renderizamos as saídas junto com os scripts de código. Nós explicamos cada código em profundidade aqui. Espero que você aprenda facilmente a acessar as linhas por índice e quais métodos são usados ​​para acessar as linhas por índice em “pandas”.