PANDAS SELECT ROW por índice

PANDAS SELECT ROW por índice
A seleção de linhas de um quadro de dados pode ser necessária para uma variedade de tarefas de análise de dados. Ao selecionar certas linhas e re-amostrar pandas e séries de dados de dados, a técnica Pandas “ILOC []” para indexação baseada em inteiro é empregada.

Você pode usá -lo seguindo a sintaxe dada:

Somente entradas com valor inteiro são tratadas pela propriedade "ILOC []". Essas entradas, porém, podem ser passadas de várias maneiras.

Você aprenderá várias abordagens para submarrar os quadros de dados do Pandas usando a propriedade "ILOC []" neste tutorial.

Exemplo 1:

Para selecionar uma única linha no DataFrame por índice, examinaremos a demonstração prática do “df.Iloc [] ”Método fornecido pelos pandas.

Compilação e execução dos exemplos serão realizadas na ferramenta "Spyder". Então, lançamos a ferramenta e procuramos as bibliotecas necessárias. Descobrimos que o kit de ferramentas "pandas" é o que precisamos trabalhar com métodos para selecionar as linhas. A biblioteca de pandas é importada para o programa e "PD" é definido como seu alias. Onde quer que esteja no código, precisamos ligar para pandas, usar "PD" em vez de "pandas".

O primeiro uso do kit de ferramentas do Pandas ocorre quando temos que gerar um quadro de dados de pandas usando o “PD.DataFrame () ”Método. Nós chamamos o “PD.Dataframe () ”função e especifique valores para isso. Queríamos criar um quadro de dados com 3 colunas: “Montanhas”, “Altitude” e “Continente”. Os valores foram identificados para cada coluna e o comprimento da coluna é mantido igual para todas as colunas.

A coluna "Mountains" está mantendo os nomes das cadeias de montanhas que são "Karakoram", "Hindu Kush", "Alaska Range", "Himalaia" e "Andes". A segunda coluna “Altitude” armazena o comprimento em metros dessas cadeias de montanhas. Os valores para esta coluna são "8611", "7708", "6194", "8848" e "6961". A última coluna "Continente" está tendo o nome do continente onde essas montanhas estão localizadas: "Ásia", "Ásia", "N_America", "Asia" e "S_America".

O construtor de dados de dados, quando chamado, cria um quadro de dados com dados fornecidos. Mas se chamarmos novamente no mesmo programa com novos dados, ele perderá o anterior. Isso ocorre porque não encontra nenhum armazenamento para colocar o quadro de dados. Somos obrigados a criar um espaço para preservá -lo. Para manter o DataFrame para poder usá -lo depois, criamos um objeto DataFrame "FATOS". Ele armazenará o quadro de dados com colunas e linhas especificadas.

Para exibir o resultado, o Python nos fornece um método simples que é o método "print ()". Apenas pega a entrada e exibe no terminal. A entrada pode ser uma função, uma variável/objeto, uma operação matemática ou uma string para exibir. Como queremos exibir nosso DataFrame recém -criado, fornecemos o objeto DataFrame "FACTS" como entrada do método "print ()" do Python.

Para executar o script, pressionamos as teclas "Shift+Enter". Aqui está o nosso quadro de dados com 3 colunas e 5 linhas apresentadas no terminal que podem ser vistas no instantâneo abaixo.

Agora, a recuperação de uma única linha no quadro de dados fornecida será explorada. A seleção é baseada no índice. Para isso, o quadro de dados de pandas tem a propriedade “df.iloc [] ”. Somente valores inteiros podem ser transmitidos para esse método para seleção.

Nós usamos o “df.ILOC [] ”Propriedade logo após exibir o DataFrame. O nome do nosso DataFrame "FACTS" é fornecido com o método "iloc []". Entre os colchetes da propriedade, o número do índice, da linha que queremos extrair, é especificado. Aqui fornecemos o número do índice “3”. Portanto, a propriedade "Iloc []" analisará os dados de dados "fatos" e pesquisará a linha com o índice número 3. Ele corresponderá ao índice que fornecemos com todos os índices do quadro e selecionará a linha igual ao número do índice de entrada. Depois de recuperar a linha, ela será colocada na variável "Box" que criamos para armazenar o resultado da propriedade "iloc []". Finalmente, o resultado será mostrado no console utilizando o método "print ()".

A linha com o índice 3 é recuperada. Você pode ver na imagem abaixo. A linha com o índice número 3 tem uma montanha chamada Himalaia, a altitude é 8848 e o continente é a Ásia. Além disso, o tipo de dados para esta linha mencionado é "objeto".

Exemplo # 2:

Na ilustração acima, aprendemos a selecionar uma única linha por índice utilizando a propriedade Pandas Dataframe "Iloc []". Esta instância falará sobre a seleção de várias linhas em um DataFrame por índice.

Nós empregamos o “df.ILOC [] ”Propriedade. Estamos usando o quadro de dados acima criado nesse caso também. O nome do DataFrame "FACTS" é escrito com a propriedade "ILOC []" e dentro de seu operador subscrito, usamos outro suporte quadrado para especificar vários índices. Se você não adicionar o segundo suporte quadrado, ele lançará um erro. Os índices que selecionamos para exibir são "0", "2" e "4". Portanto, ele extrairá linhas 1, 3 e 5. O resultado será armazenado na variável "múltipla". A função "print ()" exibirá a saída.

As 3 linhas selecionadas foram exibidas no terminal.

Além de selecionar várias linhas em um quadro de dados, você também pode selecionar quais colunas devem ser exibidas com as linhas.

Dentro dos suportes quadrados do método “iloc []”, definimos os índices para as linhas e os índices da coluna a serem selecionados. No primeiro operador subscrito, mencionamos índices para linhas como "1", "2" e "3" e índices de coluna no 2º como "0" e "2". A saída é apresentada usando o método "print ()".

Três linhas com 2 colunas foram selecionadas no quadro de dados resultantes.

Exemplo # 3:

A última técnica para exercer a propriedade "Iloc []" é para selecionar as linhas pelo valor do índice será colocada em prática neste exemplo.

Quando se trata de selecionar um grande número de linhas em um quadro de dados pelos valores do índice, fica muito demorado especificar os índices de linhas um por um, especialmente ao lidar com grandes conjuntos de dados. Aqui, a propriedade Pandas Dataframe “Iloc []” nos permite fornecer uma variedade de valores.

Nós exercitamos o “df.ILOC [] ”Propriedade com o DataFrame gerado em primeira instância. O intervalo de valores de índice é especificado como "1: 4". Aqui "1" é o número do índice inicial e "4" é o último valor do índice. Ele selecionará os valores entre esse intervalo, incluindo o valor inicial do índice, mas excluindo o último valor do índice especificado. A variável "range" é criada para manter a saída ". A função "print ()" é invocada para mostrar o resultado.

Isso nos dá o quadro de dados que pode ser visto na imagem de saída anexada abaixo.

Conclusão

Neste artigo, discutimos a seleção de linhas em um quadro de dados usando os valores do índice. Utilizamos o quadro de dados de pandas “df.Iloc [] ”Propriedade para alcançar os resultados desejados. Várias técnicas para empregar a propriedade “ILOC []” foram explicadas e implementadas usando os códigos de amostra. O primeiro exemplo nos diz a maneira de extrair uma única linha por índice, a 2ª ilustração trabalhou na seleção de várias linhas por índice e linhas selecionadas com colunas especificadas e a última instância deu uma idéia de entrada da gama de valores de índice.