Pandas Get Index

Pandas Get Index
“Encontrar os índices de linha é necessário, o que é crucial para a engenharia de recursos. Essas habilidades podem ajudá -lo a eliminar ouridos ou números aberrantes a partir de um quadro de dados. Uma ferramenta vital para obter dados específicos de linhas ou colunas do quadro de dados de pandas é chamado de índice de pandas. É responsável por configurar os dados para acesso rápido e organização. Outro nome para o índice é a seleção de subconjunto. O valor do índice específico é referido como um rótulo. Os valores do índice são escritos em uma fonte em negrito. Podemos ser obrigados a recuperar os nomes de linha ou índice ao examinar conjuntos de dados reais, que são frequentemente muito grandes para realizar operações específicas. Demonstraremos como extrair os índices dos quadros de dados de pandas neste artigo.”

Como obter os índices do DataFrame em pandas?

Usando várias funções e propriedades, existem várias maneiras de recuperar índices do quadro de dados em pandas. Explicaremos como extrair índices de quadro de dados usando algumas técnicas diferentes nos exemplos a seguir.

Primeiro, veremos o quadro de dados.Propriedade do índice. A propriedade Index de um quadro de dados de pandas é usada para obter o índice de linha. O rótulo da linha do DataFrame é retornado como um objeto pelo DataFrame.Função do índice.

Exemplo # 1: Obtendo os índices iterando os índices do DataFrame

Para extrair o índice, vamos primeiro criar um quadro de dados para que possamos iterar através de seus índices de linha. Devemos primeiro carregar o módulo Pandas, importando -o para usar seus recursos antes de criarmos o DataFrame. Vamos criar nosso quadro de dados usando o PD.Método DataFrame ().

O quadro de dados "df" foi criado. O “PD.O método DataFrame () ”levou o Dicionário Python com chaves e valores como argumento. A função print () é usada para ilustrar o quadro de dados. No quadro de dados "df", temos três colunas, "Col1", "Col2" e "Col3", armazenando os valores (3, 4, 5, 6, 7, 8, 9), (9, 8, 7 , 6, 5, 4, 3) e (1, 3, 5, 7, 8, 0, 11) respectivamente. O construtor python cria um índice de linha inteira padrão no lado esquerdo de cada linha (começa de 0). Agora vamos iterar através dos índices para obter os índices do quadro de dados usando o DataFrame.Propriedade do índice.

A propriedade Index recuperou com sucesso os índices do DataFrame. Como você pode ver, os índices de linha em nosso quadro de dados começaram em 0 e terminou em 6.

Exemplo # 2: Obter os índices como um objeto de lista

Primeiro, criaremos um quadro de dados com índices personalizados. Especificaremos os rótulos não numéricos para os índices de linha em nosso quadro de dados.

Pode -se observar que o índice de linha não é mais um índice inteiro, pois especificamos a lista de rótulos como ["R1", "R2", "R3", "R4", "R5", "R6", "R7" ”] Para o parâmetro de índice de PD.Função DataFrame (). Criamos três colunas "C1" ", C2" e C3 ", armazenando dados fictícios (33, 45, 12, 78, 34, 86, 23), (26, 37, 76, 25, 97, 53, 31) e (17, 74, 95, 63, 54, 56, 19) respectivamente. Agora, usaremos a função List () para obter a lista de etiquetas de índice. Um objeto de lista pode ser criado usando a função List (). Uma coleção modificável ordenada é chamada de objeto de lista.

Dentro da função List (), usamos a propriedade Index para recuperar os índices do DataFrame. A função list () então os armazena como os itens de um objeto de lista.

Exemplo # 3: Obtendo a matriz do índice usando o índice.Values ​​() Método

Neste exemplo, o índice.O método dos valores será usado para recuperar os índices do quadro de dados. Um conjunto ordenado sliceable implementado pelo imutável ndarray chamado Pandas Index. Os nomes do eixo para todos os objetos dos pandas são armazenados neste objeto básico. O índice.O atributo de valores dos pandas retorna uma matriz que contém os dados no objeto de índice especificado.

Criamos o índice personalizado definindo uma lista de etiquetas ['i', 'ii', 'iii', 'iv', 'v', 'vi', 'vii'] no parâmetro de índice. Existem três colunas em nosso quadro de dados. A coluna "X" está armazenando valores ('a', 'b', 'c', 'd', 'e', ​​'f', 'g'), coluna "y" contendo os valores de dados ('h' , 'i', 'j', 'k', 'l', 'm', 'n'), e a coluna “z” tendo os valores ('o', 'p', 'q', 'r ',' s ',' t ',' u '). Agora vamos usar o índice.Método de valores para obter os índices do DataFrame "df".

Também podemos usar a função tolista () com o índice.Método de valores para recuperar os índices do DataFrame.

Uma matriz especificada pode ser transformada em um objeto de lista regular com os mesmos valores, elementos ou itens usando a função tolista ().

Exemplo # 4: Obtendo os índices usando os métodos de query () e tolist ()

Essa técnica nos permite recuperar apenas os Índices específicos de objetos de quadro de dados específicos que atendem a determinados critérios. Usando o “PD.DataFrame () ”Método e o método de query () dos pandas, um quadro de dados de pandas será criado neste método. Aplicando o método query () a um quadro de dados e transmitindo uma condição faz com que ele retorne um quadro de dados que contém apenas as linhas que correspondem aos critérios/atendem à condição. Em seguida, usaremos o método Tolist () junto com o atributo de índice, que retornará uma lista que contém os valores do índice do DataFrame. Vamos examinar o código Python usado para realizar essa técnica prática para recuperar os índices do objeto DataFrame que satisfazem as condições especificadas.

Criamos um dataframe com rótulos de índice como ['01', '02', '03', '04', '05', '06']. Os rótulos das colunas do DataFrame são especificados como "nome", "idade" e "altura" com valores ('Alexa', 'Mark', 'Ryan', 'Bob', 'Tom', 'Joe'), (21 , 20, 21, 24, 22, 23) e (5.4, 5.8, 5.7, 6.1, 5.9, 6.2) respectivamente.

Dentro da função query (), especificamos uma condição para recuperar as linhas onde o valor na coluna “altura” é maior que 5.7. Em seguida, usamos o atributo de índice para extrair os índices de linhas recuperadas, enquanto a função Tolist () converteu os índices retornados em uma lista I.e. ['02', '04', '05', '06].

Exemplo # 5: Obtendo o valor do índice da coluna da função get_loc () com o atributo de colunas

Nos exemplos anteriores, vimos como obter índices de linhas de dados, mas agora recuperaremos o valor do índice da coluna de uma coluna específica usando o método get_loc () junto com o atributo de colunas. O valor do índice de um determinado nome da coluna dentro de um quadro de dados de pandas será retornado neste exemplo. O atributo de colunas e a função get_loc () serão usados ​​para esta tarefa. O nome da variável que gostamos de selecionar será especificado como um valor de string dentro do método Get Loc.

Usando um dicionário Python dentro do PD.Função DataFrame (), criamos nosso DataFrame. Pode -se observar que existem 5 colunas em nosso quadro de dados com nomes "a", "b", "c", "d" e "e". Vamos usar o atributo da coluna com a função get_loc () para obter o valor do índice da coluna "D".

Para isso, colocaremos o nome da coluna, eu.e., "D", como uma string dentro da função get_loc ().

A coluna “D” é colocada no valor do índice 3.

Conclusão

Neste tutorial, tentamos ensinar como você pode obter os índices do quadro de dados do Pandas no Python. Discutimos quais são os índices em pandas e como você pode recuperá -los usando diferentes funções e atributos. Implementamos exemplos diferentes para ensinar como obter os índices iterando os índices do DataFrame, usando o atributo de índice, usando os métodos query () e tolist () e usando a função get_loc () com o atributo de colunas.