Pandas obtêm valores de índice

Pandas obtêm valores de índice

Os índices de linhas são conhecidos como índices de quadro de dados, enquanto os índices das colunas são conhecidos como nomes gerais de colunas. Os índices são usados ​​principalmente para recuperar os dados ou armazenar os dados dentro do quadro de dados. No entanto, também podemos recuperar o próprio índice usando o .Propriedade do índice. Neste tutorial, ensinaremos você a obter um índice como um objeto de lista, como você pode converter o índice em uma coluna DataFrame para recuperá -lo e como você pode obter o índice usando várias condições e a propriedade Index de pandas.

Como obter valores de índice em pandas?

O DataFrame.A propriedade Index pode ser usada para obter o índice de Dataframe Pandas. Um objeto de lista de índice que contém o índice do quadro de dados é retornado usando o DataFrame.Propriedade do índice.

Sintaxe:

Pandas.Índice (dados = nenhum, dtype = nenhum, copy = false, nome = nenhum, tupleize_cols = true, ** kwargs)

Onde:

dados: Matriz (unidimensional)

dtype: Numpy Dtype. É 'objeto' por padrão. Escolheremos o dtype adequado para os dados se o dtype for "nenhum". Se um dtype for especificado e seguro, o dtype será coagido. Caso contrário, um aviso será exibido.

cópia de: bool. Uma cópia do ndarray dado será feito.

nome: objeto. O nome que está sendo armazenado no índice.

tupleize_cols: bool. Por padrão, é verdade. Se for verdade, tentará criar um multiindex.

Os métodos para obter o índice do quadro de dados são demonstrados nos exemplos abaixo.

Exemplo # 01: Extrair o índice de linha DataFrame usando a propriedade Ndex

Vamos criar um DataFrame, primeiro, com várias linhas para que possamos demonstrar como obter seu índice de linha usando a propriedade Pandas Index. Antes de criar o DataFrame, importaremos o módulo Pandas para usar suas funções.

importar pandas como PD
Student_info = [('Tyson', 23),
('Jack', 25),
('Bruce', 25),
('Peter', 24),
('Nick', 21),
('Haris', 26),
('Randy', 25)
]
df = pd.Dataframe (student_info, colunas = ['nome', 'idade']))

Usando uma lista dentro do PD.Função DataFrame (), criamos nosso DataFrame. Existem duas colunas em nosso quadro de dados: nome e idade. A coluna 'Nome' está armazenando os nomes de algumas pessoas aleatórias ('Tyson', 'Jack', 'Bruce', 'Peter', 'Nick', 'Haris', 'Randy'). Considerando que a coluna 'idade' consiste nas idades de cada pessoa (23, 25, 25, 24, 21, 26, 25). No início de cada linha, há um valor de índice para cada linha criada pelo construtor de pandas por padrão. Agora, usaremos a propriedade Index para extrair esta coluna de índice.

df.índice

A saída está mostrando que as linhas estão começando de 0, incrementando em 1 e terminando no índice antes de 7.

Para imprimir cada valor de índice, podemos usar um iterador e dentro dele ou a função print ().

i = df.índice
para x em i:
impressão (x)

Agora, imprimimos todos os valores do índice 0 a 7.

Exemplo # 02: Extrair o índice de linha de dados de dados usando uma condição

Os valores do índice podem ser recuperados especificando uma condição. A propriedade Index buscará os valores do índice do quadro de dados que satisfazem a condição especificada. Em seguida, usaremos a função tolista () para retornar os valores buscados como uma lista. Usando o PD.Função DataFrame (), vamos primeiro criar nosso DataFrame.

importar pandas como PD
df = pd.Quadro de dados(
'item': ['a', 'b', 'c', 'd', 'e', ​​'f', 'g', 'h'],
'Preço': [100, 200.150, 100, 200, 320, 100, 100],
'code': ['q', 'w', 'e', ​​'r', 't', 'y', 'u', 'i']
)

Usando um dicionário Python dentro do PD.Função DataFrame (), criamos um DataFrame. Nosso DataFrame consiste em três colunas e 8 linhas de 0 a 7. A coluna 'itens' está armazenando os valores de dados como string ('a', 'b', 'c', 'd', 'e', ​​'f', 'g', 'h'). A coluna 'preço' está contendo os valores numéricos que representam a peça de cada item (100, 200, 150, 100, 200, 320, 100, 100). O código da coluna com os valores de dados ('q', 'w', 'e', ​​'r', 't', 'y', 'u', "). Agora, vamos recuperar os valores do índice usando o script abaixo.

i = df.índice
índice = df ["preço"] == 100
resultado = i [índice]
resultado.listar()

Usando a propriedade Index, recuperamos os índices do DataFrame 'DF'. Em seguida, especificamos uma condição para extrair dados em que os valores na coluna de preços são iguais a 100. Depois de obter os dados, buscamos os valores de índice das linhas que estão satisfazendo a condição especificada. No final, a função tolista () é usada para transformar a saída em um objeto de lista. A função recuperou uma lista com quatro valores de índice, [0, 3, 6, 7].

Exemplo # 03: Extrair o índice de coluna DataFrame usando a função get_loc ()

Vimos como recuperar os valores dos índices de linha de um quadro de dados. No entanto, também podemos recuperar os valores dos índices de coluna de um quadro de dados. Para obter o valor do índice de qualquer coluna de dados de dados, a função get loc () pode ser usada. Para encontrar o índice, apenas fornecemos o rótulo da coluna para a função get_loc (). Vamos criar um quadro de dados composto por mais de uma coluna para que possamos recuperar seu local de índice ou valor de índice.

importar pandas como PD
df = pd.Quadro de dados(
'classe': ['a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'],
'Membros': [5, 4, 5, 5, 4, 6, 4, 4],
'Salário': [30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000],
'Despesas': [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000]
)

Em nosso quadro de dados, criamos quatro colunas: classe, membros, salário e despesa. A coluna de classe está armazenando os valores de dados ('a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'). Os membros da coluna contêm valores (5, 4, 5, 5, 4, 6, 4, 4), enquanto o salário e despesa da coluna contêm os valores de dados numéricos (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000 e (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000), respectivamente. Suponha que tenhamos que encontrar o valor do índice do salário da coluna:

df.colunas.get_loc ("salário")

A função recuperou o índice da coluna especificada, 2.

Exemplo # 04: Extrair os valores de índice de linha especificados usando a função get_loc ()

Também podemos recuperar a localização do índice dos índices de linha usando a função get_loc () se os rótulos para índices de linha forem especificados. Podemos especificar os rótulos do nosso índice de linha usando uma lista contendo nomes para cada valor do índice de linha. Vamos adicionar os rótulos de índice ao quadro de dados que criamos no Exemplo # 3.

importar pandas como PD
df = pd.Quadro de dados(
'classe': ['a', 'a', 'b', 'b', 'c', 'e', ​​'d', 'd'],
'Membros': [5, 4, 5, 5, 4, 6, 4, 4],
'Salário': [30000, 28000, 32000, 31000, 30000, 26008, 27000, 28000],
'Despesas': [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000],
índice = ['r1', 'r2', 'r3', 'r4', 'r5', 'r6', 'r7', 'r']))

Dentro de Pd.Quadro de dados() Função, especificamos o parâmetro de índice como uma lista contendo rótulos de R1 a R8. Os rótulos 'R1', 'R2', 'R3', 'R4', 'R5', 'R6', 'R7' e 'R8' substituíram o índice inteiro por padrão de DataFrame. Agora, vamos recuperar a localização do índice para uma etiqueta específica.

Imprimir (df.índice.get_loc ("r5"))

Primeiro, a propriedade Index é aplicada ao DataFrame para obter os índices. Então, get_loc () A função é aplicada para extrair a posição do índice do rótulo de índice especificado da linha.

Exemplo # 05: Extrair os valores do índice da linha usando a função Numpy WHERS ():

Também podemos obter os valores do índice especificando uma condição dentro do onde() função de Numpy. Vamos criar um DataFrame primeiro, importaremos os pandas e a biblioteca Numpy para usar suas funções.

importar pandas como PD
importar numpy como np
df = pd.Quadro de dados(
'id': ['001', '002', '003', '004', '005', '006', '007', '008'],
'Preço': [100, 150, 130, 200, 120, 170, 120, 140],
'Desconto': [30, 40, 10, 20, 60, 10, 30, 60])

Depois de importar as bibliotecas necessárias, criamos nosso quadro de dados. Em nosso quadro de dados, temos três colunas (ID, preço e desconto). O ID das colunas, o preço e o desconto armazenam os valores de dados ('001', '002', '003', '004', '005', '006', '007', '008'), (100, 150 , 130, 200, 120, 170, 120, 140) e (30, 40, 10, 20, 60, 10, 30, 40, 60), respectivamente. Agora, vamos encontrar o valor do índice de linha usando o onde() função dentro da função da lista ().

Lista (NP.onde (df ["desconto"]> 30)))
[Array ([1, 4, 7], dtype = int64)]

Especificamos uma condição dentro da função where () para obter as linhas onde o valor na coluna 'desconto' é maior que 30. Para criar uma lista dos valores retornados, usamos o método List ().

Conclusão

Este artigo abordou como recuperar valores de índice de quadro de dados em pandas. Usamos funções diferentes para recuperar o índice de linha e coluna do DataFrame. Implementamos vários exemplos para ensiná -lo a extrair o índice de linha DataFrame usando a propriedade Index, usando condições e usando a função get_loc (). Além disso, discutimos como obter valores de índice de coluna usando a função get_loc ().