Indexação do quadro de dados de pandas

Indexação do quadro de dados de pandas
Nos pandas, a indexação envolve a escolha de colunas e linhas de dados específicas de um dataframe. Escolher todas as linhas e até algumas das colunas, parte das linhas e todas as colunas, ou algumas das linhas e colunas é o que a indexação implica. A seleção de subconjuntos é outro nome para indexação. Quando construímos um objeto Pandas Dataframe em Python usando o PD.Função DataFrame () do módulo Pandas, um endereço nos índices de linha ou coluna é produzido automaticamente para simbolizar cada elemento de dados/ponto dentro do quadro de dados. No entanto, os índices de linha são o índice do quadro de dados, enquanto os índices de coluna são simplesmente chamados de colunas. O índice de um objeto Pandas Dataframe identifica essencialmente certas linhas. Vamos dar uma olhada em como alterar o objeto DataFrame de índice do Panda.

Exemplo 1

A opção de índice no Python pode ser usada para definir o índice de um quadro de dados como está sendo criado. Vamos gerar uma lista e passar para o PD.Parâmetro de índice do método dataframe (). Vamos colocar isso em prática com o código Python. Nós importamos o módulo pandas aqui. Depois disso, fizemos um dicionário e uma lista de Python. O dicionário foi usado para iniciar o desenvolvimento de dados de dados. Como você pode ver, usamos a função DataFrame com o parâmetro de índice para tornar a coluna "RR" o índice.

importar pandas como PD
dd = 'nome': ['Alex', 'ramen', 'zayn', 'travis', 'scott'],
'Marcas': [33, 66, 88, 67, 78],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
rr = [1, 2, 3, 4, 5]
ff = pd.Dataframe (dd, index = rr)
Impressão (FF)

Veja a saída na imagem a seguir.

Exemplo 2

No Python, podemos usar vários métodos para fazer o índice de qualquer coluna ou colunas existentes de um objeto Pandas Dataframe. Nesse cenário, usaremos o argumento do Método Set Index () do Module () do Módulo Python Pandas. O argumento no local é definido como false por padrão. No entanto, definiremos o valor do local como verdadeiro neste caso. A coluna existente passou para o PD.Método set index () como o novo índice substitui o antigo índice do quadro de dados. Vamos ver como isso funciona.

importar pandas como PD
dd = 'nome': ['Alex', 'ramen', 'zayn', 'travis', 'scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
ff = ff.set_index ('rollnum')
print ("\ nfinal DataFrame:")
Impressão (FF)

A saída é dada na captura de tela a seguir.

Exemplo 3

Nesse caso, usaremos o argumento de queda da função Set Index () do módulo Python Pandas. No entanto, definiremos o argumento de queda como falso neste caso. Para que o DataFrame não perca a coluna que foi atribuída como o novo índice. Vamos definir isso na prática com o código abaixo.

importar pandas como PD
dd = 'rollnum': ['1', '2', '3', '4', '5'],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78]
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
ff = ff.set_index ('nome', solt = false)
print ("\ nfinal DataFrame:")
Impressão (FF)

Aqui está o resultado.

Exemplo 4

Ao criar uma lista de nomes de colunas de dados e passá -lo para a função Set Index (), podemos definir várias colunas do objeto Pandas Dataframe, como seu índice. Como resultado, o índice é chamado de multi-índice nesse cenário.

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
ff = ff.set_index (['rollnum', 'nome']))
print ("\ nfinal DataFrame:")
Impressão (FF)

Aqui você pode ver a saída do código dado acima.

Exemplo 5

Várias técnicas podem ser usadas para definir a posição do objeto Pandas Dataframe para qualquer objeto Python, como uma lista, intervalo ou até série. Usando o PD.Funções Index (), Set Index () e Range (), podemos definir o índice do objeto DataFrame (Pandas) nesta abordagem. Primeiro, usaremos a função range () para construir uma sequência python de inteiros, que enviaremos para o PD.Índice () função. Este método produz o objeto de índice do DataFrame. O objeto de índice de DataFrame devolvido é então definido como o novo índice do DataFrame usando a função Set Index (). Vamos implementar este código.

importar pandas como PD
dd = 'rollnum': [1, 2, 3],
'Nome': ['Alex', 'Ramen', 'Zayn'],
'Marcas': [33, 66, 88],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago']
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
my_list = ['i', 'ii', 'iii']
idx = pd.Índice (my_list)
ff = ff.set_index (idx)
print ("\ nfinal DataFrame:")
Impressão (FF)

Veja a saída abaixo.

Exemplo 6

O índice do objeto Pandas Dataframe pode ser definido usando o set índice () e PD.Métodos Index (). Começaremos criando uma lista de Python, que enviaremos para o PD.Índice () função. Esta função fornecerá um objeto de índice de quadro de dados. O objeto de índice de DataFrame devolvido é então definido como o novo índice do DataFrame usando a função Set Index ().

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
indx = pd.Índice (intervalo (1, 6, 1))
ff = ff.set_index (indx)
print ("\ nfinal DataFrame:")
Impressão (FF)

O resultado é apresentado na captura de tela em anexo.

Exemplo 7

Usando o PD.Funções da série () e Set Index (), podemos definir o índice do objeto DataFrame dos pandas no método anterior. Gerar uma lista e passar para o PD.A função Série () retornará uma série de pandas que pode ser utilizada como o objeto de índice de dataframe. A série Pandas resultante é passada para o método Set Index (), que o define como o novo índice do DataFrame. Vamos ver o seguinte código e entender como isso funciona.

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Cidade': ['Nova York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ Ninitial Dataframe:")
Impressão (FF)
ser_indx = pd.Série ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
print ("\ nfinal DataFrame:")
Impressão (FF)

Aqui você pode ver a saída.

Conclusão

Indexação é o processo de seleção de valores de linhas e colunas específicas em um quadro de dados. Podemos escolher todas as linhas e algumas colunas ou linhas e todas as colunas usando a indexação. Esta sessão discutiu tópicos como o que é o índice e como você pode definir o índice enquanto gera um DataFrame, como você pode definir as colunas de dados de dados existentes como um índice ou mesmo multi-índice e como você pode definir objetos python como intervalo, listar, listar, ou até série como um índice.