PANDAS SET INDEX

PANDAS SET INDEX
A função "set_index" de pandas é usada para definir o quadro de dados ou a série como a chave de um quadro de dados. A função "set_index ()" de pandas cria o índice de dados de dados alavancando colunas pré -existentes. O índice pode substituir ou expandir o presente índice.

A sintaxe para este método é a seguinte:

O primeiro parâmetro "Keys" classifica o nome da coluna que queremos definir como o índice. O atributo "Append" adiciona a coluna fornecida quando o valor do índice é definido como true. O parâmetro "gota" cai as colunas. Seu valor padrão é "verdadeiro". O "inplace", quando valorizado como "verdadeiro", faz as alterações no quadro de dados originais e não cria nenhuma cópia dele. O último parâmetro "Verify_integrity" verifica a duplicação do novo índice de coluna.

Aprenderemos a execução prática deste método através de várias técnicas neste artigo.

Exemplo # 1: Utilizando o método set_index () para alterar a coluna do índice

Esta demonstração elaborará o uso dos pandas “df.Método set_index () ”para alterar a lista de índices padrão em um quadro de dados para uma coluna de índice definida pelo usuário.

A ferramenta "Spyder" é lançada para começar a trabalhar na compilação e execução do script. Primeiro carregamos as bibliotecas necessárias no programa. O pacote que precisávamos aqui é o "pandas". Então, nós importamos como "PD".

Geramos um DataFrame empregando o método Pandas “PD.Quadro de dados()". Você tem a opção de importar um arquivo CSV ou criar um DataFrame usando o “PD.DataFrame () ”Método. O “PD.DataFrame () "Função Invocada com 4 colunas" EMP_NAME "," Experiência "," Renda "e" Bônus ". Cada coluna está armazenando 11 valores.

Temos valores para a coluna "EMP_NAME" como "A" "," B "," C "," D "," E "," F "," G "," H "," I "," J ", e "K". As entradas para a coluna "Experiência" são "5", "2", "17", "21", "9", "20", "11", "32", "23", "14" e “30”. A terceira coluna que temos é "renda" que está armazenando esses valores "40000", "30000", "100000", "50000", "40000", "70000", "200000", "95000", "60000", "27000" e "98000". A coluna "bônus" está mantendo esses valores "30000", "40000", "60000", "30000", "86000", "50000", "60000", "95000", "76000", "27000" e “78000”.

O “PD.O método de dataframe () ”construirá um quadro de dados com esses valores fornecidos. Para armazenar o DataFrame, criamos um objeto DataFrame "Record". Nós atribuímos a saída de chamar o “PD.DataFrame () ”função. Por fim, o conteúdo é exibido no console exercitando a função "print ()" de Python.

Quando executamos o programa Python clicando na opção "Run File", vemos um DataFrame com 4 colunas e 11 linhas. Este DataFrame foi exibido com a lista de índices padrão que começa de "0" e sobe para o comprimento do DataFrame.

Você pode precisar alterar a coluna do índice do DataFrame às vezes. Aqui vamos aprender a alterar a coluna do índice em um quadro de dados usando o “df.Método set_index () ”. Ao usar este método, alteraremos a coluna de índice padrão com uma coluna existente no DataFrame fornecido.

Nós invocamos o “df.Método set_index () ”. O nome do DataFrame é fornecido como "registro" com a função "set_index ()". Entre os parênteses desta função, fornecemos o nome da coluna que precisamos definir como a coluna do índice no quadro de dados resultantes. A coluna que mencionamos é "emp_name". Portanto, o método "Set_Index ()" analisará o quadro de dados "Record", encontre a coluna rotulada como "EMP_NAME" e a definirá como a coluna do índice depois de soltar a coluna do índice padrão. O resultado é salvo na variável "Configuração". Com a ajuda da função "print ()", exibimos na tela.

A coluna de índice do quadro de saída de saída é alterada da lista padrão para o "EMP_NAME". A saída resultante é fornecida na imagem abaixo.

Exemplo # 2: Utilizando o método set_index () para alterar o índice para várias colunas de índice

Ao alterar o índice do DataFrame, podemos definir ainda mais de uma coluna como os índices do DataFrame. Vamos explorar o conceito através do programa Python.

Para esta ilustração, usamos o quadro de dados criado no exemplo anterior. O “df.o método set_index () ”é invocado. Chamamos a função com os seguintes parâmetros: "Keys", "Inplace", "Append" e "Drop". As chaves do índice que fornecemos aqui são "emp_name" e "renda". Duas colunas foram selecionadas porque precisamos definir mais de uma coluna como os índices no quadro de dados. O parâmetro "inplace" é definido "true", o que significa que as chances serão feitas no quadro de dados real sem criar nenhuma cópia.

Definimos o valor "True" para o atributo "Apêndos". Manter isso verdadeiro anexará as novas colunas de índice com a coluna de índice já existente ou padrão. A última propriedade que usamos aqui é "cair" com o valor "false". Portanto, não soltará as colunas que definimos para o índice do DataFrame. Como as mudanças são preferidas para serem feitas no quadro de dados reais, para que não precisemos criar nenhum objeto. Simplesmente imprimir o quadro de dados real depois de definir o índice nos exibirá as alterações. Empregamos a função "print ()" para mostrar o resultado.

Nosso quadro de dados real atualizado é exibido, que possui uma coluna de índice padrão, bem como as duas colunas de índice recém -especificadas como "emp_name" e "renda".

Exemplo # 3: Utilizando o método set_index () para alterar a coluna do índice com a coluna Valor Float

Também podemos alterar a coluna do índice padrão e definir uma coluna Float como o indexador no DataFrame. Veremos sua implementação prática aqui.

Temos que primeiro criar uma coluna com valores de flutuação no quadro de dados. O quadro de dados da primeira instância é novamente usado, exceto os valores na coluna "bônus" estão flutuando agora. Fornecemos esses valores para a coluna "bônus": "30.87 ”,“ 40.16 ”,“ 60.98 ”,“ 30.87 ”,“ 86.32 ”,“ 50.92 ”,“ 60.11 ”,“ 95.12 ”,“ 76.24 "," 27.35 "e" 78.52 ”. Em seguida, imprimimos o quadro de dados atualizado usando a função "print ()".

O DataFrame com a coluna "bônus" atualizada é exibida.

Invocamos o “df.Método set_index () ”e defina a coluna da chave do índice como“ bônus ”. O parâmetro "inplace" é valorizado como "verdadeiro". Portanto, as alterações serão feitas no quadro de dados real.

A coluna Float é definida como a coluna de índice no quadro de dados que pode ser visto na imagem abaixo.

Exemplo # 4: Utilizando o método set_index () para definir o MultiIndex na cópia do DataFrame

Podemos definir o MultiIndex no quadro de dados usando o método "set_index ()". O método "set_index" é invocado com o nome do DataFrame "Record". Dentro dos aparelhos redondos, inicializamos o operador subscrito e definimos os nomes das colunas como "emp_name" e "experiência". Aqui, preferimos executar a função com as configurações padrão em que "inplace" é definido como "false". Manipulações serão realizadas na cópia do DataFrame.

Para armazenar esta cópia de DataFrame, criamos uma variável "Multi_Index". Finalmente, exibimos o conteúdo da cópia do DataFrame armazenado na variável "multi_index" usando a função "print ()".

Isso nos dá o seguinte resultado:

Conclusão

Nesta sessão de aprendizado, demonstramos a necessidade de alterar a coluna do índice em um quadro de dados. Pandas forneceu o método “df.set_index ”é utilizado neste tutorial para alcançar o resultado desejado. Fornecemos a sintaxe para empregar esta função com uma breve descrição dos parâmetros. Todas as técnicas para exercer a função "set_index ()" são praticamente implementadas na ferramenta Spyder. Podemos utilizar o método de acordo com nossa necessidade de que queremos definir uma única coluna como uma chave de índice ou várias colunas.