As colunas do quadro de dados, cada uma das quais podem conter um número inteiro, um número de ponto flutuante ou uma string, são representadas no nível da coluna porque contém numerosos índices, portanto, é padrão considerar o não valor. Consequentemente, derretemos as informações usando este nível de coluna. O nome da variável é uma representação do nome de variável específico usado para derreter colunas. Esse adaptável normalmente compreende um valor escalar e possui o valor padrão de não, porque usa a variável usada nessa coluna específica para derreter o quadro de dados.
A sintaxe para a função MELT ()
"Value_vars" são representações das colunas não pavimentadas existentes. A maioria das colunas é devolvida e não definida como "id_var" se os nomes das colunas não forem indicados. Uma tupla ou NDarray da lista pode ser usada como esses parâmetros de valor. Todas as seções usadas como variáveis de identificador são representadas pela variável "id_vars". O quadro de dados que deve ser alocado em pandas é indicado pelo quadro.
Exemplo # 1: Usando a função de fusão, você pode passar várias colunas como o parâmetro value_vars
Usando pandas em python, podemos reestruturar os dados em uma forma mais amiga do computador para simplificar o processamento de dados da tabela. A função imperativa “Melt ()” exige ser executada. Um DataFrame é sem.derretido()". Inicialmente, criamos nosso quadro de dados. DataFrame é usado para armazenar informações em um formato bidimensional. É idêntico a uma tabela nesse dia é armazenado em linhas e colunas. Os registros são representados por linhas e os recursos são representados por colunas.
Nesse caso, o nome de nosso quadro de dados é "d1", que possui três colunas. "Nome" é a primeira coluna em nosso quadro de dados e, além disso, incluído é uma lista de alguns nomes: "Thomas", "Lily" e "Henry". A segunda coluna que temos é "idade", que contém "25", "29" e "31". E na terceira coluna, "Profession", temos "engenheiro", "médico" e "contador". Usando “PD.DataFrame ”Vamos exibir o quadro de dados na tela.
Agora, vamos adicionar a função "Melt ()" ao nosso aplicativo. Os parâmetros "id ()" id "e" value var "foram usados. Para usar uma coluna ou colunas como variáveis de identificador, use "id _var" e o "value_var", que é o segundo parâmetro usado neste exemplo para definir onde o conteúdo seria derretido e armazenado nas linhas adicionais. Aqui, usamos um "int_var" em uma única coluna e um "value_var" em inúmeras colunas. Usamos "Value_var" nas colunas "Age" e "Profession" e "Id_var" na coluna "Nome". “Pd.Melt ”é usado para gerar o DataFrame e“ Print (DF_melted) ”exibirá o quadro de dados na tela.
Dois quadros de dados são visíveis na imagem de saída do programa. Usando o “PD.Função DataFrame ”, geramos o primeiro quadro de dados no qual temos três colunas“ nome ”,“ idade ”e“ profissão ”. Aplicando os parâmetros "id_var" e "value _var" ao "PD.MELT () ””, o segundo dataframe é gerado. "Id_var" é aplicado em uma única coluna que é "nome". Significa que a coluna será mostrada exatamente como é com seus valores e o "value_var" é usado em duas colunas "idade" e "profissão". Ele cria duas colunas no quadro de dados, uma é "variável" e a outra é "valor" na coluna de valor, o nome da coluna é exibido.
Uma ferramenta crucial que escolhe linhas e colunas específicas de dados de um quadro de dados é chamado de índice de pandas. Seu trabalho é configurar os dados para acesso rápido e organização. Também é descrito como um subgrupo. O valor individual do índice é referido como um rótulo e os valores são escritos em negrito no índice. O tamanho inicial do índice do quadro de dados é "3", que varia de "0 a 1" e quando os parâmetros são aplicados, o tamanho do índice é "6", que varia de "0 a 5".
Exemplo 2: Usando a função de fusão, você pode passar várias colunas como o parâmetro int_vars
Veja o que acontece quando você especifica mais de uma coluna para a opção id_vars. Semelhante ao último exemplo, este aplica "id_var" a várias colunas enquanto "value_var" é aplicado a uma única coluna. No programa anterior, "Value_var" foi aplicado a várias colunas enquanto "id_var" foi aplicado a uma única coluna.
A primeira coisa que fazemos é construir um quadro de dados de três colunas. O nome da coluna é "nome", "marcas" e "sujeito". Os nomes que estão na primeira coluna são "Ava", "Isla" e "Leo". Na segunda coluna, temos a lista de marcas "45", "22" e "31". Para a terceira coluna, temos o nome do assunto, incluindo "Gerenciamento", "OOP" e "Java". Agora, “PD.DataFrame ”gerará o DataFrame e“ Print (DF) ”exibirão o quadro de dados na tela.
Vamos agora incorporar o método "Melt ()" em nosso código. Os argumentos "id_var" e "value _var" da função "Melt ()" foram utilizados. O "id_var" é usado em duas colunas. "Nome" e "Marks" e "Value_var são usados em uma coluna" Assunto ". Para criar o novo DataFrame utilizando as informações do antigo DataFrame, use “PD.derretido". Agora, o DataFrame será mostrado na tela por “Print (DF derretido)”.
O resultado da função "Melt ()" com seus dois argumentos que são "id_var" e "value_var" é exibido na saída. Ao aplicar "id_var" nas duas colunas "nome" e "marcas", ele exibirá seus valores como é e, como aplicamos "value_var" na coluna "sujeito". Em seguida, é dividido nessas duas colunas "variável" e "valor". Na coluna "variável", mostra o nome da coluna "Assunto" e na coluna "Valor", mostra os valores da coluna "sujeito". O índice é "3" em magnitude, variando de "0 a 2".
Conclusão
O método "Melt ()" em pandas é uma maneira versátil de modificar o quadro de dados de pandas. Aprendemos como utilizar a função MELT () dos pandas para converter um Big Dataframe em um quadro de dados longo usando um caso de uso direto. Você deve reestruturar constantemente uma seção das peças em nosso material, mantendo pelo menos um segmento no lugar como indicadores. A função "Melt ()" em pandas é uma ferramenta fantástica para modificar dados. Se você gerenciar muitas informações econômicas e relacionadas ao dinheiro diversas e exigir de uma forma longa mais amigável ao banco de dados, é especialmente útil.