Cópia de pandas

Cópia de pandas
O Python é uma linguagem forte para análise de dados, principalmente devido ao forte ecossistema de ferramentas python centradas em dados. Pandas é uma daquelas ferramentas que facilitam os dados de importação e análise mais simples.

As estruturas de dados mais consideráveis ​​da biblioteca de pandas são dados de dados e séries. Internamente, essas estruturas de dados são definidas por matrizes de índice que rotulam os dados e matrizes de dados que armazenam os dados originais. Podemos fazer isso utilizando o Pandas “DataFrame.cópia () ”método.

Método de cópia de pandas

O método de cópia é empregado para copiar o quadro de dados especificado. Um quadro de dados pode ser copiado de duas maneiras: "cópia profunda" e "cópia rasa". O recurso "cópia profunda" cria um quadro de dados contendo uma cópia do conteúdo e índices do quadro de dados especificados. O método de “cópia rasa” gera um novo DataFrame sem copiar o conteúdo ou os índices do objeto de chamadas- apenas ponteiros para o conteúdo e o índice são copiados.

A sintaxe para o método de cópia é a seguinte:

"Deep" é um argumento booleano que determina se uma cópia profunda ou superficial deve ser feita. "Cópia profunda" é a configuração padrão do método. Defina o parâmetro "profundo" o valor "false" para permitir cópia superficial.

Vejamos a demonstração prática deste método.

Exemplo: Usando o Pandas Dataframe.cópia () método

Para a implementação, usamos a ferramenta "Spyder". Abra um novo arquivo python na ferramenta "Spyder". O requisito mais importante ao começar a escrever o script é importar bibliotecas relevantes. Como precisamos implementar um método "pandas", usamos "Importar pandas como PD" para acessar os recursos de "pandas". Então, começamos nosso código Python principal.

Criamos um DataFrame utilizando o “PD.DataFrame () ”Método. O DataFrame é inicializado por duas colunas "nome" e a "idade". Ambas as colunas do DataFrame armazenam o mesmo comprimento dos valores. A primeira coluna "Nome" tem cinco valores de string que são "Charlie", "Bush", "Harry", "Robert" e "Albert". A segunda coluna “Age” também armazena cinco valores com o INT Datatype que são “25”, “33”, “18”, “29” e “20”. Criamos uma variável "Demo" para armazenar o quadro de dados recém -construído.

Agora, podemos acessar nosso quadro de dados usando esta variável "demonstração". Usamos o método "print ()" para exibir o texto "DataFrame real". Em seguida, invocar outro método "print ()" para exibir o DataFrame.

Pressione o botão "Executar arquivo" na ferramenta "Spyder" para ver a saída no terminal. A tela resultante nos mostra um quadro de dados recém -criado com 2 colunas e um cabeçalho em cima dele.

Depois de conseguirmos isso, iniciaremos nossa principal tarefa no código Python. Para isso, utilizamos o Pandas “DataFrame.cópia () ”método. Nós invocamos o “.Copy () ”Método com o nome de nossa DataFrame“ Demo ”. Como queremos criar uma "cópia profunda" do DataFrame, usamos a função com seu valor padrão que é "Deep = True". Uma variável "Demo_Dcopy" é criada para armazenar a saída de chamar o ".cópia () ”método. Agora podemos acessar esta "cópia profunda" do quadro de dados real pela variável "Demo_dcopy". Empregamos a função "print ()" para exibir um texto "cópia profunda do DataFrame real:" e exibir conteúdo da variável "Demo_DCopy".

Se executarmos o código acima, dois quadros de dados serão exibidos no console. O primeiro é o quadro de dados real, enquanto o outro é a "cópia profunda" do quadro de dados real. Podemos ver que todo o conteúdo e índices do quadro de dados reais são copiados na "cópia profunda" dele.

Agora, vamos verificar o que acontece na "cópia profunda" se fizermos algumas alterações no quadro de dados reais. Para fazer algumas modificações, usamos a propriedade "ILOC", usada para localizar o índice especificado. Escreva o nome do DataFrame real "Demo" com o ".ILOC ”e especifique o local do índice“ [0, 1] = 3 ”, que localizará o primeiro valor da coluna“ Age ”no quadro de dados real e alterará para“ 3 ”. Invocamos novamente o método "Print ()" para exibir o quadro de dados real "Demo" com as alterações e a "cópia profunda" do quadro de dados real "Demo_dcopy" para ver se as alterações refletem nele ou não.

A saída no terminal mostra dois quadros de dados depois de modificar um valor no quadro de dados real. Você pode observar que a coluna de dados de dados real “Age” tem seu primeiro valor alterado de “25” para “3”. Enquanto a “cópia profunda” do quadro de dados real com modificação reflete as alterações, o que significa que as alterações feitas no quadro de dados reais não alteram a “cópia profunda” desse quadro de dados.

Agora vamos examinar o que acontece se construirmos uma "cópia superficial" do quadro de dados inicial.

Para esta ilustração, utilizamos o quadro de dados criado acima. Agora devemos fazer uma cópia superficial do quadro de dados real depois de imprimi -lo. Utilizamos o Pandas “DataFrame.Método cópia () ”novamente da mesma maneira que o usamos no exemplo de“ cópia profunda ”acima com uma exceção. Aqui, mudamos o valor da propriedade "profunda" para "false" para criar uma "cópia rasa" do quadro de dados real. Então, vamos escrever “demonstração.cópia (Deep = false) ” . Criamos uma variável "Demo_Scopy" para armazenar o resultado de chamar o ".Método cópia () ”, que será uma“ cópia rasa ”do quadro de dados real. Em seguida, utilizamos o método "print ()" para exibir o texto "cópia superficial do quadro de dados real:" e exibir o conteúdo armazenado na variável "Demo_Scopy".

A saída mostra 2 quadros de dados. O primeiro é o quadro de dados real, enquanto o outro é sua "cópia rasa". Podemos ver que tudo, desde o quadro de dados real, é copiado para a "cópia superficial" dele.

Agora exploramos o que aconteceria com a "cópia superficial" se fizermos algumas modificações no quadro de dados reais. Para isso, utilizamos o “DataFrame.ILOC ”Propriedade. Aqui queremos que a propriedade "ILOC" acesse o índice "3" da coluna "Age" no quadro de dados real e altere-a para "-5". Em seguida, a função "print ()" é invocada para exibir o texto "Dataframe real após a modificação:" e também para exibir o quadro de dados real "demonstração". Novamente, o método "print ()" é chamado para mostrar o texto "cópia superficial do DataFrame após a modificação:" e o conteúdo da variável "Demo_Scopy".

A saída mostra o quadro de dados real com um valor alterado "-5", onde o número do índice era "3". Depois de fazer as alterações na “demonstração” do quadro de dados, exibimos sua “cópia rasa”, que exibe as mesmas alterações que fizemos no quadro de dados real. Isso significa que quaisquer alterações feitas no quadro de dados reais também serão espelhadas em sua "cópia superficial".

Conclusão

Este tutorial é um guia para você entender o conceito e a ideia de fazer uma cópia de um DataFrame. Nós apresentamos você ao Pandas “DataFrame.cópia () ”método. Também explicamos as duas abordagens diferentes para copiar um quadro de dados: cópia profunda e cópia rasa.