Pandas DataFrame Slice

Pandas DataFrame Slice
“A Biblioteca Open_source que“ Python ”fornece é a biblioteca“ pandas ”. Ao usar métodos "pandas", podemos executar várias tarefas facilmente. Isso nos ajuda muito a realizar várias tarefas, como isso nos ajuda a analisar e manipular dados. Também podemos fazer os quadros de dados e aplicar muitas funções que os "pandas" fornecem a esses quadros de dados. Quando criamos o DataFrame e, depois de criar o DataFrame, precisamos cortar esse quadro. Portanto, para cortar o quadro de dados, utilizamos diferentes métodos que os "pandas" fornecem. Podemos cortar as linhas de um quadro de dados, bem como colunas. Este guia fornecerá informações detalhadas sobre o fatiamento em "pandas" e discutirá os métodos que podemos utilizar para cortar o quadro de dados.”

Métodos para cortar o DataFrame

Os métodos que ajudam a cortar as colunas e linhas do quadro de dados são as seguintes:

  • Quadro de dados.Método loc.
  • Quadro de dados.Método ILOC.

Utilizaremos os dois métodos em nossos códigos aqui e cortaremos as colunas, bem como as linhas do quadro de dados e também dará uma explicação detalhada de todos os conceitos aqui neste guia.

Exemplo # 01
Devemos precisar de qualquer software ou ferramenta para executar os códigos, então aqui usamos a ferramenta "Spyder" para esses códigos "pandas". Os módulos de "pandas" são importados primeiro. Então, colocamos a palavra -chave “importar” e importamos os módulos de “Pandas como PD.”Depois disso, devemos adicionar o quadro de dados aqui, para que corteemos o quadro de dados mais tarde. O DataFrame aqui é "Syllabus_df" e você sabe que adicionamos algumas colunas e linhas ao DataFrame.

A primeira coluna que vamos acrescentar aqui é a coluna “Exercício_no” na qual inserimos o número do exercício, e esses números são “Ex# 1.1, ex# 1.2, ex# 1.3, ex# 1.4, ex# 2.1, ex# 2.2, ex# 2.3, ex# 3.1 e ex# 3.2 ”. Em seguida, adicionamos a coluna “Unit_no”, que contém “Unidade 1, Unidade 1, Unidade 1, Unidade 1, Unidade 2, Unidade 2, Unidade 2, Unidade 3 e Unidade 3”. A coluna “Class_period” está agora à frente, que tem “2º período, 1º período, 4º período, 1º período, 5º período, 7º período, 2º período, 3º período e 4º período”. Mais uma coluna é adicionada, que é nomeada "Class_days", e também inserimos os dias nela, que são "segunda, terça, quinta, sábado, quarta -feira, segunda -feira, terça, quinta -feira, sábado.”

Em seguida, feche os colchetes do DataFrame aqui porque o DataFrame está concluído aqui. Agora, temos que mostrar esse quadro de dados, por isso usamos o "print ()", o que ajuda a exibir esse quadro de dados. Nós executamos este código e você verá como esse DataFrame parece.

Agora precisamos executar este código. Portanto, clicamos no ícone "Executar" desta ferramenta para executá -lo enquanto operamos na ferramenta "Spyder". Depois disso, o quadro de dados é renderizado no resultado que se segue. O DataFrame contém nove linhas e quatro colunas. Agora, vamos cortar esse quadro de dados usando o método "pandas".

Usamos o método "loc" neste código e adicionamos os nomes dessas colunas que queremos cortar do quadro de dados. Aqui estamos cortando três colunas, “Exercício_no, unit_no e Class_dayss”, usando o DataFrame, e essas três colunas são salvas em “Syllabus_df2”, que também é colocado na “impressão”, então depois de cortar as colunas do Dataframe, o colunas fatiadas também são renderizadas no terminal.

Apenas três colunas são exibidas aqui enquanto cortamos essas colunas do quadro de dados usando "loc" e as exibir.

Exemplo # 02
Um DataFrame com o nome "Ex_Patient_Detail" e os campos "Doutor, Pacientes, Doença e 1st_visit_month" é gerado. A coluna "Doctor" contém os nomes do médico "DR. Smith, dr. Oscar, dr. Bromley, dr. Peter, dr. Albert, dr. Taylor, dr. Feijão e dr. Jayden "o paciente nomeia“ Megan, Jack, Jessica, Thomas, Sophie, Callum, Lewis, Liam ”são colocados no campo“ Pacientes ”. Em seguida, entramos em “doença” com os seguintes nomes “Problema cardíaco, infecção nos pulmões, infecção cerebral, problemas cardíacos, pressão arterial, infecção intestinal, danos nas pernas e problema nos rins.Também incluímos os meses de visita dos pacientes, que são “janeiro, janeiro, fevereiro, março, maio, julho, setembro e dezembro.”

A lista "Ex_Patient_Detail" é então convertida em "Ex_patient_df", que é o quadro de dados nesta instância. O "ex_patient_df" é então impresso e, após a impressão, passamos a usar o método "LOC", que ajuda na fatia da coluna. Os critérios que fornecemos aqui precisam cortar a coluna de um quadro de dados. Cortamos o quadro de dados da coluna "Pacientes" para a última coluna. Depois disso, exibimos as colunas fatiadas.

O primeiro dataframe mostra quatro colunas, mas depois cortamos as colunas desse quadro de dados dos "pacientes" e abaixo do DataFrame, a primeira coluna é a coluna "Pacientes" porque a cortemos da coluna "Pacientes" até o fim.

Exemplo # 03
O quadro de dados acima é novamente utilizado aqui, e estamos cortando esse quadro de dados de maneira diferente. Aqui estamos cortando o quadro de dados desde o início e termina na coluna "doença". Como mostrado abaixo, mencionamos que, no método "loc", corte a coluna desde o início do quadro de dados até a coluna "Doença". Este método “loc” cortará as colunas desse quadro de dados de acordo, conforme mencionado nesse método.

No DataFrame, que aparece após o fatiamento, você pode ver que ele exibe colunas da coluna iniciante do quadro de dados e termina na coluna "Doença" porque mencionamos isso no método "loc" no código.

Exemplo # 04
Agora, cortaremos as linhas neste exemplo, utilizando o método "ILOC". O "futeboler_list" é criado primeiro no qual adicionamos "William, 41, 78 e 5367000", que aparecerá como a primeira linha do DataFrame depois de converter esta lista no quadro de dados. Em seguida, inserimos "James, 31, 75 e 345700"; Depois disso, adicionamos “Jessica, 38, 70, 9867000”, “Grace, 34, 80, 390000”, “Liam, 40, 100, 4548000”, “Callum, 33, 72, 7028000” e também “Ryan, 42 , 85, 2528000 ”, que aparecerá como a terceira, quarta, quinta, sexta e sétima fila, respectivamente, no quadro de dados, pois alteramos essa lista no quadro de dados e também definimos os nomes da coluna que“ f_name, f_age, f_weight e f_salary.”

Então o DataFarme também é renderizado aqui. Agora, estamos cortando as linhas deste DataFrame de "futebolista", colocando alguns valores no método "ILOC". Colocamos "1: 5", o que significa que ele cortará as linhas da linha "índice 1" para a linha "Index 5". Então, cinco linhas serão aparecendo depois de cortar as linhas de um quadro de dados. Inicializamos o "futeboler_df1" com este método "ILOC", então as linhas que cortamos usando esse método armazenam nessa variável. Em seguida, utilizamos novamente o "print ()" e colocamos o "futeboler_df1" nele, para que as linhas fatiadas imprimam no terminal.

O DataFrame, antes de aplicar o método "ILOC", mostra todas as colunas e todas as linhas do DataFrame. Em seguida, cortemos as linhas desse quadro de dados usando o método "ILOC", e abaixo das linhas fatiadas também são renderizadas a partir do índice 1 ao índice 5, que colocamos no método "ILOC".

Conclusão

O objetivo de escrever este guia é dar uma descrição detalhada do conceito "DataFrame Slice" em "Pandas."Discutimos dois métodos," LOC "e" ILOC ", neste guia que ajudam a cortar as linhas, bem como as colunas do quadro de dados especificado. Utilizamos os dois métodos nos códigos "pandas" neste guia e também cortou as colunas em um exemplo e as linhas no outro exemplo. Já explicamos como cortamos as linhas e também as colunas do quadro de dados neste guia. Fizemos vários códigos neste guia, juntamente com a explicação e saídas de cada código.