Pandas DataFrame Loc

Shaun Bogan

Um formato de dados tabulares bidimensionais e potencialmente misto com eixos rotulados é chamado de "Dados de dados de pandas". Os rótulos de linha e campo estão alinhados com operações aritméticas. A principal estrutura de dados dos pandas é representada por isso. Para acessar um conjunto de linhas e colunas por índices ou uma matriz booleana, utilizamos o quadro de dados de pandas.Propriedade LOC. Sempre que queremos acessar qualquer linha ou coluna ou várias linhas e colunas, utilizamos o “DataFrame.loc () ”propriedade. Também podemos acessar apenas um valor da célula, determinando a etiqueta ou índice de linha e coluna neste “DataFrame.Método loc () ”. Este guia utiliza o “DataFrame.Método loc () e acessará a linha, qualquer coluna ou qualquer valor celular com este método.

Sintaxe:

# Quadro de dados.loc

Exemplo 1:

Ao executarmos o código dos pandas, primeiro importamos a função Pandas como "PD" no aplicativo "Spyder". Temos a função Pandas ou os métodos que precisamos usar "PD" no lugar de "pandas". Criamos um DataFrame aqui, que é o "menino_df". O "PD" é utilizado aqui porque o DataFrame é o método de "pandas". Colocamos o nome da coluna como o cabeçalho dessa coluna e colocamos os valores dentro de todas as colunas.

Aqui, a primeira coluna de "meninos_df" é "b_height", onde inserimos a altura dos meninos. Essas alturas são “5.5, 6.0, 5.7, 5.8, 5.4, 6 e 5.9 ”. A segunda coluna dos "meninos_df" é "b_name", que contém os nomes dos meninos. Os nomes dos meninos que inserimos aqui são “Sam, Rishi, Alexander, Robin, Thomas, Samuel e Taylor”. A próxima coluna que temos no "Boys_DF" é "B_AGE", que contém as idades dos meninos - "19, 25, 27, 18, 21, 22 e 28". Adicionamos três colunas no quadro de dados "boys_df".

Também definimos os valores do índice das linhas dos "meninos_df". Esses valores do índice são “R#1, R#2, R#3, R#4, R#5, R#6 e R#7”. Esses valores aparecem como o índice de cada linha porque definimos esses valores como “meninos_df.índice". Agora, mostramos este "meninos_df" no console. Usamos a função "print ()" aqui. Não aplicamos o quadro de dados.Método LOC ainda, então todo o quadro de dados é mostrado no console do Sypder.

Quando pressionamos o botão "Shift+ Enter", a saída que recebemos é mostrada aqui. Todas as colunas e linhas do quadro de dados aparecem na saída enquanto imprimimos todo o quadro de dados “meninos_df” aqui. Agora, aplicamos o DataFrame.Método LOC para este "meninos_df" que se segue:

Acabamos de colocar o nome do DataFrame e o método LOC como “meninos_df.loc ”. Acessamos apenas um valor dos meninos_df. Mencionamos o valor do índice da linha e o nome da coluna cujo valor queremos obter. Colocamos o "R#2", que é o valor do índice da linha e "b_name" como o nome da coluna. Então, o valor que aparece nesta célula é acessado. Armazenamos esse valor em "menino" e imprimimos esse valor no console.

O valor aparece na célula cujo índice de linha é "r#2". O nome da coluna "b_name" é exibido na tela do console. Temos esse valor "rishi" com a ajuda do "DataFrame.Método loc ”.

Exemplo 2:

Em nosso segundo exemplo, depois de importar os métodos "pandas" como "PD", fazemos um quadro de dados ao colocar o "PD.Quadro de dados". Este DataFrame é chamado "Customer_DF". Ele contém as colunas distintas que são “cust_name, cust_location, product_id e dic_per”. Todos esses são os nomes de cada coluna que criamos neste quadro de dados. Colocamos os nomes dos clientes na coluna "Cust_Name", que são "Joseph, Jacob, Edward, Ronica, Ryan, Simon, Nick, Patrick e John". Adicionamos a localização de cada cliente que é “Delhi, Banglore, Pune, Delhi, Baljiam, Birmingham, México, Canadá e Nova York” na coluna “cust_location”.

Depois vem a coluna “Product_id”, que contém o ID dos produtos como “B112, B1213, B2214, B1255, B1116, B797, B7620, B3490 e B2912”. A última coluna que temos no "Customer_DF" é "dis_per", onde inserimos a porcentagem do preço do desconto que é "2%, 3%, 10%, 5%, 4%, 1%, 7%, 8%, e 2%”. O DataFrame está concluído. Definimos o índice de linha inicializando a variável "index_" com os valores do índice. Esses valores variam de "R1 a R9", como mostrado.

Agora, adicione esses índices ao DataFrame, colocando o “Customer_DF.índice ”abaixo. Depois disso, exiba o "Customer_DF". Esses índices são inseridos nesse quadro de dados. Agora, precisamos acessar apenas duas colunas a partir deste DataFrame. Para isso, utilizamos o método "LOC" e colocamos os nomes de ambas as colunas que queremos acessar deste "Customer_DF". As colunas que acessamos aqui são "cust_name e dis_per". Armazene essas duas colunas na variável "Cliente". Exibir apenas as colunas que obtemos aplicando o método "loc".

Existem quatro colunas no quadro de dados, como mostrado na ilustração a seguir. Acessamos duas colunas deste quadro de dados, que também é exibido abaixo deste quadro de dados. Acessamos essas colunas com a ajuda do método "loc".

Exemplo 3:

Aqui, fazemos a lista aninhada chamada "Account_holder_list". Ele contém o "ah_country", que tem o nome do país. O "Account_holder" contém os nomes dos titulares de contas que são "Callahan, Finchley, Farnham, Fuller, Bromley, Coghill e Fuller". O "Account_NO" contém o número da conta dos titulares de contas que são "253448, 120849, 272450, 234525, 294439 e 201501".

Em seguida, adicionamos o "membro desde" onde adicionamos o mês e o ano dos membros como "junho de 2020, julho de 2021, maio de 2022, agosto de 2022, janeiro de 2022, maio de 2022, dezembro de 2021". Depois disso, criamos a coluna “New_amount” e inserimos os valores que são “US $ 180, US $ 260, US $ 190, US $ 550, US $ 450, US $ 320 e US $ 500”. Também adicionamos o índice como “R_1, R_2, R_3, R_4, R_5, R_6 e R_7”. Agora, convertemos o "Account_holder_list" para o "Account_holder_df", utilizando o método pandas. Ajuste os índices de linha para este "account_holder_df".

Renderizamos o "Account_holder_df". Depois disso, acessamos as linhas mencionando o alcance das linhas. Queremos obter quatro linhas que variam de “R_2: R_5”. Colocamos esse intervalo no método "loc". Ele acessa as linhas “R_2, R_3, R_4 e R_5”. Renderizá -los no console enquanto colocamos esse método na declaração de impressão.

Todo o DataFrame contém as linhas de "R_1" para "R_7". Como você pode ver, ele acessa apenas quatro linhas abaixo deste quadro de dados cuja faixa é mencionada no método "loc". Também renderiza aquelas linhas aqui no console. O mesmo assim, também podemos acessar as colunas mencionando o alcance das colunas no método "loc".

Conclusão

Este guia está escrito para você para que você aprenderá como esse método "loc" funciona e como utilizar esse método "loc" em pandas. Explicamos esse método "loc" em detalhes e fornecemos uma demonstração prática do método "loc", utilizando esse método em nosso código de pandas. Mostramos a saída junto com o script de código. Discutimos que o método "loc" nos ajuda a acessar a linha ou coluna ou qualquer valor. Esperamos que este guia seja fácil para você aprender e entender, pois todos os conceitos e códigos são explicados aqui detalhadamente.

Docker

Qual é o objetivo de um docker-compor.Arquivo YML no Docker?

O principal objetivo de um “Docker-Compose.O arquivo YML ”é para simplificar o processo de implantaç...

Shaun Bogan

Windows OS

Qual é a diferença entre o Windows Top 10 Home e Pro

A versão Pro é para usuários profissionais e possui mais ferramentas administrativas, enquanto a ver...

Evan Mueller

Pitão

Histograma Matplotlib 2D

Em Python, o “PLT.A função hist2d () ”do módulo“ PyPlot ”na biblioteca“ matplotlib ”é usada para plo...

Carl Hintz DDS