Como iterar sobre linhas em um quadro de dados em pandas

Como iterar sobre linhas em um quadro de dados em pandas
Iteração é um método que nos ajuda a atravessar todos os valores. Nos pandas, quando criamos um quadro de dados, sempre precisamos acessar os valores e onde a iteração ajuda. Então, neste artigo, vamos revisar diferentes métodos para a iteração de DataFrame Row-Wise.

Pandas.Quadro de dados

Um quadro de dados de pandas pode ser criado usando o seguinte construtor:

Pandas.Dataframe (dados = nenhum, index = nenhum, colunas = nenhum, dtype = nenhum, cópia = false)

Método: Usando o atributo de índice do DataFrame

Criamos um dicionário de dados com quatro teclas e depois convertemos esse dicionário de dados em dataframe usando a biblioteca de pandas, como mostrado abaixo:

No número da célula [4], apenas imprimimos esse DataFrame para ver como nosso DataFrame parece:

No número da célula [5], estamos exibindo qual índice real tem informações sobre o DataFrame. A saída mostra que o índice armazena os detalhes totais de linhas de quadro de dados na forma de intervalo, como mostrado acima na saída.

No número da célula [6], como já sabemos, o índice armazena a função de intervalo, que tem valores de 0 a 4 (o último valor não foi contado para que o loop funcione de 0 a 3). Portanto, iteramos o loop normalmente e, a cada iteração, ele irá para o nome de coluna específico que é mencionado como df ['nome'] e depois imprimirá o índice específico (número da linha) do valor dessa coluna.

Método: Usando a função LOC [] do DataFrame

Vamos primeiro entender o método LOC e ILOC. Criamos uma série_df (série) como mostrado abaixo no número da célula [24]. Em seguida, imprimimos a série para ver o rótulo do índice junto com os valores. Agora, no número da célula [26], estamos imprimindo a série_df.loc [4], que fornece a saída c. Podemos ver que o rótulo do índice em 4 valores é c. Então, temos o resultado correto.

Agora no número da célula [27], estamos imprimindo séries_df.Iloc [4], e obtivemos o resultado e que não é o rótulo do índice. Mas este é o local do índice que conta de 0 até o final da linha. Então, se começarmos a contar desde a primeira linha, então obtemos e no Localização do índice 4. Então, agora entendemos como esses dois LOC e ILOC similares trabalham.

Agora, vamos usar o .Método loc para iterar as linhas de um DataFrame.

No número da célula [7], apenas imprimimos o quadro de dados que criamos antes. Nós vamos usar o mesmo dados de dados para este conceito também.

No número da célula [8], como o rótulo do índice começa em zero (0), podemos iterar cada linha e obter os valores de cada rótulo de índice de cada coluna, conforme mostrado na imagem acima.

Método: Usando o método ITERROWS () do DataFrame

Vamos primeiro entender os iterrows () e ver como eles imprimem os valores.

No número da célula [32]: Criamos um DataFrame DF_TEST.

No número da célula [33 e 35]: Imprimos nosso DF_TEST para que possamos ver como fica. Em seguida, lidamos com o iterrows () e imprimimos a linha, que imprime todos os valores junto com seus nomes de colunas no lado esquerdo.

No número da célula [37], quando imprimimos a linha usando o método acima, obtemos os nomes das colunas no lado esquerdo. No entanto, quando mencionamos o nome da coluna, obtemos resultados como mostrados no número da célula [37]. Agora entendemos claramente que irá iterar emo.

No número da célula [9]: Acabamos de imprimir o quadro de dados que criamos antes. Nós vamos usar o mesmo dados de dados para este conceito também.

No número da célula [10]: Iteramos cada linha usando o iterrows () e imprimimos o resultado.

Método: Usando o método iterTUPLOS () do DataFrame

O método acima é semelhante ao iterrows (). Mas a única diferença é como acessamos os valores. No número da célula [11], podemos ver isso para acessar o valor da coluna em cada iteração. Estamos usando a linha. Nome (operador de ponto).

Método: Usando a função ILOC [] do DataFrame

Já explicamos antes de como o .Método ILOC funciona. Então agora, vamos usar esse método diretamente para iterar as linhas.

No número da célula [18]: Acabamos de imprimir o DataFrame, que criamos antes para este conceito.

No número da célula [19]: df.Iloc [i, 0], no qual pertenço ao local e ao próximo valor 0, que informa o índice do nome da coluna.

Método: itera sobre linhas e imprimir junto com seus nomes de colunas

No número da célula [20]: Acabamos de imprimir o DataFrame (DF), que criamos antes para entender o conceito.

No número da célula [21]: iteramos através do método itertuples (), que já explicamos. Mas se não mencionamos nenhuma outra informação, obtemos a saída junto com seus nomes de colunas.

Conclusão:

Hoje, aprendemos métodos diferentes para remar o iterado no quadro de dados do pandas. Também aprendemos sobre .loc e .Métodos Iloc e a estreita diferença entre eles. Também estudamos os métodos ITERROWS () e iterTUPLOS (). Também vimos o método de atributo de índice. Todos esses métodos acima têm suas respectivas vantagens e desvantagens. Então, podemos dizer que depende da situação que é o método quando tem que usar.