Pandas.Quadro de dados
Um quadro de dados de pandas pode ser criado usando o seguinte construtor:
Pandas.Dataframe (dados = nenhum, index = nenhum, colunas = nenhum, dtype = nenhum, cópia = false)Método: Usando o atributo de índice do DataFrame
Criamos um dicionário de dados com quatro teclas e depois convertemos esse dicionário de dados em dataframe usando a biblioteca de pandas, como mostrado abaixo:
No número da célula [4], apenas imprimimos esse DataFrame para ver como nosso DataFrame parece:
No número da célula [5], estamos exibindo qual índice real tem informações sobre o DataFrame. A saída mostra que o índice armazena os detalhes totais de linhas de quadro de dados na forma de intervalo, como mostrado acima na saída.
No número da célula [6], como já sabemos, o índice armazena a função de intervalo, que tem valores de 0 a 4 (o último valor não foi contado para que o loop funcione de 0 a 3). Portanto, iteramos o loop normalmente e, a cada iteração, ele irá para o nome de coluna específico que é mencionado como df ['nome'] e depois imprimirá o índice específico (número da linha) do valor dessa coluna.
Método: Usando a função LOC [] do DataFrame
Vamos primeiro entender o método LOC e ILOC. Criamos uma série_df (série) como mostrado abaixo no número da célula [24]. Em seguida, imprimimos a série para ver o rótulo do índice junto com os valores. Agora, no número da célula [26], estamos imprimindo a série_df.loc [4], que fornece a saída c. Podemos ver que o rótulo do índice em 4 valores é c. Então, temos o resultado correto.
Agora no número da célula [27], estamos imprimindo séries_df.Iloc [4], e obtivemos o resultado e que não é o rótulo do índice. Mas este é o local do índice que conta de 0 até o final da linha. Então, se começarmos a contar desde a primeira linha, então obtemos e no Localização do índice 4. Então, agora entendemos como esses dois LOC e ILOC similares trabalham.
Agora, vamos usar o .Método loc para iterar as linhas de um DataFrame.
No número da célula [7], apenas imprimimos o quadro de dados que criamos antes. Nós vamos usar o mesmo dados de dados para este conceito também.
No número da célula [8], como o rótulo do índice começa em zero (0), podemos iterar cada linha e obter os valores de cada rótulo de índice de cada coluna, conforme mostrado na imagem acima.
Método: Usando o método ITERROWS () do DataFrame
Vamos primeiro entender os iterrows () e ver como eles imprimem os valores.
No número da célula [32]: Criamos um DataFrame DF_TEST.
No número da célula [33 e 35]: Imprimos nosso DF_TEST para que possamos ver como fica. Em seguida, lidamos com o iterrows () e imprimimos a linha, que imprime todos os valores junto com seus nomes de colunas no lado esquerdo.
No número da célula [37], quando imprimimos a linha usando o método acima, obtemos os nomes das colunas no lado esquerdo. No entanto, quando mencionamos o nome da coluna, obtemos resultados como mostrados no número da célula [37]. Agora entendemos claramente que irá iterar emo.
No número da célula [9]: Acabamos de imprimir o quadro de dados que criamos antes. Nós vamos usar o mesmo dados de dados para este conceito também.
No número da célula [10]: Iteramos cada linha usando o iterrows () e imprimimos o resultado.
Método: Usando o método iterTUPLOS () do DataFrame
O método acima é semelhante ao iterrows (). Mas a única diferença é como acessamos os valores. No número da célula [11], podemos ver isso para acessar o valor da coluna em cada iteração. Estamos usando a linha. Nome (operador de ponto).
Método: Usando a função ILOC [] do DataFrame
Já explicamos antes de como o .Método ILOC funciona. Então agora, vamos usar esse método diretamente para iterar as linhas.
No número da célula [18]: Acabamos de imprimir o DataFrame, que criamos antes para este conceito.
No número da célula [19]: df.Iloc [i, 0], no qual pertenço ao local e ao próximo valor 0, que informa o índice do nome da coluna.
Método: itera sobre linhas e imprimir junto com seus nomes de colunas
No número da célula [20]: Acabamos de imprimir o DataFrame (DF), que criamos antes para entender o conceito.
No número da célula [21]: iteramos através do método itertuples (), que já explicamos. Mas se não mencionamos nenhuma outra informação, obtemos a saída junto com seus nomes de colunas.
Conclusão:
Hoje, aprendemos métodos diferentes para remar o iterado no quadro de dados do pandas. Também aprendemos sobre .loc e .Métodos Iloc e a estreita diferença entre eles. Também estudamos os métodos ITERROWS () e iterTUPLOS (). Também vimos o método de atributo de índice. Todos esses métodos acima têm suas respectivas vantagens e desvantagens. Então, podemos dizer que depende da situação que é o método quando tem que usar.