Conte o número de linhas e colunas em um DataFrame

Conte o número de linhas e colunas em um DataFrame

Para executar a análise adequada, precisamos contar o número de linhas e colunas, porque elas podem nos ajudar a conhecer a frequência ou ocorrência de seus dados.

Neste artigo, veremos cinco tipos diferentes de maneiras que podem nos ajudar a contar o número total de linhas e colunas usando a Biblioteca Pandas.

  1. Usando o método de forma
  2. Usando o LEN (DF.eixos) método
  3. Usando o DataFrame.Índice (linhas) e DataFrame.colunas
  4. Usando o método usando DF.info ()
  5. Usando o método usando DF.contar()

Método 1: Usando o método de forma

O primeiro método para calcular as linhas e colunas é o método de forma. Como sabemos, o método de forma é usado para obter a altura e a largura da tabela. A forma nos dá o resultado em forma de tupla com dois valores. Nesses dois valores, o primeiro valor da tupla pertence à altura e o outro valor (segundo valor) pertence à largura da tabela.

Portanto, a mesma técnica também pode ser usada no quadro de dados, porque o próprio DataFrame é uma tabela que possui linhas e colunas.

  • No número da célula [1]: Importar a biblioteca de pandas como PD.
  • No número da célula [2]: Criamos um objeto Dict (Dictionary) e depois convertemos esse objeto Dict em um DataFrame usando a Biblioteca Pandas.
  • No número da célula [3]: Imprimos o ditado convertido em dataframe (df).
  • No número da célula [4]: Nós apenas imprimimos a forma para verificar qual valor ele armazena. Temos valores iguais a linhas (4) e colunas (3).
  • No número da célula [5]: Então, agora podemos imprimir o número de linhas do DF (DataFrame) usando a forma [0] que pertence ao primeiro valor da tupla e colunas usando a forma [1] que pertence ao segundo valor da tupla. O mesmo individualmente imprimimos o resultado no número da célula [6] para linhas e colunas no número da célula [7].

Método 2: Usando o LEN (DF.eixos) método

O próximo método que vamos usar é o df.Método dos eixos. O df.o método dos eixos é um pouco semelhante ao método de forma. Mas a principal diferença é que o método de forma fornecerá resultados diretos das linhas e colunas em forma de tupla. Mas o df.eixos se imprimirmos como mostrado no número da célula [52] abaixo, que armazena os valores do índice das linhas e colunas.

  • No número da célula [50]: Criamos um objeto Dict (Dictionary) e depois convertemos esse objeto Dict em um DataFrame usando a Biblioteca Pandas.
  • No número da célula [51]: Imprimos o ditado convertido em dataframe (df).
  • No número da célula [52]: Nós imprimimos o DF.eixos para ver o que eles armazenam valores. Podemos ver o DF.Os eixos armazenam os valores do índice das linhas e colunas.
  • No número da célula [53]: Agora, contamos o número de linhas usando o LEN (df.eixos [0]) Método como mostrado acima. O valor 0 pertence ao índice de linha.
  • No número da célula [54]: Calculamos o número de colunas usando o LEN (df.eixos [1]). O valor 1 pertence ao índice da coluna.

Método 3: Usando o DataFrame.Índice (linhas) e DataFrame.colunas

O próximo método que vamos usar é DataFrame.Índice (linhas) e DataFrame.colunas. Este método também é semelhante ao método acima (df.eixos) que já discutimos. Mas para buscar as linhas e colunas, o caminho é diferente, que você verá abaixo.

  • No número da célula [55]: Criamos um objeto Dict (Dictionary) e depois convertemos esse objeto Dict em um DataFrame usando a Biblioteca Pandas.
  • No número da célula [56]: Imprimos o ditado convertido em dataframe (df).
  • No número da célula [57]: Nós imprimimos o DF.índice para ver o que eles têm valores. Descobrimos pelo resultado que o df.o índice tem toda a contagem de índices do início ao fim da linha.
  • No número da célula [58]: Nós imprimimos o DF.colunas e descobriram que ele tem todos os nomes de colunas.
  • No número da célula [59]: Em seguida, calculamos o índice (linhas) usando o LEN (df.ÍNDICE) Método como mostrado acima no número da célula [59] e atribua o valor a uma linha variável. E similar, fazemos a contagem para as colunas e atribuímos esse valor a outra variável cols.
  • No número da célula [60]: Imprimos as duas variáveis ​​(linhas e cols) e obtemos o resultado 4 e 3, respectivamente.

Método 4: Usando o método usando DF.info ()

O próximo método que vamos discutir para contar as linhas e colunas é DF.info (). Este método é um pouco complicado, o que significa que você não receberá as linhas e colunas, pois vimos resultados no método anterior diretamente. A razão por trás disso é que, quando executamos esse método, obtemos os valores de linhas e colunas junto com outras informações do quadro de dados, como você verá no resultado abaixo.

  • No número da célula [61]: Criamos um objeto Dict (Dictionary) e depois convertemos esse objeto Dict em um DataFrame usando a Biblioteca Pandas.
  • No número da célula [62]: Imprimos o ditado convertido em dataframe (df).
  • No número da célula [63]: Nós imprimimos o DF.info () e obteve todas as informações sobre o quadro de dados junto com o número total de linhas e colunas. Então, os truques aqui precisamos filtrar o resultado para obter as linhas e colunas do quadro de dados.

Método 5: Usando o DF.Método Count ()

O próximo método de contagem que vamos discutir é df.contar( ). Este método pode ser usado para contar linhas e colunas. Para contar o número total de linhas, usamos o DF.método count () e para as colunas, usamos o df.contagem (eixo = 'colunas').

  • No número da célula [64]: Criamos um objeto Dict (Dictionary) e depois convertemos esse objeto Dict em um DataFrame usando a Biblioteca Pandas.
  • No número da célula [65]: Imprimos o ditado convertido em dataframe (df).
  • No número da célula [66]: Nós imprimimos o DF.count () para verificar o número total de linhas e obteve o resultado na forma de contagem, pois não contará o valor nulo. É um pouco complicado obter o resultado adequado, para que as pessoas não escolham este método.
  • No número da célula [67]: Contamos as colunas usando o DF.contagem (eixo = 'colunas').

Conclusão

Então, vimos diferentes tipos de métodos para contar as linhas e colunas. Em que o melhor método é o índice e a forma, porque eles darão o resultado instantâneo do número total de linhas e colunas, e não precisamos realizar um trabalho extra como vimos nos outros métodos como DF.count () e df.info ().