Pandas leu TSV

Pandas leu TSV

Em "Pandas", podemos ler facilmente arquivos como podemos ler arquivos CSV, podemos ler arquivos TSV, podemos ler arquivos de texto e também podemos ler SQL. Nós explicamos o arquivo TSV aqui. É um arquivo de formato de texto no qual os dados tabulares são armazenados no formato de texto. Podemos criar ou ler facilmente o arquivo "Valor separado da guia" em "Pandas" porque os "pandas" contêm alguma função interna que ajuda na criação e na leitura dos arquivos TSV. Discutiremos neste tutorial os métodos de que "pandas" nos fornece para ler o arquivo TSV. Vamos criar e ler o arquivo TSV e também converter seus dados depois de ler o arquivo TSV no DataFrame.

Métodos para ler o arquivo TSV em "Pandas"

Podemos ler o arquivo TSV usando dois métodos de "pandas" e utilizaremos esses dois métodos neste tutorial. Os métodos são apresentados abaixo:

  • Método read_table ().
  • Método read_csv ().

Exemplo # 01: Usando o método “read_table ()”

Usamos a ferramenta "Spyder" para ajudar a gerar os códigos "pandas". Antes de descrever o conceito de ler o arquivo TSV, explicamos como podemos criar o arquivo TSV em "Pandas". Importamos a biblioteca "pandas" e depois criamos um quadro de dados "newdf" no qual inserimos algumas colunas. Os dados também são inseridos em cada coluna. Entramos “new_name, new_1, new_2, new_3, new_4 e new_5”, que são as colunas do DataFrame “new_df”.

Em seguida, adicionamos o método "to_csv ()" no qual adicionamos o nome do arquivo. Nós inserimos “NewFile.TSV ”, que converterá o quadro de dados que criamos neste código no arquivo TSV e nomeará este arquivo“ NewFile.TSV ”. Também ajustamos o parâmetro "set", onde adicionamos "\ t" como seu valor. Agora, o “newfile.TSV ”é criado. Vamos mostrar este arquivo TSV também.

Pressionamos "Shift+Enter", que executa os códigos e o "NewFile.TSV ”é então gerado. Este arquivo TSV é mostrado abaixo. Aqui, os dados do DataFrame são armazenados em forma de texto. Agora, vamos ler este arquivo TSV também.

Nós importamos os "pandas" novamente no novo arquivo. Vamos ler o arquivo TSV que criamos acima. Colocamos "my_dataframe", que armazena os dados do arquivo TSV depois de lê -lo. Utilizamos o “PD.read_table () ”e passe o nome do arquivo que temos que ler, que é“ NewFile.TSV ”. Este método lerá os dados que estão presentes no arquivo TSV e gerará o quadro de dados dos dados do arquivo TSV e salve -os em "My_Dataframe". Depois disso, o "my_dataframe" é inserido no "print ()". Então, ele será impresso no terminal na execução.

Quando executamos esse código "pandas", os dados do arquivo TSV são mostrados como o DataFrame no terminal. Os dados do arquivo TSV são mostrados abaixo dos quais recebemos depois de ler o arquivo TSV.

Exemplo # 02: Usando o método “read_csv ()”

Também podemos ler o arquivo TSV, utilizando o método "read_csv ()". Aqui, estamos usando o método “read_csv ()” para ler o “NewFile.TSV ”. Inicializamos a variável "dados" com o método "read_csv ()" e também adicionamos dois parâmetros. Primeiro, adicionamos o nome do arquivo e depois definimos o parâmetro "set". Seu valor é ajustado como "\ t". Também imprimimos “dados” usando “print ()” aqui.

Ele também mostra os dados do arquivo TSV no formato de DataFrame ou podemos dizer que, em forma tabular. Ambos os métodos funcionam da mesma forma e retornam o mesmo resultado.

Exemplo # 03:

O novo arquivo TSV é renderizado abaixo. Agora, temos que ler os dados deste arquivo TSV, utilizando o método "pandas".

Adicionamos o método "read_table ()" para ler o arquivo TSV, mas adicionamos mais um parâmetro desta vez. Depois de adicionar o nome do arquivo TSV, que é “educação.TSV ”, também adicionamos o parâmetro“ index_col ”que ajuda a ajustar a coluna do índice do DataFrame, que é criado após a leitura do arquivo TSV. Ajustamos a coluna "Randomname" como o índice do DataFrame. Portanto, quando o código for executado, o arquivo será lido, o DataFrame que obtemos terá o "nome randomname" como sua coluna de índice. Também exibimos os dados do arquivo TSV depois de ler aqui usando "print ()".

Aqui, você vê que os dados acima do arquivo TSV são exibidos em forma de tabular. Recebemos esse quadro de dados lendo o arquivo TSV com a ajuda do método "read_table ()". Além disso, observe que a coluna "Randomname" é definida aqui como a coluna de índice.

Exemplo # 04:

Agora, temos outro arquivo TSV que é mostrado abaixo. O arquivo contém os dados no formato de texto. Também vamos ler este arquivo.

Criamos a variável “new_columns”. Adicionamos alguns nomes porque queremos ajustar esses nomes como os nomes das colunas do quadro de dados que recebemos depois de ler o arquivo TSV que é mostrado acima. Os nomes que adicionamos são “Class_mamals, Class_fish, Class_repatiles, Class_amphibians e Class_birds”. Depois disso, utilizamos o método "read_table" no qual adicionamos três parâmetros. Primeiro, inserimos “animais_data.TSV ”, que é o nome do arquivo TSV e depois ajustou“ nenhum ”para o parâmetro“ cabeçalho ”. Também adicionamos os "new_columns" que inicializamos neste código para o parâmetro "nomes". Portanto, os nomes que adicionamos acima são ajustados como os nomes das colunas do quadro de dados. Em seguida, renderizamos os dados usando o "print ()".

Os dados que são mostrados no formato de texto no arquivo TSV acima são convertidos no quadro de dados. Os novos nomes de colunas que adicionamos no código são renderizados e os nomes anteriores de colunas são transformados na linha ou valores dessas colunas.

Exemplo # 05:

Estamos lendo o mesmo arquivo que mostramos no Exemplo 4, mas desta vez estamos pulando algumas linhas depois de ler o “Animals_data.Arquivo TSV ”. Acabamos de adicionar o quarto parâmetro ao método "read_table ()", que é o parâmetro "Skiprows". Defina -o como "4" porque queremos pular as quatro primeiras linhas do quadro de dados que são geradas depois de ler o "Animals_data.TSV ”.

O DataFrame é renderizado novamente, mas as quatro primeiras linhas não estão presentes neste quadro de dados porque ignoramos as linhas “4” do DataFrame.

Exemplo # 06:

Nós lemos novamente o “Animals_data.arquivo tsv ”, mas com o método“ read_csv () ”. Nós entramos no “Animals_data.TSV "e depois defina o" SEP "como" \ t ". Além disso, ajustamos o valor "nenhum" para o "cabeçalho" e os nomes que adicionamos aqui serão definidos como os nomes das colunas. Nós pulamos apenas uma linha usando o parâmetro "Skiprows".

O quadro de dados que recebemos é exibido e os nomes das colunas são ajustados de acordo, pois inserimos no código. Além disso, a primeira linha é removida do DataFrame aqui.

Exemplo # 07:

Mais um arquivo TSV é mostrado. Agora, mostraremos como obter a coluna selecionada depois de ler o arquivo TSV.

Aplicamos o método "read_table ()" e adicionamos um novo parâmetro que são os parâmetros "USecols" e adicionamos o nome da coluna que queremos obter dos “carros.Arquivo TSV ”. Adicionamos "preço", que é o nome da coluna. Agora, ele apenas acessará os dados da coluna "preço" e salvará em "carsdf". Em seguida, renderizamos os dados da coluna "Preço" aqui.

Apenas uma coluna é exibida porque ajustamos o parâmetro "USECOLS" no método "read_table ()". Então, ele não mostrou todos os dados do arquivo TSV aqui.

Conclusão

Podemos ler arquivos diferentes em "pandas" com a ajuda do método "pandas". Então, escrevemos este tutorial no qual explicamos como ler o arquivo TSV em "Pandas". Primeiro, explicamos a criação do arquivo TSV e depois discutimos dois métodos neste tutorial que ajudam na leitura dos dados do arquivo TSV. Explicamos o método "read_table ()", bem como o método "read_csv ()" e explicamos como esses métodos ajudam a ler o arquivo TSV em "Pandas". Utilizamos esses métodos neste tutorial adicionando parâmetros diferentes a cada vez em cada código para obter resultados diferentes.