Python leia o CSV em 2D Array

Python leia o CSV em 2D Array
Como sabemos, quando falamos sobre a matriz 2D, estamos falando sobre a matriz Numpy. A matriz Numpy é basicamente usada por cientistas da computação e engenheiros de aprendizado de máquina para lidar com as enormes quantidades de dados armazenados no arquivo CSV. Como resultado, Numpy permite que eles processem grandes quantidades de dados em um arquivo CSV de uma maneira muito conveniente. O Python também ajuda da mesma maneira, fornecendo métodos diferentes para ler os dados do arquivo CSV em uma matriz Numpy. Então, vamos aprender sobre esses diferentes tipos de métodos neste artigo.
  1. Usando o método Numpy loadtxt ()
  2. Usando o método Numpy GenFromtxt ()
  3. Usando o Pandas DataFrame
  4. Usando a estrutura de dados da lista
  5. Usando o método Pandas Dataframe Valores ()

O que é um arquivo CSV?

Um CSV é um arquivo (valores separados por vírgula) no qual os dados estão na forma de um tabular. A extensão do arquivo CSV é .CSV. Este arquivo CSV é usado principalmente na análise de dados. Além da análise de dados, o arquivo CSV também usado no aplicativo de comércio eletrônico porque é muito fácil de lidar em todos os diferentes tipos de linguagens de programação.

Método 1: Usando o método Numpy loadtxt ()

Neste método, vamos usar o Numpy.Método loadtxt () que converte os dados do CSV em uma matriz 2D. O abaixo é um exemplo de arquivo CSV que usaremos neste programa.

1,2
3,4
5,6
7,8
9,10

Código Python:

importar numpy como np
Csvdata = aberto ("sampleCsv.CSV ")
Array2d_result = np.loadtxt (csvdata, delimiter = ",")
Imprimir (Array2D_Result)

Saída:

[[1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]

Linha 1: Nós importamos a biblioteca Numpy.

Linha 3-4: Abrimos o arquivo samplecsv e passamos por csvdata e o delimitador para np.função loadtxt (), que retorna os dados em uma matriz 2D.

Linha 6: Finalmente imprimimos o resultado que mostra que agora nossos dados de CSV convertidos em uma matriz 2D.

Método 2: Usando o método Numpy GenFromtxt ()

Neste método, vamos usar o Numpy.Método GenFromTxt () que converte os dados do CSV em uma matriz 2D. O abaixo é um exemplo de arquivo CSV que usaremos neste programa.

1,2
3,4
5,6
7,8
9,10

Código Python:

importar numpy como np
Csvdata = aberto ("sampleCsv.CSV ")
Array2d_result = np.Genfromtxt (csvdata, delimiter = ",")
Imprimir (Array2D_Result)

Saída:

[[1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]

Linha 1: Nós importamos a biblioteca Numpy.

Linha 3-4: Abrimos o arquivo samplecsv e passamos o CSVData e o delimitador para Numpy NP.função genFromtxt (), que retorna os dados em uma matriz 2D.

Linha 6: Finalmente imprimimos o resultado que mostra que agora nossos dados de CSV convertidos em uma matriz 2D.

Método 3: Usando o quadro de dados de pandas

Neste método, vamos usar os pandas que convertem os dados do CSV em uma matriz 2D. Abaixo está um exemplo de arquivo CSV que usaremos neste programa.

1,2
3,4
5,6
7,8
9,10 Importar pandas como PD
df = pd.read_csv ('samplecsv.CSV ')
Impressão (DF)
Array2d_result = df.to_numpy ()
Imprimir (Array2D_Result)

Saída:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linha 1: Nós importamos a biblioteca de pandas como PD.

Linha 2-3: Lemos o arquivo CSV usando o método Pandas Read_CSV e, em seguida, imprimimos o recém -criado DataFrame (DF) na tela, como mostrado na saída acima.

Linha 4-5: Em seguida, usamos o método DataFrame para_numpy, que converte todos os valores de quadro de dados em uma matriz 2D, como mostrado na saída.

Método 4: Usando a estrutura de dados da lista

Neste método, vamos usar a estrutura de dados da lista. A lista também pode nos ajudar a colocar os dados do CSV em uma matriz 2D. O programa abaixo demonstra o mesmo método.

importar CSV
importar numpy
com open ("samplecsv.CSV ", newline =") como arquivo:
resultado_list = list (CSV.leitor (arquivo))
imprimir (resultado_list)
resultado_2d = numpy.Array (resultado_list)
impressão (resultado_2d)

Saída:

[['1', '2'], ['3', '4'], ['5', '6'], ['7', '8'], ['9', '10'] ]
[['1' '2']
['3' '4']
['5' '6']
['7' '8']
['9' '10']]

Linha 1: Importamos as bibliotecas CSV e Numpy.

Linhas 3-5: Abrimos o arquivo samplecsv e depois lemos os dados de cada arquivo CSV usando o CSV.Método Reader () e converte os resultados em uma lista de listas.

Linha 6: Agora, usamos o Numpy.Método da matriz para converter toda a lista de listas em uma matriz 2D. O resultado na saída mostra que nossos dados de CSV foram convertidos com sucesso em uma matriz 2D.

Método 5: Usando valores de quadro de dados de pandas

Neste método, usaremos o método muito básico para converter os dados do CSV em uma matriz Numpy usando a função DataFrame Valores (). O programa abaixo demonstrará o mesmo.

importar pandas como PD
df = pd.read_csv ('samplecsv.CSV ')
Impressão (DF)
Array2d_result = df.valores
Imprimir (Array2D_Result)

Saída:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linha 1: Nós importamos a biblioteca de pandas como PD.

Linha 2-4: Lemos o arquivo CSV usando o método Pandas Read_CSV e, em seguida, imprimimos o recém -criado DataFrame (DF) na tela, como mostrado na saída acima.

Linha 5-6: Em seguida, usamos a função DataFrame Values ​​() que converte o quadro de dados em uma matriz 2D Numpy, como mostrado na saída.

Conclusão

Neste artigo, vimos métodos diferentes para ler dados de CSV em uma matriz 2D. Mostramos todos os métodos atualmente usados ​​por diferentes programadores e cientistas da computação. Alguns dos métodos estão embutidos e alguns dos métodos são criados penteando métodos diferentes de diferentes bibliotecas. Mas todos os métodos acima que você pode usar de acordo com seus requisitos. Se você sabe como ler o arquivo CSV, também pode criar alguns de seus próprios métodos.