Como ler o arquivo do Excel no Python

Como ler o arquivo do Excel no Python

O .xlsx é a extensão do documento do Excel que pode armazenar uma grande quantidade de dados em forma tabular, e muitos tipos de cálculo aritmético e lógico podem ser feitos facilmente em uma planilha do Excel. Às vezes é necessário ler os dados do documento do Excel usando o script Python para fins de programação. Muitos módulos existem em Python para ler o documento do Excel. Alguns dos módulos úteis são xlrd, OpenPyxl, e Pandas. As maneiras de usar esses módulos para ler o arquivo do Excel no Python foram mostrados neste tutorial.

Pré-requisito:

Um arquivo de Excel dummy com o .A extensão XLSX será necessária para verificar os exemplos deste tutorial. Você pode usar qualquer arquivo do Excel existente ou criar um novo. Aqui, um novo arquivo do Excel nomeado vendas.xlsx O arquivo foi criado com os seguintes dados. Este arquivo usou para leitura usando diferentes módulos Python na próxima parte deste tutorial.

vendas.xlsx

Data de vendas Vendedora Quantia
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
04/04/21 Mahmudul Hasan 30000

Exemplo 1: Leia o arquivo Excel usando XLRD

O módulo XLRD não está instalado com Python por padrão. Então, você tem que instalar o módulo antes de usá -lo. A versão mais recente deste módulo não suporta o arquivo do Excel com o .Extensão XLSX. Então, você tem que instalar o 1.2.0 versão deste módulo para ler o arquivo XLSX. Execute o seguinte comando do terminal para instalar a versão necessária de xlrd.

$ pip install xlrd == 1.2.0

Depois de concluir o processo de instalação, crie um arquivo python com o seguinte script para ler o vendas.xlsx arquivo usando o xlrd módulo. Open_workbook () A função é usada no script, abra o arquivo XLSX para leitura. Este arquivo do Excel contém apenas uma folha. Então o pasta de trabalho.Sheet_by_index () A função foi usada no script com o valor do argumento 0. Em seguida, o aninhado 'para' O loop usou para ler os valores celulares da planilha usando os valores de linha e coluna. Duas funções de intervalo () foram usadas no script para definir o tamanho da linha e da coluna com base nos dados da folha. O Cell_value () A função usou para ler o valor da célula específico da folha em cada iteração do loop. Cada campo na saída será separado por um espaço de guia.

# Importe o módulo XLRD
importar xlrd
# Abra a pasta de trabalho
pasta de trabalho = xlrd.Open_workbook ("Vendas.xlsx ")
# Abra a planilha
planilha = pasta de trabalho.Sheet_by_index (0)
# Itera as linhas e colunas
para i no intervalo (0, 5):
para j no intervalo (0, 3):
# Imprima os valores da célula com espaço de guia
Imprimir (planilha.Cell_value (i, j), end = '\ t')
imprimir(")

Saída:

A saída a seguir aparecerá após a execução do script acima.

Exemplo 2: Leia o arquivo do Excel usando o OpenPyxl

O OpenPyxl é outro módulo Python para ler o arquivo XLSX e também não é instalado com Python por padrão. Execute o seguinte comando do terminal para instalar este módulo antes de usá -lo.

$ pip install openpyxl

Depois de concluir o processo de instalação, crie um arquivo python com o seguinte script para ler o vendas.xlsx arquivo. Como o módulo XLRD, O OpenPyxl módulo tem o load_workbook () função para abrir o arquivo XLSX para leitura. O vendas.xlsx O arquivo é usado como o valor do argumento desta função. O objeto do Wookbook.ativo foi criado no script para ler os valores do max_row e a max_column propriedades. Essas propriedades foram usadas no aninhado para loops para ler o conteúdo do vendas.xlsx arquivo. A função range () foi usada para ler as linhas da folha, e a função iter_cols () foi usada para ler as colunas da folha. Cada campo na saída será separado por dois espaços de guias.

# Importar módulo Openyxl
Importar OpenPyxl
# Defina a variável para carregar o wookbook
WookBook = OpenPyxl.load_workbook ("Vendas.xlsx ")
# Defina a variável para ler a folha ativa:
planilha = wookbook.ativo
# Itera o loop para ler os valores das células
para i no intervalo (0, planilha.max_row):
para col em planilha.iter_cols (1, planilha.max_column):
Imprimir (col [i].valor, end = "\ t \ t")
imprimir(")

Saída:

A saída a seguir aparecerá após a execução do script acima.

Exemplo 3: Leia o arquivo do Excel usando pandas

O módulo pandas não está instalado com o módulo anterior do módulo anterior. Então, se você não o instalou antes, então você terá que instalá -lo. Execute o seguinte comando para instalar o Pandas do terminal.

$ pip install pandas

Depois de concluir o processo de instalação, crie um arquivo python com o seguinte script para ler o vendas.xlsx arquivo. O read_excel () A função dos pandas é usada para ler o arquivo XLSX. Esta função usou no script para ler o vendas.xlsx arquivo. O Quadro de dados() A função usou aqui para ler o conteúdo do arquivo XLSX no quadro de dados e armazenar os valores na variável nomeada dados. O valor dos dados foi impresso posteriormente.

# Importar pandas
importar pandas como PD
# Carregar o arquivo XLSX
Excel_Data = Pd.read_excel ('vendas.xlsx ')
# Leia os valores do arquivo no DataFrame
Dados = Pd.DataFrame (Excel_Data, colunas = [
'Data de vendas', 'vendedores', 'valor']))
# Imprima o conteúdo
print ("O conteúdo do arquivo é: \ n", dados)

Saída:

A saída a seguir aparecerá após a execução do script acima. A saída deste script é diferente dos dois exemplos anteriores. Os números da linha são impressos na primeira coluna, onde o valor da linha contou de 0. Os valores da data estão alinhados centralmente. Os nomes dos vendedores estão alinhados. A quantidade está alinhada para a esquerda.

Conclusão:

Os usuários do Python precisam trabalhar com arquivos XLSX para diferentes fins de programação. Três maneiras diferentes de ler o arquivo XLSX foram mostradas neste tutorial usando três módulos Python. Cada módulo tem diferentes funções e propriedades para ler o arquivo XLSX. Este tutorial ajudará os usuários do Python a ler o arquivo XLSX facilmente usando o script Python depois de ler este tutorial.