Extrair páginas do PDF no Linux

Extrair páginas do PDF no Linux
Lidar com arquivos PDF pode ser um aborrecimento às vezes, pois não são muito modificáveis. Muitas vezes, é preciso extrair um punhado de páginas específicas de um documento enorme, e toda a tarefa pode parecer muito trabalhosa. É exatamente por isso que dedicaremos este tutorial para mostrar os melhores métodos e as melhores ferramentas necessárias para extrair páginas de arquivos PDF no Linux.

Usando uma ferramenta online

Os arquivos PDF se tornaram um dos meios mais comuns de documentar e distribuir dados. Devido à sua popularidade, muitos sites e programas são projetados particularmente para manipular esses arquivos. Falando nisso, o ILOVEPDF é um site dedicado inteiramente a esse propósito. Possui muitas ferramentas que você pode usar gratuitamente para dividir, mesclar, converter, organizar, proteger e compactar arquivos PDF.

Como queremos extrair páginas dos arquivos PDF, usaremos a ferramenta PDF Splitter oferecida pelo site, conforme mencionado acima. Depois de ter o documento PDF da qual você deseja extrair páginas, clique aqui para visitar a ferramenta de divisor de PDF on -line.

Clique no botão Selecionar Arquivo PDF e navegue até o seu documento. Depois de enviar, você pode selecionar se deseja extrair páginas ou dividir o arquivo por intervalo.

Vá em frente e selecione as opções que você precisa nos botões do lado direito. Depois de terminar, clique no PDF dividido, e deve ser isso. Ele inicializará o download de um .arquivo zip que contém suas páginas extraídas.

O ILOVEPDF também possui um aplicativo para download gratuito, mas, infelizmente, ele está disponível apenas para Windows e MacOS. No entanto, isso não tira sua capacidade de ajudá -lo a extrair páginas de PDFs no Linux, pois você também pode usá -lo online. Com isso dito, agora você pode usar uma ferramenta de divisão de PDF online completamente gratuita para selecionar páginas específicas de arquivos PDF e extraí -los sem problemas!

Usando pdfshuffler

Se por qualquer motivo - pode ser devido a preocupações com privacidade ou falta de funcionalidade - o método anterior não o convenceu, não se preocupe, pois temos recomendações mais favoráveis ​​para você experimentar.

Um dos quais é o PDFSHUFFLER, um aplicativo prático do Python-GTK que permite que seus usuários manipulem arquivos PDF facilmente. Seus recursos incluem fusão, divisão, corte, rotação e reorganização de arquivos PDF. A ferramenta adiciona à sua extensa funcionalidade por meio de sua interface gráfica fácil de entender e intuitiva.

Você pode clicar aqui para baixar o pdfshuffler da fonte forge, ou pode fazê-lo da maneira antiga através da linha de comando. Navegue até o menu de atividades ou pressione Ctrl + Alt + T no teclado para abrir uma nova janela do terminal.

Tendo feito isso, execute os comandos abaixo até a primeira verificação de atualizações e depois instale o pdfshuffler no seu sistema Linux. (Esses comandos são para o Ubuntu 20.04, mas outras versões não devem ser muito diferentes dessas).

$ sudo apt update
$ sudo apt install pdfshuffler

Quando a instalação estiver concluída, encontre o software recém -instalado no menu de atividades e execute -o. A tela padrão deve se parecer com a imagem abaixo.

A próxima etapa é inserir seu arquivo PDF no programa clicando no botão Arquivo e selecionando a opção Adicionar no menu suspenso.

Uma vez feito, definir suas configurações de extração e dividir o arquivo. A saída deve fornecer as páginas extraídas desejadas do documento de entrada.

Usando pdftk

Se você tem uma apreciação especial pelos programas da linha de comando, em vez de com interfaces gráficas, então o PDFTK é o caminho a seguir. É uma solução eficiente da CLI para usuários que precisam extrair páginas específicas de arquivos PDF. Vejamos como você pode instalá -lo em várias distribuições Linux e como usá -lo.

Volte para a janela do seu terminal ou abra um novo e execute os seguintes comandos se você usar o Ubuntu ou Debian.

$ sudo apt install pdftk

No entanto, se você não tiver o repositório do universo ativado, o comando mencionado acima não funcionará. Você pode ativar este repositório executando o comando abaixo.

$ sudo add-aprop-repositório universo

Tendo feito isso, volte ao primeiro comando para instalar o PDFTK.

Se você estiver usando o Arch Linux ou uma de suas variantes, execute o comando abaixo. (PDFTK é facilmente acessível através do repositório comunitário).

$ PACMAN -S PDFTK

Da mesma forma, se você estiver no OpenSUSE, execute o comando abaixo para instalar o pdftk.

$ sudo zypper install pdftk

Por fim, se você tiver o Snap ativado, poderá obter essa ferramenta através de um comando snap também.

$ sudo snap install pdftk

Em seguida, vamos dar uma olhada no uso de pdftk. Como mencionamos anteriormente, esta é uma ferramenta da CLI, então tudo o que você precisa fazer é executar um pequeno comando para obter o que você precisa.

$ pdftk entrada.PDF CAT 3-4 saída de saída_p3-4.pdf

Agora, o que está acontecendo neste comando? Primeiro, entrada.PDF é o documento que precisa ser dividido. O parâmetro 3-4 especifica o intervalo de número da página, 3 a 4. Em seguida, temos o nome do arquivo de saída, que é output_p3-4.pdf. Simples o suficiente, e você deve pegar o jeito em pouco tempo.

No entanto, você pode não estar procurando dividir um arquivo PDF por um intervalo de número de página; Em vez disso, extrair um monte de páginas específicas em arquivos PDF separados. Não se preocupe, como você pode fazer isso através desta ferramenta também. Tudo o que você precisa fazer é fazer uma pequena mudança no comando que mencionamos anteriormente. Esta alteração é mostrada abaixo.

$ pdftk entrada.PDF CAT 3 4 Saída de saída.pdf

Com isso feito, você pode dividir as páginas 3 e 4 e salvá -las como saída.pdf.

Conclusão

Neste guia, entramos em grande profundidade sobre como você pode extrair páginas dos arquivos PDF. Analisamos uma ferramenta on-line útil, depois um programa baseado em GUI para download e, finalmente, uma solução de linha de comando. As ferramentas mencionadas acima são ricas em termos de recursos e devem fazer o trabalho facilmente.