Melhor texto da linha de comando para aplicativos de fala para Linux

Melhor texto da linha de comando para aplicativos de fala para Linux
Este artigo abordará uma lista de aplicativos de texto útil para fala (TTS) disponíveis para Linux. Esses aplicativos podem identificar um texto, convertê -lo em fala e depois falar palavras e frases através dos alto -falantes do seu sistema Linux. Eles convertem texto em fala usando algoritmos de inteligência artificial e modelos de aprendizagem de máquina pré -treinados. Esses aplicativos geralmente fornecem uma variedade de vozes diferentes com tons predefinidos, sotaque e maneira de falar. Alguns desses aplicativos permitem que você configure parâmetros de voz como ritmo e tumulto. É comum que o texto em aplicativos de fala tenham vozes robóticas que não parecem vozes da vida real. No entanto, a tecnologia está melhorando e mais vozes humanas estão saindo desses aplicativos de texto para a fala.

Espak

Espeak é um texto gratuito e de código aberto para o utilitário de fala que pode ser usado para converter texto em fala em muitos idiomas diferentes. Ele vem com um utilitário de linha de comando, bem como uma biblioteca que pode ser usada em seu próprio aplicativo. A maioria das vozes disponíveis no Espeak Sound Robotic, mas é um dos mais abrangentes e amplamente usados ​​texto de código aberto para a fala disponível hoje. Ele suporta converter texto em fala em mais de 40 idiomas diferentes e você também pode salvar a fala em arquivos de áudio no formato de arquivo wav. Ele também vem com suporte embutido para converter texto em fonemas, para que você possa usá-los em outros aplicativos, incluindo outros motores de texto para os mecanismos de fala.

Você pode instalar o EPSeak no Ubuntu usando o comando mencionado abaixo:

$ sudo apt install Espeak

Você pode baixar o Espeak em outras distribuições Linux do gerenciador de pacotes. Mais opções de download estão disponíveis aqui.

Para converter um texto em fala usando Espeak, use um comando no seguinte formato:

$ Espeak "O texto será convertido para a fala."

Você pode substituir o conteúdo em cotações pela sua própria corda desejada. Para sintetizar o conteúdo inteiro de um arquivo no discurso, execute um comando no seguinte formato:

$ Espeak -f FileName.TXT

Para mudar o estilo de linguagem e voz, execute um comando no seguinte formato:

$ Espeak -v EN -GB "O texto será convertido para a fala."

Você pode substituir "EN-GB" pelo código de voz desejado. Uma lista de todas as vozes disponíveis e seus códigos pode ser encontrada executando o seguinte comando:

$ Espeak -Voices

Para salvar o discurso sintetizado em um arquivo WAV, execute um comando no seguinte formato:

$ Espeak -f FileName.saída txt -w.WAV

Você pode substituir “saída.wav ”com qualquer outro nome de sua escolha.

Para saber mais sobre outras opções de linha de comando disponíveis para Espeak, use os dois comandos a seguir:

$ Espeak -Help
$ homem Espak

Festival

O festival é outro texto de código aberto e de código aberto para o mecanismo de fala que funciona semelhante ao Espeak. Ele fornece um utilitário de linha de comando para converter texto em fala e uma API que você pode integrar em seu próprio aplicativo. Outras características principais do festival incluem suporte para converter texto em fala em vários idiomas, intérprete interativo embutido, uma API cliente-servidor para acessá-lo remotamente e seu próprio mecanismo de script.

Você pode instalar o Festival no Ubuntu usando o comando mencionado abaixo:

$ sudo apt install festival

Você pode baixar o Festival em outras distribuições Linux do gerenciador de pacotes. Mais opções de download estão disponíveis aqui. Uma demonstração on -line mostrando os recursos do festival está disponível aqui.

Para converter uma string em discurso, use um comando no seguinte formato:

$ echo "teste" | Festival -TTS

Você pode substituir "teste" por qualquer outra string de sua escolha. Para converter o conteúdo de um arquivo de texto em fala usando o festival, execute um comando no seguinte formato:

$ festival -TTS FILENAME.TXT

Você pode mudar a linguagem de voz executando o comando abaixo:

$ festival -Language AmericanEnglish -TTS FileName.TXT

Você pode substituir “Americalenglish” por outros idiomas suportados pelo festival. Para obter uma lista de todos os idiomas suportados, execute o comando abaixo:

$ ls/usr/share/festival/idiomas/

Para executar o festival no modo interativo, use o seguinte comando:

$ festival

Você pode aprender mais sobre comandos específicos do modo interativo a partir daqui.

Para saber mais sobre outras opções de linha de comando disponíveis para o festival, execute os dois comandos a seguir:

$ festival -Help
$ MAN Festival

Texto pico para mecanismo de fala

Pico é um texto de código de fala gratuito e aberto para o mecanismo de fala que é incluído por padrão no Android Open Source Project (AOSP). Os estilos de voz incluídos no pico tts parecem menos robóticos que o Espeak e o Festival. Atualmente, o Pico TTS apóia a síntese de fala em inglês, italiano, alemão, francês e espanhol.

Você pode instalar o Pico TTS no Ubuntu usando o comando mencionado abaixo:

$ sudo apt install lbttspico-utils

Você pode baixar o Pico TTS em outras distribuições Linux do gerenciador de pacotes. Como alternativa, você pode compilá -lo do código -fonte disponível aqui.

Pico TTS não tem um comando para falar diretamente o discurso sintetizado do stdout. No entanto, ele pode ler o conteúdo de um arquivo de texto ou uma string e pode salvar o discurso sintetizado em um arquivo WAV que pode ser reproduzido em qualquer player de áudio.

Para converter uma string em fala e salvar a saída em um arquivo WAV, execute um comando no seguinte formato:

$ pico2wave -l en -en -w teste.WAV "Teste"

Você pode substituir o "teste" por sua própria corda desejada. Para alterar a linguagem, substitua "en-en" por códigos para outros idiomas suportados. O Pico TTS suporta os seguintes códigos de idioma: en-us, it-it, ES-ES, EN-GB, DE-DE-DE e FR-FR.

Para ler o conteúdo de um arquivo e convertê -lo em fala, execute um comando no seguinte formato:

$ pico2wave -l en -us -w teste.WAV "$ (teste de gato.TXT)"

Você pode substituir “teste.txt ”com qualquer outro nome de arquivo.

Para saber mais sobre as opções de linha de comando pico tts, execute os dois comandos a seguir:

$ pico2wave -Help
$ MAN PICO2WAVE

GTTS

GTTS é um aplicativo de linha de comando e biblioteca com base no texto do Google Translate para o mecanismo de fala. Com base no Python, ele pode ser usado para desenvolver outros aplicativos TTS ou você pode usá -lo como um utilitário de linha de comando para sintetizar a fala do texto. Possui vozes de som muito mais naturais do que outros utilitários mencionados neste artigo, pois o texto do Google Translate para o mecanismo de fala é atualizado regularmente com novos algoritmos, vozes e recursos de som natural.

Você pode instalar o GTTS no Ubuntu usando o comando mencionado abaixo:

$ sudo apt install python3-gtts

Você pode baixar o GTTS em outras distribuições Linux do gerenciador de pacotes. Como alternativa, você pode instalá -lo no gerenciador de pacotes pip.

Para converter uma string em discurso, execute um comando no seguinte formato:

$ gtts-cli 'teste'-teste de saída.mp3

Você pode substituir 'teste' por qualquer string. O discurso sintetizado é salvo no “teste.arquivo mp3 ”. Você pode usar qualquer nome para o arquivo de saída.

Para ler o conteúdo de um arquivo e convertê -lo em fala, execute um comando no seguinte formato:

Teste $ GTTS -CLI -F.TXT -Teste de saída.mp3

Você pode substituir “teste.txt ”com qualquer outro nome de arquivo.

Para especificar um idioma específico para sintetizar o discurso, use um comando no seguinte formato:

$ GTTS -CLI 'Teste' -L EN -Output Test.mp3

Você pode substituir "EN" pelo código para outros idiomas suportados. Para obter uma lista de todos os códigos de linguagem suportados, execute o seguinte comando:

$ GTTS-CLI-All

Para saber mais sobre outras opções de linha de comando disponíveis para o GTTS, use os dois comandos a seguir:

$ MAN GTTS-CLI
$ GTTS-CLI-Help

Conclusão

Estes são alguns dos melhores aplicativos de fala disponíveis para o Linux que vêm com suporte para sintetizar a fala em vários idiomas. Esses aplicativos TTS podem ser usados ​​de várias maneiras, mas são especialmente úteis para melhorar a acessibilidade para pessoas que sofrem de problemas de deficiência visual.