Discurso para texto

Discurso para texto
O reconhecimento de fala é uma técnica que converte a voz humana em texto. Este é um conceito muito importante no mundo da inteligência artificial, onde temos que dar comandos a uma máquina como um carro sem motorista, etc.

Vamos implementar o discurso para enviar texto em python. E para isso, temos que instalar os seguintes pacotes:

  1. PIP Instale o reconhecimento de fala
  2. PIP Instale Pyaudio

Portanto, importamos o reconhecimento da fala da biblioteca e inicializamos o reconhecimento de fala porque, sem inicializar o reconhecedor, não podemos usar o áudio como entrada e não reconhecerá o áudio.

Existem duas maneiras de passar o áudio de entrada para o reconhecedor:

  1. Audio gravado
  2. Usando o microfone padrão

Então, desta vez estamos implementando a opção padrão (microfone). É por isso que estamos buscando o microfone do módulo, como mostrado abaixo:

Com linuxhint.Microfone () como microfone

Mas, se quisermos usar o áudio pré-gravado como entrada de origem, a sintaxe será assim:

Com linuxhint.Audiofile (nome do arquivo) como fonte

Agora, estamos usando o método de registro. A sintaxe do método de registro é:

Registro (fonte, duração)

Aqui a fonte é o nosso microfone e a variável de duração aceita números inteiros, que é segundos. Passamos a duração = 10 que informa ao sistema quanto tempo o microfone aceitará a voz do usuário e depois a fecha automaticamente.

Então nós usamos o reconhecer_google () Método que aceita o áudio e encobrirá o áudio para um formulário de texto.

O código acima aceita a entrada do microfone. Mas às vezes, queremos dar informações do áudio pré-gravado. Então, para isso, o código é dado abaixo. A sintaxe para isso já foi explicada acima.

Também podemos alterar a opção de idioma no método Reconsclare_google. À medida que mudamos o idioma do inglês para o hindi, como mostrado abaixo: