Conversão de Voz Inter-Linguística

Conversão de voz é um processo no qual se transforma sentenças de fala de um falante origem, de modo que o resultado da transformação soe como uma sentença pronunciada por outro falante, o destino.

O interesse em resolver este problema se estende à:

Imitação de voz: a personalização de sistemas interativos de texto para fala (Text-To-Speech - TTS), bem como outros sistemas de karaoke os quais emulam a voz do cantor original, Applicações de Multimídia: criação de ferramentas educacionais para o aprendizado de língua estrangeira, ou mesmo a customização de sistemas intérpretes virtuais, Outras aplicações: desenvolvimento de sistemas que tentam burlar os sistemas de autenticação biométrica, e outras tarefas como restauração de voz de pessoas com deficiência fonatória. O objetivo deste projeto é inspecionar e avaliar a qualidade das ferramentas disponíveis para conversão de voz inter-linguística, de modo a propor novas técnicas para o desenvolvimento de um sistema capaz de converter sentenças de fala com alta-fidelidade.

Este projeto foi introduzido no grupo de computação musical do IME a partir do curso de doutorado de Anderson Fraiha Machado, onde sua tese apresenta novas técnicas para conversão de voz entre locutores de línguas distintas. Como resultado dessa pesquisa, foi desenvolvido um pequeno sistema em MATLAB que pode ser acessado aqui.

Até o presente momento, cinco trabalhos foram publicados neste projeto:

Este projeto é tido como um ponto de partida para sistemas de processamento de voz em geral, e qualquer ajuda é muito bem vinda … ;-)