Conversão de Voz Inter-linguístico

Conversão de voz é um processo no qual se transforma sentenças de fala de
um falante origem, de modo que o resultado da transformação soe como uma sentença pronunciada por outro falante, o destino.

O interesse em resolver este problema se estende à:

  • Imitação de voz: a personalização de sistemas interativos de texto para fala
    (Text-To-Speech - TTS), bem como outros sistemas de karaoke os quais emulam a
    voz do cantor original,
  • Applicações de Multimídia: criação de ferramentas educacionais para o aprendizado de
    língua estrangeira, ou mesmo a customização de sistemas intérpretes virtuais,
  • Outras aplicações: desenvolvimento de sistemas que tentam burlar os sistemas de
    autenticação biométrica, e outras tarefas como restauração de voz de pessoas com
    deficiência fonatória.

O objetivo deste projeto é inspecionar e avaliar a qualidade das ferramentas disponíveis
para conversão de voz inter-linguística, de modo a propor novas técnicas para o desenvolvimento
de um sistema capaz de converter sentenças de fala com alta-fidelidade.

Este projeto foi introduzido no grupo de computação musical do IME a partir do curso de doutorado de Anderson Fraiha Machado, onde sua tese apresenta novas técnicas para conversão de voz entre locutores de línguas distintas. Como resultado dessa pesquisa, foi desenvolvido um pequeno sistema em MATLAB que pode ser acessado aqui.

Até o presente momento, cinco trabalhos foram publicados neste projeto:

  • ICMC - SMC 2014 na Grécia: http://www.icmc14-smc14.net/
  • ICASSP 2013 em Vancouver: http://www.icassp2013.com/
  • Iberspeech 2012 em Madrid: http://iberspeech2012.ii.uam.es/
  • ISM 2010 em Taichung - Taiwan: http://www.computer.org/portal/web/csdl/doi/10.1109/ISM.2010.62
  • SMC 2010 em Barcelona - Espanha: http://smcnetwork.org/node/1375
    Este projeto é tido como um ponto de partida para sistemas de processamento de voz em geral, e qualquer ajuda é muito bem vinda ...

    ;-)