Sobre o Uso de Codificações Esparsas Relativas ao Tempo em Música

Neste seminário vamos apresentar um trabalho de Pierre-Antoine Manzagol, Thierry Bertin-Mathieux and Douglas Eck, apresentado no ISMIR 2008.
<blockquote>A maioria dos features usado em MIR (music information retrieval) são inspirados por trabalhos de reconhecimento de fala/voz e são variações do espectrograma. Recentemente, representações esparsas e relativas ao tempo receberam muita atenção. Essas representações são eficazes e evitam o trade-off entre tempo e frequência na transformação de Fourier. Mas pouco trabalho foi conduzido com streams de música. Esse trabalho explora esses features no contexto de sinais musicais, com foco em exemplos de músicas reais como entrada para a apredizagem supervisionada.</blockquote>