Identificación de idioma hablado en señales cortas aplicando transferencia de aprendizaje

Ana Rosa Montalvo Bereau, Flavio Jorge Reyes Díaz, Gabriel Hernández Sierra, José Ramón Calvo de Lara

Resumen


En el presente trabajo se abordó el reconocimiento automático del idioma hablado en señales de corta dura-
ción, empleando una red neuronal convolucional pre-entrenada sobre un conjunto de imágenes. Partiendo del
conocimiento transferido del dominio de imágenes reales a la clasificación de tareas sobre audio, se evaluó el
impacto del aprendizaje multitarea tomando el reconocimiento de idioma como tarea principal y el reconoci-
miento del locutor como tarea auxiliar. Los experimentos se llevaron a cabo sobre un subconjunto del corpus
VoxForge, y con una cantidad de señal significativamente menor a las empleadas por sistemas análogos de referencia. La evaluación se realizó sobre espectrogramas conformados con 3 segundos de señal. Los resultados arrojan que el reconocimiento del idioma hablado se beneficia del aprendizaje multitarea al usar como tarea auxiliar la identidad del locutor.


Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original.
_________________________________________________________________________________________________________

 INDEXACIÓN