Tecnología Colombia , Caldas, Jueves, 03 de enero de 2013 a las 10:28

Un método desarrollado en la Universidad Nacional mejora el análisis de la voz

Esta innovación podría aplicarse en campos como la medicina para mejorar las terapias de la voz

UN/DICYT  Investigadores de la Universidad Nacional (UN) de Colombia realizaron aportes tendientes a desarrollar un sistema con capacidad de inferir el movimiento de los articuladores de la voz de forma personalizada, un gran avance en esta área. La inversión articulatoria es un campo dentro del procesamiento de señales de voz que tiene por objeto determinar la posición y el movimiento de los articuladores (ápice, cuerpo y dorso de la lengua, velo del paladar, labios superior e inferior, y mandíbula) a partir de los registros acústicos obtenidos mediante micrófonos.

 

Este aspecto representa un reto dentro del análisis de la voz porque en el mundo aún no se cuenta con un sistema que permita resolver esta tarea de forma satisfactoria.

 

Para tal fin, el proyecto del Doctorado en Ingeniería - Línea Automática, del investigador Franklin Alexander Sepúlveda de la Sede Manizales realizó dos importantes contribuciones.

 

La primera consiste en un método que permite la estimación de la posición de los articuladores críticos (por ejemplo los labios en el caso de las consonantes /p/, /b/ y /m/), con menor incertidumbre respecto a otras técnicas también desarrolladas recientemente.

 

En segunda instancia, con la inversión articulatoria que se desarrolla en la actualidad se obtienen modelos que funcionan de manera personal y sin la posibilidad de extrapolar el mismo modelo a otros hablantes; sin embargo, el método del ingeniero Sepúlveda permite estimar el movimiento de los articuladores críticos involucrados en la producción de fonemas como /f/, /v/ y /s/ en forma independiente del emisor, es decir, este sistema proporciona un patrón general.

 

A futuro, esta innovación podría aplicarse en campos como la medicina para mejorar las terapias de la voz, ya que al contar con un medio que permita a quien genera el registro observar el movimiento de sus propios articuladores al mismo tiempo que el especialista, dará mayores herramientas para tomar los correctivos necesarios.

 

De forma similar, la misma capacidad de observar la propia la actividad articulatoria podrá ser de utilidad para sistemas de aprendizaje de idiomas.

 

Asimismo, la tecnología de la inversión articulatoria podría mejorar el desempeño de los sistemas de traslación de voz a texto, en particular en aquellos ambientes ruidosos; igualmente, permitiría ahorrar recursos en los sistemas de telefonía debido a su potencial utilidad desde el punto de vista de codificación de la voz.

 

La primera contribución ha sido aceptada para publicación en la revista Speech Communication y la segunda se encuentra en proceso de publicación.