Alimentación España , Burgos, Viernes, 04 de marzo de 2011 a las 18:01

Registran la protección de una aplicación que permite la conversión de voz-texto en tiempo real

La herramienta desarrollada en la Universidad de Burgos mejora la calidad de vida de personas con discapacidad auditiva

Antonio Martín/DICYT Como si fuera un taquígrafo que transcribe la información de un conferenciante en tiempo real, un estudiante de Ingeniería Técnica en Informática de Gestión de la Universidad de Burgos ha ideado una herramienta que integra la conversión voz-texto en tiempo real y facilita el seguimiento de las clases para alumnos con discapacidad auditiva. La institución educativa, a través de su Oficina de Transferencia de Resultados de Investigación y Conocimiento (OTRI-OTC), anunció hoy que ha registrado la protección de los derechos de propiedad intelectual del software, que fue premiado en un concurso de prototipos dentro del Proyecto de Transferencia de Conocimiento Universidad-Empresa.

La aplicación nació de las inquietudes de miembros de la Asociación para la Reeducación Auditiva de Sordos de Burgos (Aransbur). Los integrantes de esta organización querían lograr un dispositivo que cumpliera las funciones que un intérprete de signos realiza: transmitir lo que se dice a una persona que no puede percibir los sonidos. Bajo la tutoría del profesor Pedro Luis Sánchez, el alumno Carlos Tejedor diseñó una herramienta que elimina estas barreras de comunicación. HADA, como se denomina el invento (Herramienta de Asistencia para Discapacitados Auditivos) se basa en el desarrollo de una serie de aplicaciones que permite la conversión de la voz en texto de manera instantánea, sin desfases entre el emisor y el receptor. La aplicación permite la integración, además de discursos de profesores en el campo docente, de material multimedia que se emplee en clase, como por ejemplo la exhibición de una película subtitulada.

"El software capta el audio y lo transmite en tiempo real, como si fuera una emisión vía streaming", explica a DiCYT su creador. Así, por ejemplo, cuando un profesor imparta una clase magistral, el sistema recibe el sonido y lo convierte en caracteres textuales, en un texto escrito, que es leído en tiempo real por el alumno con una discapacidad auditiva. El sistema no solo facilita el seguimiento de la clase a este alumno, también puede ayudar al resto, ya que este contenido generado se puede almacenar. Como ventajas, resume Carlos Tejedor, está la posibilidad de "transmitir o implementar otros contenidos multimedia a la vez, como un vídeo, y reproducir simultáneamente los subtítulos para estos contenidos".

El discurso del profesor se captura a partir de micrófonos, tanto unidireccionales como bidireccionales, como de cámaras web con micrófono integrado. Un servidor dotado con la aplicación convierte este audio en texto y es transmitido inmediatamente a los dispositivos receptores, que pueden ser móviles, portátiles o tabletas dotadas de Windows Mobile. "Sirve para cualquier dispositivo que soporte Java", resume el desarrollador. La transmisión se puede realizar tanto por cable como Wi-Fi. La visualización en el dispositivo receptor, por ejemplo, en la pantalla del ordenador, permite ordenar los diferentes canales que se reciben en función del interés en cada uno de ellos. Se podría, por ejemplo, ver a mayor tamaño un vídeo y seguir en una ventana más pequeña las explicaciones orales que se están ofreciendo sobre estas imágenes.

Transmisión simultánea

La principal novedad del prototipo ahora protegido con derechos de propiedad intelectual reside más en la transmisión simultánea que en la conversión del audio en un documento escrito. Para la reproducción instantánea en texto de un discurso oral, ha sido necesario crear una aplicación que realice la transmisión en tiempo real. "Existían programas orientados al inglés, pero no llegaban a ser iguales al que hemos desarrollado", explica Tejedor. En el caso de la conversión audio-texto, ya existen en el mercado aplicaciones que realicen esta acción. Según indicó el investigador principal del proyecto, ya existen empresas que se han interesado por el ingenio. El invento no se reduce al ámbito educativo, ya que se puede aplicar en otros campos, como las conferencias, previo entrenamiento de las propiedades de la voz del conferenciante, y se puede incrustar en la web para la lectura de audios o de las emisiones de la radio.

El proyecto fue seleccionado para ser dotado con una beca en la I Convocatoria del desarrollo de Prototipos Comercializables puesta en marcha por la OTRI-OTC de la Universidad de Burgos y que forma parte de la Estrategia regional de Transferencia de Conocimiento Universidad-Empresa. La convocatoria de la segunda edición está dirigida a estudiantes y alumnos de últimos cursos de cualquiera de las titulaciones, maestrías y doctorados que se imparten en esta institución académica, con el objetivo de desarrollar actividades de transferencia de conocimiento durante su proceso formativo mediante la materialización y desarrollo de prototipos con posibilidades de ser comercializados en el mercado.