Tecnología México Nuevo Le贸n, Nuevo León, Viernes, 29 de enero de 2010 a las 18:58

Con sistema de conexi贸n de contenidos en Internet obtienen Premio LA-WEB

La alumna Sara Garza Villareal es parte de la C谩tedra Inteligencia de Contexto dirigida por el doctor Ram贸n Brena

JST/Tec de Monterrey/DICYT Un sistema para clasificar temáticamente la información contenida en la red, mereció el Premio al Mejor Trabajo en la conferencia internacional "Latin American Web Congress (LA-WEB) 2009" para Sara Garza Villarreal, estudiante del doctorado en Tecnologías de Información y Comunicaciones, y para el doctor Ramón Brena Pinero, Director de Maestrías en Computación de la División de Mecatrónica y Tecnologías de Información.

 

Celebrando su séptima edición el pasado mes de noviembre en Mérida, Yucatán, el evento concedió la distinción a este trabajo como el mejor artículo. "Se trata de un reconocimiento obtenido en una conferencia sobre inteligencia artificial donde especialistas en el área destacaron la originalidad de su enfoque", enfatizó el doctor Brena.

 

La investigación, indicó la doctoranda Garza Villarreal, intenta organizar automáticamente la información en sitios o colecciones de Web, como Wilkipedia, sin necesidad de que los editores hagan esto manualmente, hecho casi imposible sobre casi cuatro millones de artículos, que siguen aumentando.

 

¿Cómo se da actualmente el proceso de clasificación?

 

Cada página de Internet tiene una cierta jerarquización y directorio; éste cubre un porcentaje pequeño de la Web y es difícil hacerlo manualmente. "Estamos tratando de crear en la Web grupos de artículos que estén relacionados por un tema, utilizando las interligas que permitan establecer esas relaciones; por ejemplo una página de música de rock, que va a ligar a determinada banda de rock, es más probable que ligue a documentos relacionados con música de rock, que a documentos de física cuántica", aseguró el doctor Brena.

 

"Esta es la premisa por la que trabajamos, los artículos que están relacionados se refieren mucho entre sí, lo que nos ayuda a que con base en las ligas podamos armar grupos", explicó Garza.

 

De forma pragmática tomamos un artículo que tiene hiperligas hacia otros; mediante un algoritmo que identifica ligas afines, vamos detectando cada uno de esos artículos que se van ligando, tratando de que siempre vaya en aumento la densidad. "Queremos que estén muy conectados pues éste es un indicador de que son temas- vamos sumando documentos al grupo, luego elegimos otro artículo y así sucesivamente, tenemos una forma de agrupar", acotó la autora.

 

Si bien el uso de algoritmos para agrupar páginas ha sido desarrollado tiempo atrás, su fin eran las redes sociales, para tratar de detectar comunidades en su interior. Dada la referencia, explica el doctor Brena, desde 2008 empezamos a preguntarnos si, en el caso de la Wilkipedia, las ligas no querrían decir que estamos hablando de un mismo tópico. Esta hipótesis es original, empezamos a trabajar en ella y los resultados de Sara muestran que está plenamente justificada, es decir, que al analizar las ligas del documento, encuentra ligas que temáticamente están relacionadas.

 

"Sara merece todo el crédito de esta innovación: el uso del análisis de la estructura de ligas del documento para identificar los tópicos que existen en una colección es una contribución al estado del conocimiento que en sí misma justifica la razón de ser de su doctorado", concluyó el doctor Brena.

 

Una patente en proceso

 

El doctor Ramón Brena, profesor titular de la cátedra y líder del proyecto que ya cuenta con una solicitud de patente ante el Instituto Mexicano de Propiedad Industrial (IMPI), destacó además que con esta tecnología se escogerán los anuncios de una manera más fundamentada que la tradicional, pues actualmente las asociaciones entre las páginas Web y los anuncios no es totalmente buena.

 

El proyecto fue presentado el pasado 20 de enero en la cuadragésima edición del Congreso de Investigación y Desarrollo del Tecnológico de Monterrey como parte de la exposición alterna "Tecnologías para comercializar".