Desarrolla Facultad de Computación BUAP software para procesar secuencias de ADN de microorganismos
MAS/BUAP/DICYT La colaboración entre científicos del Centro de Investigaciones en Ciencias Microbiológicas y de la Facultad de Ciencias de la Computación de la Benemérita Universidad Autónoma de Puebla (BUAP) permitió desarrollar un software especializado capaz de analizar y procesar secuencias de ADN de microorganismos.
El producto final de la cooperación es una herramienta informática que permite a los microbiólogos del Área de Microbiología Molecular del centro, perteneciente al Instituto de Ciencias (ICUAP), incursionar en estudios de genómica comparada de microorganismos desde el año pasado.
La primera versión del software, desarrollada por el equipo del doctor Iván Olmos Pineda, profesor investigador de la Facultad de Ciencias de la Computación, consigue analizar secuencias de ácido desoxirribonucléico o ADN, hallar patrones específicos, así como su lugar en la cadena, información de suma importancia para los microbiólogos.
Olmos Pineda refirió que la necesidad de los investigadores, dirigidos por el Doctor Candelario Vázquez Cruz, de contar con una herramienta computacional acorde con sus requerimientos y, sobre todo barata, que les permitiera procesar gran cantidad de secuencias, fue lo que los acercó a los expertos en computación.
La propuesta final fue un software capaz de detectar patrones con cierta estructura dentro de una secuencia de ADN: “Con la herramienta el microbiólogo puede cargar una base de datos que baja de la red, y a partir de esa información nuestro programa le permite buscar, con ciertos parámetros de entrada, patrones muy específicos”, precisó.
Si bien, admite que la herramienta no es tan poderosa como las existentes en el mercado, el experto en minería de datos y aprendizaje automático, destaca la importancia del desarrollo tecnológico al ser diseñado con tecnología mexicana, por contribuir a la formación de recursos humanos de alto nivel y por aportar soluciones a problemas sumamente específicos de la microbiología.
Así también, Olmos Pineda, enfatiza que de todo ello lo más importante es el avance científico logrado en ambos campos: “Por una parte los microbiólogos cuentan ahora con un software barato, cuyas nuevas versiones no les costarán, además de que progresan en sus investigaciones. Y nosotros avanzamos también al desarrollar nuevas técnicas informáticas para atender requerimientos muy particulares”.
Para el Doctor Candelario Vázquez Cruz, científico del Área de Microbiología Molecular del Centro de Investigaciones en Ciencias Microbiológicas, la herramienta ha sido de gran utilidad al abatir el tiempo de las investigaciones que pueden durar de entre 10 y 15 años a sólo dos, gracias a que la información obtenida con el análisis de las secuencias permite orientar los estudios.
“Ahora podemos orientar el destino y la solidez de la investigación, además de que se evitan múltiples experimentos. Si me interesa una función o una proteína trabajo sobre ello, ya no tenemos que buscar una aguja en un pajar, nos permite en un instante remover esa paja y quedarnos con lo que interesa”, comentó.
El nuevo software, destacó Vázquez Cruz, permite a su grupo realizar análisis genómicos de bacterias y hongos para una amplia gama de investigaciones: el perfeccionamiento de bioinsecticidas, estudios veterinarios y de hongos relacionados con infecciones en la agricultura, desarrollo celular y el análisis de microorganismos que intervienen en ciertas enfermedades humanas.
El poder del software
Sin duda, uno de los logros del desarrollo de la herramienta es el diseño a doc con las necesidades de las investigaciones en genómica comparada de microorganismos.
“El software es capaz de analizar secuencias de ADN, emprender la búsqueda de patrones específicos que el usuario proporciona como entrada, reporta sus posiciones, y adicionalmente proporciona herramientas de visualización a fin de que los microbiólogos puedan interpretar los resultados con mayor rapidez” precisa Olmos Pineda sobre las capacidades de la herramienta.
Aunado a ello, el software, construido a partir de técnicas de minería de datos y aprendizaje automático, es capaz de reportar una lista de los patrones y su ubicación, lo cual es de suma importancia en el momento de la interpretación por parte de los microbiólogos.
Otras facilidades que proporciona, apunta el experto, es el filtrado de información, pues visualiza patrones de tamaño específico y proporciona mayores datos sobre las letras o secuencias vecinas.
Sobre el fututo del proyecto, Olmos Pineda sostuvo que en estos momentos se trabaja en una nueva versión, la cual estará lista a finales de 2010: “Estamos diseñando un nuevo algoritmo para facilitar la búsqueda de patrones estructurados, es decir secuencias de ADN que no están aisladas sino combinadas, lo cual también proporcionará información muy valiosa a los científicos del Área de Microbiológica Molecular”.
El futuro de la minería de datos
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Para el investigador de la Facultad de Ciencias de la Computación, la técnica tiene un gran potencial en el desarrollo de software especializado para procesar y buscar datos en áreas como la medicina y los mercados financieros.
“En esas áreas es necesaria la búsqueda de patrones como herramienta para la toma de decisiones, y es ahí donde interviene la minería de datos y parte del aprendizaje automático. Aunque no es tan simple su desarrollo, al final se consiguen herramientas muy poderosas como la diseñada para los microbiólogos. Inclusive estamos trabajando también en una versión para diagnosticar leucemias”, resaltó.
Si bien opinó que México presenta cierto rezago en el desarrollo de software a partir de la minería de datos, si se compara con potencias mundiales como Estados Unidos, dada la cantidad de expertos dedicados al área, Olmos Pineda comentó que algunas instituciones ya son competitivas en ciertas áreas.
“Investigadores de la UNAM, el INAOE y la propia BUAP ya han desarrollado aplicaciones muy específicas, cuyas técnicas son publicables y reconocidas por la comunidad internacional”, agregó.
Por ello, consideró que las expectativas laborales para los estudiantes interesados en el estudio y la investigación sobre minería de datos, son muy amplias, pues en la actualidad la masa de egresados de las carreras en computación se dedica al diseño de páginas web o la instalación de redes, pero muy pocos se especializan en esta disciplina, a pesar de ser altamente competitivos y demandados por el mercado.