Inteligencia artificial para descubrir los secretos de los manuscritos
URJC/DICYT Investigadores de la Universidad Rey Juan Carlos (URJC) de Madrid han utilizado herramientas informáticas para conocer distintas características de los autores de textos escritos a mano. Los resultados abren nuevas posibilidades en campos como la Biometría Forense.
El estudio realizado por el grupo de investigación GAVAB (Grupo de Algoritmia aplicada a la Visión Artificial y Biometría) de la URJC es pionero en la aplicación redes neuronales profundas en la predicción del género y la mano de escritura (es decir, si la persona que escribe un documento es zurda o diestra). Estas redes son utilizadas en el ámbito de la Inteligencia Artificial (IA) para emular el funcionamiento del cerebro humano.
Los resultados publicados recientemente en la revista científica Complexity pueden aplicarse en ámbitos como la Biometría Forense, la Interacción Persona-Ordenador o la Seguridad Biométrica. “Por ejemplo, con respecto a la Biometría Forense, si se encuentra una pieza anónima de texto escrito a mano en el lugar de un delito, sería posible reconocer automáticamente que el escritor es un ‘hombre zurdo’. Por tanto, esto podría reducir la cantidad de sospechosos que se investigarían”, explica Ángel Sánchez, miembro del grupo GAVAB y coautor del estudio.
En otros campos, como el de la Interacción Persona-Ordenador, surgen nuevas posibilidades de interacción más personalizadas para llevar a cabo ese intercambio de información entre personas y computadoras. Igualmente, los sistemas de Seguridad Biométrica pueden beneficiarse de estos modelos de predicción de la escritura manuscrita, porque se pueden combinar con otras modalidades biométricas para mejorar la seguridad al acceder a sistemas informáticos. Por ejemplo, se podría combinar el uso de la huella dactilar (o la firma del usuario) con la escritura manuscrita para incrementar el nivel de seguridad en los accesos.
Además, los investigadores de la URJC han abordado también por primera vez el problema de combinar ambas predicciones (género y mano de escritura) a partir de un texto manuscrito usando también redes profundas. El promedio de los resultados obtenidos ha alcanzado en torno a un 75% de éxito en la predicción.
Análisis de textos manuscritos en inglés y árabe
El estudio se ha realizado sobre dos bases de datos públicas: IAM, que contiene textos en inglés, y KHATT con textos en árabe. “Durante la investigación ha sido especialmente delicado el problema de encontrar configuraciones adecuadas para los parámetros del sistema y conseguir unos resultados de predicción competitivos para cada uno de los problemas tratados”, señala el investigador de la URJC.
Para realizar este estudio se han usado principalmente dos herramientas software. Por un lado, la librería OpenCV para el preproceso de las imágenes de los textos manuscritos; y por otro, la librería Keras para la creación y el entrenamiento de los modelos de Deep Learning desarrollados.
A partir del análisis de textos empleando ambas bases de datos, los resultados alcanzados son los mejores publicados hasta la fecha para resolver el problema de predicción de la mano de escritura. Para la predicción de género, tal y como subraya Ángel Sánchez: “hemos conseguido unos resultados del 80,7% sobre la base de datos IAM y del 68,9% sobre KHATT”.
Referencia bibliográfica | |
Ángel Morera, Ángel Sánchez, José Francisco Vélez, and Ana Belén Moreno, “Gender and Handedness Prediction from Offline Handwriting Using Convolutional Neural Networks”, Complexity, vol. 2018, Article ID 3891624, 14 pages, 2018. doi:10.1155/2018/3891624. |