Propuesta PFC: analizador semántico de textos

El proyecto consiste en la elaboración de una herramienta que genere, a partir de un texto dado, los individuos de una ontología. Básicamente, el programa debe clasificar las palabras del texto según su categoría gramatical, su número, género, etc. usando una base de datos ya existente. La ontología resultante podrá ser consultada para obtener información relevante sobre el texto en cuestión.

Para la realización del proyecto no se requieren conocimientos sobre ontologías. Solo hacen falta dos líneas para crear el individuo en la ontología y establecer las relaciones con sus palabras vecinas. Además, se dispone de un prototipo, cuyas fuentes se facilitarán al alumno al comienzo del proyecto, capaz de procesar el texto y crear los individuos en la ontología. El prototipo está implementado en Java y utiliza Jena para manejar la ontología e HyperSQL para consultar las características de las palabras (categorías gramaticales, género, número...). El proyecto consiste, básicamente, en replicar la funcionalidad del prototipo en una aplicación más robusta, flexible y fiable. 

Este proyecto no requiere la elaboración de una aplicación con interfáz gráfica. Puede ser suficiente la elaboración de una herramienta que funcione a través de la línea de comandos. También podría ser interesante la elaboración de un servicio Web o un servidor RMI para el procesado remoto de los textos.