Quiénes somos
El grupo de investigación TecnoLeTTra de la Universitat Jaume I de Castellón tiene como líneas de investigación las Tecnologías del Lenguaje, la Terminología y la Traducción.
Abarcamos los ámbitos temáticos de: lenguajes de especialidad y terminología, semántica computacional, bases de datos léxicas y terminológicas, bases de conocimiento léxicas y terminológicas, ontologías léxicas, traducción asistida, traducción automática, localización, elaboración de corpus y extracción de terminología.
Además de las actividades de investigación, ofrecemos servicios de creación y digitalización de recursos lingüísticos en diversas lenguas a empresas e instituciones.
Un poco de historia
El grupo de investigación Tecnolettra se constituyó formalmente en enero de 2005, habiendo iniciado sus actividades en 2003, con el objetivo de profundizar en las líneas de investigación relacionadas con las Tecnologías del Lenguaje, la Terminología y la Traducción. En concreto, el grupo orienta sus actividades al estudio y desarrollo de tecnologías que apoyan el procesamiento del lenguaje, la terminología y la traducción, así como a la creación y desarrollo de recursos informáticos diseñados para organizar y gestionar información relacionada con el lenguaje y sus procesos.
En sus inicios, el grupo orientó sus actividades hacia la creación de recursos terminológicos basados en ontologías como base la creación diccionarios electrónicos de especialidad. Nos centramos principalmente con el lenguaje técnico y la terminología específica del sector de la cerámica industrial, un ámbito clave de desarrollo de la provincia de Castellón por su industria cerámica y el importante apoyo a la investigación en esta especialidad.
En el marco de los proyectos de investigación txt-Ceram, ONTODIC I, ONTODIC II, y proyectos de innovación educativa CREC I, CREC II, logramos resultados en la formalización de terminología de la cerámica, a partir del corpus y base de datos terminológica desarrollados en el grupo. Todo ello nos permitió analizar en qué forma debía adaptarse la base de conocimiento terminológica para encajar los datos terminológicos de tipo lingüístico y conceptual, que resultó en el modelo ONTODIC, un modelo de representación del conocimiento lingüístico basado en lógica (Alcina 2024). El modelo fue probado en el proyecto PRO-ONTODIC, en el que desarrollamos los primeros protocolos para la elaboración de bases de conocimiento terminológicas en el ámbito de la cerámica.
Actualmente, una vez se ha comprobado la validez del modelo en el ámbito de la cerámica, nos proponemos afrontar actividades que permitan ampliar el uso de este modelo a otros ámbitos y recursos terminológicos existentes o nuevos, y demostrar sus ventajas en la interoperabilidad de datos lingüísticos.
Además, nos planteamos potenciar el modelo ONTODIC en combinación con los modelos de lenguaje (LLM). La pregunta de investigación consiste en determinar si los LLM —y, en particular, los espacios de características derivados de Sparse Autoencoders— pueden explorarse de forma sistemática para distinguir significado conceptual y forma lingüística, y para identificar qué activaciones corresponden a propiedades gramaticales y morfológicas. Un objetivo adicional es analizar hasta qué punto estos patrones neuronales pueden alinearse o mapearse con las estructuras representacionales definidas en ONTODIC, evaluando así si los LLM codifican de manera implícita categorías lingüísticas comparables a las formalizadas en este modelo.
IP y miembros
La investigadora principal, Amparo Alcina, es catedrática de universidad en la Universitat Jaume I (UJI) desde 2009. Además, recientemente, tras un proceso de selección, se ha integrado como miembro de la UMI-ValgrAI (Unidad Mixta de Investigación ValgrAI “Valencian Graduated School and Research Network of Artificial Intelligence”), Fundación Valenciana que promueve la investigación en los límites de la Inteligencia Artificial. Cuenta con una extensa experiencia en investigación y publicaciones internacionales, avalada por cinco tramos de investigación concedidos por la CNEAI.
Como miembros de la Universitat Jaume I, se integran también en este momento Fabio Badenes (contratado predoctoral por la UJI) y Aitana Kalis (contratado predoctoral GVA), como estudiantes de doctorado. A partir del curso 2024-25 se incorpora la estudiante del Grado Mireia Beltrán, con una beca de iniciación a la investigación del Ministerio de Educación.
Desde 2023, al grupo se unió a nuestros proyectos el profesor Titular de Matemáticas, Joaquín Castelló (UJI), que colabora en la formalización e implementación de reglas lógicas que permiten la obtención de inferencias complejas en los datos terminológicos que procesamos con ayuda del editor de ontologías Protégé y su razonador Hermet.
Colaboración con empresas
A lo largo de su historia, Tecnolettra ha colaborado con diferentes entidades y empresas del sector de las industrias del lenguaje y la traducción.
Actualmente, para las actividades de investigación y comparación de los resultados de las bases de conocimiento terminológicas y los grafos de conocimiento contamos con la colaboración de los expertos e investigadores de la empresa Pangeanic, y de su gerente, Manuel Herranz. Pangeanic, una empresa valenciana de traducción con la que venimos colaborando en diferentes tareas académicas y en este caso también de investigación. Esta empresa también colabora con diversos agentes de investigación para finalidades conjuntas y es patrono de la Fundación ValgrAI.
