El sacerdote Johannes Myronas no encontró en el año 1229 mejor soporte para escribir sus oraciones que un viejo pergamino de 300 años con unos textos griegos y formulaciones que no le decían nada. En esa época, cualquier soporte para escribir era un lujo. Borró el contenido copiado por un escriba anónimo en lo que hoy es Estambul, cortó las páginas, las dobló por la mitad y las sumó a otros pergaminos para escribir sus rezos. En el año 2000, un equipo de más de 80 expertos del Museo de Arte Walters de Baltimore (EE UU) se empeñó en descifrar qué había originalmente en el palimpsesto (manuscrito antiguo con huellas de una escritura anterior borrada artificialmente) y desveló, tras cinco años de esfuerzo, una copia de tratados de Arquímedes, como El método de los teoremas mecánicos, fundamentales para las matemáticas clásicas y modernas. Una investigación española publicada ahora en Mathematics aporta una fórmula para leer los originales alterados utilizando la inteligencia artificial que ahorrará, y habría ahorrado, el ingente trabajo para desvelar los textos ocultos y vulnerados. Las aplicaciones de esta tecnología van más allá de la historia borrada La ciencia no ha sido la única en sufrir los efectos de esta práctica: la Biblioteca Vaticana conserva un texto de un teólogo cristiano que borró fragmentos bíblicos de más de 1.500 años para expresar sus pensamientos. Varios tratados médicos griegos han sido descifrados tras las letras de una liturgia bizantina. La lista es extensa, pero podría ampliarse si la recuperación de esos originales no fuera tan compleja. Según explican los autores de la investigación publicada en Mathematics, José Luis Salmerón y Eva Fernández Palop, los textos primarios de los palimpsestos presentan alteraciones mecánicas, químicas y ópticas que obligan a recurrir a técnicas sofisticadas, como imágenes multiespectrales, análisis computacional, fluorescencia de rayos X y tomografía, para ser recuperados. Pero incluso estas técnicas, costosas, arrojan resultados parciales y limitados. Para salvar esta sima entre el original y el texto alterado “los avances recientes en inteligencia artificial (IA), particularmente en aprendizaje automático y aprendizaje profundo, han demostrado un potencial significativo para mejorar la asimilación de datos y la cuantificación de incertidumbre”, según escriben los autores. Su modelo permite la generación de datos sintéticos para modelar con precisión los procesos de degradación clave y salvar la escasez de información contenida en el objeto. También arroja mejores resultados frente a modelos tradicionales fundamentados en imágenes multiespectrales y permite la investigación con imágenes digitales convencionales. Salmerón, catedrático de IA en la Universidad Cunef, investigador de la Autónoma de Chile y directivo en Stealth AI Startup, explica que la investigación surge a propuesta de Eva Fernández Palop, quien trabaja en una tesis sobre palimpsestos. El investigador pensó entonces en la posibilidad de aplicar las nuevas técnicas computacionales. “La ventaja de nuestro sistema es que podemos controlar cualquier aspecto de estos sistemas, como el nivel de degradación, los colores, los idiomas… y eso permite generar una base de datos a la carta, con todas las posibilidades”, explica Salmerón. Han trabajado con textos en sirio, albanés caucásico y latín con resultados superiores a los arrojados por sistemas clásicos. La investigación incluye el desarrollo del algoritmo para que pueda ser utilizado por cualquier investigador. Porque este desarrollo no se limita a documentos históricos, sino que va más allá. “Este marco de red dual es especialmente adecuado para tareas que involucran patrones de datos ruidosos, parcialmente visibles o superpuestos”, aclara el investigador. Estos entornos se dan en el ámbito de las imágenes médicas, en sensores remotos, en microscopía biológica o en sistemas de inspección industrial, sin descartar la investigación forense de imágenes y documentos. Más informaciónTambién es aplicable en el campo de la ciberseguridad y del desarrollo de modelos de aprendizaje para la inteligencia artificial. “Las empresas pueden generar conjuntos de datos de alta calidad y seguros para la privacidad, para entrenar modelos de ML [modelos de lenguaje]crear prototipos de soluciones o simular operaciones, sin arriesgar información confidencial o esperar datos limpios del mundo real. Si se trabaja con registros de atención médica, transacciones financieras, comportamiento del cliente o cualquier dato tabular confidencial, este es un cambio de juego”, explica Salmerón. Los propios investigadores admiten limitaciones al método propuesto para la investigación de palimpsestos: “El enfoque muestra un rendimiento degradado cuando se procesan textos extremadamente difuminados con niveles de contraste inferiores al 5%, donde la información esencial del trazo se vuelve indistinguible del ruido del pergamino. Además, la eficacia del modelo depende de un cuidadoso equilibrio durante la fase de entrenamiento, ya que la representación desigual de los sistemas de escritura puede sesgar las características aprendidas”. No obstante, estas limitaciones solo animan a continuar con el trabajo iniciado no solo para superar las barreras detectadas sino también para su aplicación en otros campos.

Shares: