Transkribus Español: La revolución de la IA en la reescritura de textos
En el marco del Proyecto Carabela, investigadores de la Universitat Politècnica de València (UPV) y el Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico han desarrollado y aplicado nuevas técnicas de Inteligencia Artificial (IA) y Aprendizaje Automático (ML) para acceder a los contenidos de más de 130,000 imágenes del Archivo General de Indias y del Archivo Histórico Provincial de Cádiz.
“La creatividad es la inteligencia divirtiéndose.” – Albert Einstein
Reescribiendo la historia con la ayuda de la IA
Estas técnicas de IA y ML permiten rastrear y buscar documentos gráficos de forma rápida y precisa, identificando palabras, frases y combinaciones específicas. Los modelos estadísticos entrenados a partir de ejemplos se convierten en los aliados perfectos para el estudio de la historia de España y pueden aplicarse a otros documentos históricos.
El Archivo General de Indias alberga manuscritos relacionados con viajes y comercio naval español, cuya transcripción con técnicas tradicionales suele ser imprecisa. Sin embargo, gracias a las técnicas de IA y ML desarrolladas en el proyecto Carabela, ahora es posible indexar imágenes de texto manuscrito y analizar distintos estilos de escritura e imágenes de baja calidad.
El aprendizaje automático se llevó a cabo utilizando páginas seleccionadas del Archivo de Indias, lo que permitió obtener resultados satisfactorios incluso con una cantidad relativamente pequeña de datos de aprendizaje.
Descubriendo tesoros ocultos
El proyecto Carabela ha permitido descubrir información fascinante acerca de pecios, patrimonio arqueológico de gran riqueza histórica y cultural. Además, se han revelado datos poco conocidos sobre la historia de Australia a través de documentos del siglo XVIII.
El equipo del PRHLT (Pattern Recognition and Human Language Technology) también ha participado en el proyecto europeo READ, donde se han estudiado y analizado documentos del siglo de Oro de la literatura española, como manuscritos de Lope de Vega y correspondencia de los Hermanos Grimm. Han desarrollado la plataforma Transkribus, una herramienta revolucionaria que permite anotar imágenes de documentos antiguos y entrenar modelos de reconocimiento de texto manuscrito.
La plataforma Transkribus cuenta actualmente con más de 30,000 usuarios en todo el mundo y se ha convertido en una herramienta de referencia internacional para historiadores y amantes de la historia.
Aplicaciones y beneficios de la IA en la investigación histórica
La IA ha revolucionado la forma en que se preservan y analizan los archivos históricos. Gracias a las técnicas de IA y ML, ahora es posible acceder y buscar información en documentos gráficos de manera rápida y precisa. Esto ha facilitado enormemente el trabajo de los historiadores, permitiéndoles descubrir nuevos datos y perspectivas sobre el pasado.
La transcripción automática de documentos manuscritos es uno de los desafíos más importantes a los que se enfrentan los investigadores. Sin embargo, gracias a la IA, ahora es posible realizar esta tarea de manera más eficiente y precisa. La tecnología de reconocimiento óptico de caracteres (OCR) ha avanzado considerablemente, permitiendo la transcripción automática de textos manuscritos con una precisión cada vez mayor.
Además, la IA también ha ayudado a evitar el plagio al reescribir textos. Las herramientas y recursos desarrollados en el marco del proyecto Carabela y la plataforma Transkribus permiten detectar similitudes y variar palabras para evitar el plagio y garantizar la originalidad de los textos.
En conclusión:
La IA ha abierto un mundo de posibilidades en la investigación histórica. Gracias a técnicas como las desarrolladas en el proyecto Carabela y la plataforma Transkribus, ahora es posible acceder y analizar documentos históricos de manera más eficiente y precisa. Esto ha permitido descubrir nuevos datos y perspectivas sobre el pasado, así como preservar y proteger nuestro patrimonio cultural. La IA es una herramienta invaluable para los historiadores y amantes de la historia, y su impacto en la investigación histórica seguirá creciendo en el futuro.