Análisis de tendencias en adopción IA | Proyecto CIESAS | México
Conócenos
Análisis de tendencias en adopción IA | Proyecto CIESAS | México

La HistorIA prefiere Paleografía Inteligente

Paleografía Intel

La HistorIA prefiere Paleografía Inteligente

PolifonIA.org | Carlos Macías. La vamos a llamar de modo atrevido Paleografía inteligente, a pesar de que sabemos que es por excelencia la disciplina dedicada a estudiar la escritura antigua.

Los recursos de que dispone la Paleografía inteligente la han llevado a ser uno de los campos del conocimiento histórico y lingüístico que recibe mayores y mejores influencias, y que perfila enormes posibilidades para su tranformación.

Con tales recursos, la Paleografía inteligente ha podido dejar atrás el vetusto mecanismo OCR (Reconocimiento Óptico de Caracteres).

Imagen: Paleografía Inteligente (Grok 4.1).

Al menos por esta aportación -aunque existen muchísimas más-, creeemos que la Inteligencia Artifical será la compañera de viaje más apreciada por las personas que se dedican al estudio de la Historia.

Lo será, cierto, pero junto con los testimonios innumerables de siempre; los que provienen de la antiguedad.

Por todo ello, la Inteligencia Artificial no debe ser vista como una aliada incómoda o inorportuna.

Mayores recursos para la Paleografía

La Paleografía Inteligente ofrece beneficios al trabajo intensivo, a la documentación especializada y, por consecuencia, a la interpretación histórica.

Cada semana, cada mes, los LLM muestran avances notables. Proveen medios y alternativas para desarrollar nuevas tareas. Así se mentendrán en lo sucesivo.

Lo más probable es que ello pueda ocurrir en la forma de una confluencia masiva de agentes, animados por los más avezados LLMs, los cuales, a su vez, estarán equipados generosamente con TPUs (o lo que les siga).

La tendencia a la mejora en las capacidades de los LLM ha sido previsible y acelerada en años recientes.

Lo planteamos por este medio hace casi tres años, a finales de 2022, cuando los LLM iniciaron su consolidación de la mano de ChatGPT 3.5 (OpenAI).

Era notorio entonces su amplio potencial, por las respuestas que nos ofreció en el campo de la paleografía, así como en la frase poética dedicada a la Antropología.

100 años de avance en recursos técnicos para la Historia

El siglo XX resultó pródigo en avances técnicos para facilitar a los historiadores la consulta de los acervos.

Desde la década de 1920 se presentaron algunas propuestas de microfilmación documental.

Fue hasta 1936 cuando los Archivos Nacionales de Washington introdujeron un ambicioso programa de reproducción documental, dirigido a facilitar la consulta.

El proceso de microfilmación fue reforzado de modo deliberado ante el amago de la segunda guerra. Con motivaciones de preservación, los Archivos Nacionales exhortaron a universidades e instituciones de ese y de otros países a procurar la reproducción y a estimular el uso de lectores.

Los modelos de lector fueron mejorando. Casi de modo simultáneo, The New York Times, la Harvard University Library y la Sociedad de Archivistas Americanos acogieron el proyecto de reproducir varias colecciones hemerográficas y de archivo, en rollos de microfilm de 35 milímetros.

En las siguientes décadas el proceso se reproducción y de consulta se extendió a algunos países de América Latina.

Un congreso extraordinario del Consejo Internacional de Archivos (ICA), celebrado en Washington en 1966, incentivó la discusión para atender con mayor énfasis las prioridades de la microfilmación en los distintos países, con mejores formas de consulta.

Imagen: Sala de lectura de los Archivos Nacionales (EU), 1957. Cortesía: Archivos Nacionales.

Los imprescindibles archivos españoles empezaron a hacer lo propio, con el respaldo del ministerio de Cultura y, en particular, del Consejo Superior de Investigaciones Científicas (CSIC).

En Europa se extendió también la colaboración entre bibliotecas y centros de investigación durante la posguerra. Fabricantes alemanes y franceses de lectores de microfilm distribuyeron sus equipos por casi todo el continente.

El Centro Nacional de Investigación Científica (CNRS) francés colaboró con instituciones hispanas.

Por ejemplo, el modelo de proyector y lector de 35 milímetros (Tipo J), elaborado por la compañía Societe Generale d’Optique Huet, de acuerdo con el museo virtual de la ciencia (del CSIC), tuvo una representación regular en Madrid a cargo de “Microfilm Español S. A.”.

En México, creemos recordar que la galería siete (“Archivos Incorporados”) del Archivo General de la Nación, aún a principios de 1980, conservaba el modelo que arriba mostramos.

En la galería siete del AGN se podían consultar, por entonces, cientos de rollos útiles. Gracias a esa accesibilidad, pudimos conocer antecedentes biográficos de personas de interés en la historia de los estados de la República.

Esas colecciones de cajas con rollos probablemente fueron facilitados por los patrocinadores actuales de FamilySearch: registros de matrimonios, nacimientos, bautismos, confirmación, defunciones, entre otros.

En la misma época, recordamos que El Colegio de México contaba en la biblioteca Cosío Villegas con equipos de modelo similar, empleados para la consulta de colecciones de rollos que contenían documentos consulares (historia diplomática).

Por cierto, también disponía el ColMex, en 1983, de una amplia sala de cómputo diríamos “blindada”, donde se impartía el curso correspondiente, equipada con un armatoste -tal vez Sperry Rand- que aún procesaba cálculos con tarjetas perforadas.

De los programas OCR a la Paleografía Inteligente

Con todo, la necesidad de transcribir textos plasmados en superficies de difícil recuperación había permanecido como una prioridad profesional.

Una prioridad que ha sido asumida por los sucesivos géneros de software desarrollados hasta ahora, al menos desde la década de 1970.

Nos recuerda Verify, que “la primera fuente que resultó legible a través de una máquina de modo óptico (OCR-A) fue desarrollada en 1968, por el diseñador tipográfico suizo Adrian Frutiger”.

Pero sería hasta la década de 1970 cuando otro diseñador, Ray Kurzweil, dio vida a un sistema mecánico (el sistema OCR omni front), acompañado por un escaner de cama plana (CCD), que marcaron el rumbo del desarrollo posterior.

Los llamados programas basados en OCR han recorrido un trecho prolongado y con altibajos en cuanto a su maduración.

Con el tiempo aparecieron otras tecnologías. Entre ellas, el Reconocimiento Inteligente de Palabras (IWR), el Reconocimiento Inteligente de Caracteres (ICR) y el Reconocimiento Óptico de Palabras (OWR).

Pero siempre fue el Reconocimiento Óptico de Caracteres (OCR) el sobreviviente de preferencia; el estandar para lectura más utilizado.

Los programas OCR trabaron convergencia con los sistemas de fax (para superar aquellas presentaciones resueltas en imagen en papel, y sólo con datos binarios).

Cuando llegaron los sistemas en línea (en nuestro tiempo, ya en la nube), los OCR también incorporaron su experiencia.

No sabemos, a estas alturas, si al desarrollo tecnológico y académico le ha venido bien la predominancia que en las últimas dos décadas ha mantenido una empresa creada en Adobe Creek, en California (por fundadores que provenían de Xerox).

Diríamos que ahí se ha ejercido cierto control sobre los formatos.

1. Elección del LLM: Gemini 3

¿Por qué hemos elegido, por el momento, realizar Paleografía Inteligente con Gemini?

Porque Gemini 3 resulta funcional. Ofrece respuestas con variantes de interés, para una mejor interpretación.

En el fondo, lo hemos elegido por las razones que desarrollamos en nuestro reciente artículo sobre este tema.

2. Elección del ejemplo documental

Ahora debemos trabajar con un documento que, digamos, resulte representativo del siglo XVI.

¿Qué documento elegirías como ejemplo?

De preferencia iniciar con una página que contribuya a clarificar el proceso de transcripción para las personas lectoras.

Nos decantamos por la primera página de una carta fechada en 21 de mayo de 1574.

El documento proviene del Archivo General de Indias. Podemos acceder a él en línea, gracias a la plataforma Portal de Archivos Españoles (PARES). Como se sabe, PARES es patrocinado por el Ministerio de Cultura del Gobierno de España.

Imagen: página PaleografIA (21 de mayo, 1574).

La referencia específica es la siguiente:

  • Título atribuido: Informaciones Mérida de Yucatán.
  • Signatura: México, 212, N. 54.
  • Código de Referencia: ES. 41091. AGI / 22 // MEXICO, 212, N.54.
  • Contenido: testimonio de lo llevado a cabo por la ciudad de Mérida de Yucatán ante el obispo (Diego de Landa), debido a las palabras de fray Melchor de Campo, de la orden de San Francisco.

El documento elegido se expidió en la ciudad de Mérida (Yucatán), el 21 de mayo de 1574.

De acuerdo con su cotenido, ahí “los procuradores” de las “Provincias de Yucatán” dan cuenta del “ánimo airado” con que culminó un sermón sobre el Santo Evangelio.

El sermón fue emitido por el sacerdote franciscano Fray Melchor de Campo.

El documento se dirige al ya por entonces obispo Fray Diego de Landa.

El referido sermón es definido, en los hechos, como incendiario y falto de verdad.

No sobra mencionar que Fray Diego de Landa es un personaje clave en la historia de Yucatán en el siglo XVI. Si quieres conocer un poco más acerca de él, accede a nuestro anterior artículo.

3. Transcripción literal

Ponemos en juego las posibilidades de Gemini 3.

Le hemos pedido que lo transcriba respetando al máximo la ortografía, la puntuación, las mayúsculas y las abreviaturas originales del siglo XVI.

La siguiente es la trascripción literal y fiel del documento que arroja el LLM, después de proporcionarle el texto.

4. Autonomía para corregir

En la transcripción, puede apreciarse que Gemini 3 toma con autonomía la decisión correcta al identificar diversas abreviaturas, como las siguientes:

  • m.d (merced);
  • yll.e (ilustre);
  • r.mo (reverendísimo);
  • v. s. (vuestra señoría);
  • nro (nuestro);
  • dho/dha (dicho/dicha);
  • ffray (fraile); y
  • Jhesu xpto (Jesucristo).

5. La versión “depurada”

Una vez revisada la versión literal que nos entregó, solicitamos a Gemini 3 que intentara “limpiar” la versión original, es decir, que nos entregara una versión transcrita según los términos que hoy emplea la lengua castellana.

En respuesta, nos propuso una versión adaptada al castellano contemporáneo.

Pero ha decidido con autonomía actualizar la ortografía, la puntuación y la sintaxis.

Es evidente que hizo lo posible por mantener el sentido jurídico y la idea de fondo de la queja ante el obispo.

Esta es la versión “depurada” que entrega.

¿Cuáles son los sesgos probables de la versión “depurada”?

Lo notable de Gemini 3 es que nos advierte de su método y de los sesgos probables que comporta su transcripción.

Las siguientes son algunas advertencias razonables que nos proporcionó acerca de la transcripción “refinada”:

  • “Trabajé en la traducción del documento español arcaico -señala el LLM-. El reto radica en plasmar con precisión sus matices del siglo XVI en un lenguaje moderno.
  • Me centré en preservar la intención original y, al mismo tiempo, hacerlo accesible al público contemporáneo.
  • Esto ha requerido una cuidadosa consideración de la ortografía, las abreviaturas y la estructura de las oraciones.
  • Sobre las Acusaciones: Mi enfoque se ha centrado en las acusaciones específicas formuladas por Fray Melchor de Campo.
  • Analicé cuidadosamente las acusaciones de “robadores de la sangre de los indios” y las críticas al comportamiento de las mujeres.
  • También consideré las implicaciones de la acusación de “prevaricadores de la fe”.
  • El lenguaje es contundente y me he esforzado por transmitir su gravedad en el contexto de la Mérida del siglo XVI.”

Autonomía para depurar

Nos propuso diversas adaptaciones. Es evidente que aún puede tener equivocaciones; y que, por ejemplo, fuera de la transcripción literal, prefiera emplear el término ‘de los indígenas’ al original: ‘de los indios’.

Creemos que este tipo de recomendaciones son procedentes, en general. Pero depende de cada persona historiadora, al dar el visto a la versión propuesta de la correspondencia; es decir, si decide tomarlas o desecharlas.

  • En sintaxis: dividió párrafos y oraciones, por ser muy largos. (Le puedo solicitar que no lo haga). Se tomó también la licencia de cambiar conectores, por considerarlos repetitivos (la “y” o “el dicho”). Lo mismo, le puedo solicitarle que se abstenga de hacerlo, porque no me interesa que realice una corrección de estilo al documento.
  • En ortografía: sustituyó grafías antiguas (“ff” por “f”), (“ç” por “z/c”) y “v” inicial por “u”. Colocó las tildes faltantes. Aquí no vemos problema con las sugerencias.
  • En un término específico: se tomó la licencia de cambiar la expresión “mugeres eran de su luz.a”, con “dadas a la lujuria”. Resulta que Gemini 3 entendió, con razón, que ese era el verdadero sentido de la queja moralista del fraile. En este caso, aceptamos el sentido propuesto de la expresión, pero preferimos no tomarlo.
  • En las fórmulas de cortesía: propuso desatar las abreviaturas (v. s. r.ma por Vuestra Señoría Reverenda, etc.), para dar fluidez al texto. Está en lo correcto, pero preferimos mantener fidelidad con las abreviaturas.

Los LLM, herramientas que llegaron para mejorarse

Como puede verse, el fragmento documental ilustra el ambiente de discordia e inconformidad ante el comportamiento de una parte de los habitantes (colonos) españoles.

Es probable que la evolución de los LLMs los lleve hacia la virtual omnipresencia y una mayor accesibilidad (como mesa de trabajo, para interacción cotidiana).

Por el momento éstos representan nuestro primer acceso para encontrar respuestas y optimización de una tarea de suyo laboriosa, como es la presente.

Gemini 3 y los LLM aportarán aún más a la Paleografía Inteligente.

Por ahora, ya no sólo transcriben e intentan explicar el contexto. También sugieren interpretaciones posibles sobre la motivación que posee cada persona involucrada en la correspondencia.

Comparten, de hecho, algunas inferencias sobre el ambiente social que podría derivarse de la lectura detenida del contenido de la correspondencia.

Mucho trabajo espera a la persona historiadora, ante el contexto especulativo vigente, que parece anticipar infinitas posibilidades.

Estimamos que se presentarán consecuencias de consideración ante el eventual arribo de la llamada Inteligencia Artificial General (AGI).

¿Qué opinión te merece el estado de avance de la PaleografIA?

Imagen de la Portada: Fusión de texto antiguo con Paleografía Inteligente, creado por Gemini 3 (modalidad: Razonamiento).

Comentarios

Gabriela Solís
diciembre 23, 2025
Responder

Muchas gracias por el ejemplo brindado sobre la paleografía hecha con IA. Es sin duda un avance para acercarse a la lectura de documentos antiguos y habrá que ponerla a discusión en las clases de paleografía impartidas a estudiantes. Encontré algunos errores y varias inconsistencias en la transcripción literal y problemas en la versión “depurada” para utilizar y citar la información que se recupera del original. Se trata de un documento bastante legible sin mayores dificultades en la lectura de términos y abreviaturas y sin vocablos en maya u otras lenguas originarias que tal vez complicarían la lectura de la IA. Pero la discusión puede centrarse en ese muy libre acomodo de sintaxis para hacer el texto entendible al lector contemporáneo que puede influir en la interpretación del contenido.

Valentina Garza
diciembre 25, 2025
Responder

Sin duda, lo que muestra ahora la IA con Gemini 3 y los LLM sobre transcripción de documentos antiguos es sorprendente. Hasta hace poco esta posibilidad no estaba considerada al alcance de la tecnología existente. Sin embargo, los resultados no son confiables aún, el riesgo de errores en la transcripción y la posibilidad de tergiversar el contenido del documento son altos. Quien haga uso de esta herramienta debe cotejar la lectura de la IA con el documento original. ¿Se tendrá siempre este cuidado?

Comenta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Recientes

entrevista

Alucinaciones IA, etnografía e investigación cualitativa

Revisión de herramientas de IA que podrían tener aplicación intensiva en tareas que desarrollan estudiosos de Ciencia
Leer mas
landa

El Padre Landa en Yucatán, visto por Gemini IA

Conoce el potencial de Gemini. Se alude a la correspondencia alrededor de un personaje del mundo novohispano del siglo X
Leer mas