PolifonIA.org | Carlos Macías. La vamos a llamar de modo atrevido Paleografía inteligente, a pesar de que sabemos que es por excelencia la disciplina dedicada a estudiar la escritura antigua.
Los recursos de que dispone la Paleografía inteligente la han llevado a ser uno de los campos del conocimiento histórico y lingüístico que recibe mayores y mejores influencias, y que perfila enormes posibilidades para su tranformación.
Con tales recursos, la Paleografía inteligente ha podido dejar atrás el vetusto mecanismo OCR (Reconocimiento Óptico de Caracteres).

Al menos por esta aportación -aunque existen muchísimas más-, creeemos que la Inteligencia Artifical será la compañera de viaje más apreciada por las personas que se dedican al estudio de la Historia.
Lo será, cierto, pero junto con los testimonios innumerables de siempre; los que provienen de la antiguedad.
Por todo ello, la Inteligencia Artificial no debe ser vista como una aliada incómoda o inorportuna.
Mayores recursos para la Paleografía
La Paleografía Inteligente ofrece beneficios al trabajo intensivo, a la documentación especializada y, por consecuencia, a la interpretación histórica.
Cada semana, cada mes, los LLM muestran avances notables. Proveen medios y alternativas para desarrollar nuevas tareas. Así se mentendrán en lo sucesivo.
Lo más probable es que ello pueda ocurrir en la forma de una confluencia masiva de agentes, animados por los más avezados LLMs, los cuales, a su vez, estarán equipados generosamente con TPUs (o lo que les siga).
Te preguntarás: ¿en qué consisten los llamados agentes, los LLMs y los TPUs? Recuerda, estimado lector, puedes hacer clic en los tres enlaces y conocerás cómo hemos abundado recientemente sobre cada uno de ellos en este mismo espacio.
La tendencia a la mejora en las capacidades de los LLM ha sido previsible y acelerada en años recientes.
Lo planteamos por este medio hace casi tres años, a finales de 2022, cuando los LLM iniciaron su consolidación de la mano de ChatGPT 3.5 (OpenAI).
Era notorio entonces su amplio potencial, por las respuestas que nos ofreció en el campo de la paleografía, así como en la frase poética dedicada a la Antropología.
100 años de avance en recursos técnicos para la Historia
El siglo XX resultó pródigo en avances técnicos para facilitar a los historiadores la consulta de los acervos.
Desde la década de 1920 se presentaron algunas propuestas de microfilmación documental.
Fue hasta 1936 cuando los Archivos Nacionales de Washington introdujeron un ambicioso programa de reproducción documental, dirigido a facilitar la consulta.
El proceso de microfilmación fue reforzado de modo deliberado ante el amago de la segunda guerra. Con motivaciones de preservación, los Archivos Nacionales exhortaron a universidades e instituciones de ese y de otros países a procurar la reproducción y a estimular el uso de lectores.
Los modelos de lector fueron mejorando. Casi de modo simultáneo, The New York Times, la Harvard University Library y la Sociedad de Archivistas Americanos acogieron el proyecto de reproducir varias colecciones hemerográficas y de archivo, en rollos de microfilm de 35 milímetros.
En las siguientes décadas el proceso se reproducción y de consulta se extendió a algunos países de América Latina.
Un congreso extraordinario del Consejo Internacional de Archivos (ICA), celebrado en Washington en 1966, incentivó la discusión para atender con mayor énfasis las prioridades de la microfilmación en los distintos países, con mejores formas de consulta.

Los imprescindibles archivos españoles empezaron a hacer lo propio, con el respaldo del ministerio de Cultura y, en particular, del Consejo Superior de Investigaciones Científicas (CSIC).
En Europa se extendió también la colaboración entre bibliotecas y centros de investigación durante la posguerra. Fabricantes alemanes y franceses de lectores de microfilm distribuyeron sus equipos por casi todo el continente.
El Centro Nacional de Investigación Científica (CNRS) francés colaboró con instituciones hispanas.
Por ejemplo, el modelo de proyector y lector de 35 milímetros (Tipo J), elaborado por la compañía Societe Generale d’Optique Huet, de acuerdo con el museo virtual de la ciencia (del CSIC), tuvo una representación regular en Madrid a cargo de “Microfilm Español S. A.”.
En México, creemos recordar que la galería siete (“Archivos Incorporados”) del Archivo General de la Nación, aún a principios de 1980, conservaba el modelo que arriba mostramos.
En la galería siete del AGN se podían consultar, por entonces, cientos de rollos útiles. Gracias a esa accesibilidad, pudimos conocer antecedentes biográficos de personas de interés en la historia de los estados de la República.
Esas colecciones de cajas con rollos probablemente fueron facilitados por los patrocinadores actuales de FamilySearch: registros de matrimonios, nacimientos, bautismos, confirmación, defunciones, entre otros.
En la misma época, recordamos que El Colegio de México contaba en la biblioteca Cosío Villegas con equipos de modelo similar, empleados para la consulta de colecciones de rollos que contenían documentos consulares (historia diplomática).
Por cierto, también disponía el ColMex, en 1983, de una amplia sala de cómputo diríamos “blindada”, donde se impartía el curso correspondiente, equipada con un armatoste -tal vez Sperry Rand- que aún procesaba cálculos con tarjetas perforadas.
De los programas OCR a la Paleografía Inteligente
Con todo, la necesidad de transcribir textos plasmados en superficies de difícil recuperación había permanecido como una prioridad profesional.
Una prioridad que ha sido asumida por los sucesivos géneros de software desarrollados hasta ahora, al menos desde la década de 1970.
Nos recuerda Verify, que “la primera fuente que resultó legible a través de una máquina de modo óptico (OCR-A) fue desarrollada en 1968, por el diseñador tipográfico suizo Adrian Frutiger”.
Pero sería hasta la década de 1970 cuando otro diseñador, Ray Kurzweil, dio vida a un sistema mecánico (el sistema OCR omni front), acompañado por un escaner de cama plana (CCD), que marcaron el rumbo del desarrollo posterior.
Los llamados programas basados en OCR han recorrido un trecho prolongado y con altibajos en cuanto a su maduración.
Con el tiempo aparecieron otras tecnologías. Entre ellas, el Reconocimiento Inteligente de Palabras (IWR), el Reconocimiento Inteligente de Caracteres (ICR) y el Reconocimiento Óptico de Palabras (OWR).
Pero siempre fue el Reconocimiento Óptico de Caracteres (OCR) el sobreviviente de preferencia; el estandar para lectura más utilizado.
Los programas OCR trabaron convergencia con los sistemas de fax (para superar aquellas presentaciones resueltas en imagen en papel, y sólo con datos binarios).
Cuando llegaron los sistemas en línea (en nuestro tiempo, ya en la nube), los OCR también incorporaron su experiencia.
No sabemos, a estas alturas, si al desarrollo tecnológico y académico le ha venido bien la predominancia que en las últimas dos décadas ha mantenido una empresa creada en Adobe Creek, en California (por fundadores que provenían de Xerox).
Diríamos que ahí se ha ejercido cierto control sobre los formatos.
1. Elección del LLM: Gemini 3
¿Por qué hemos elegido, por el momento, realizar Paleografía Inteligente con Gemini?
Porque Gemini 3 resulta funcional. Ofrece respuestas con variantes de interés, para una mejor interpretación.
En el fondo, lo hemos elegido por las razones que desarrollamos en nuestro reciente artículo sobre este tema.
2. Elección del ejemplo documental
Ahora debemos trabajar con un documento que, digamos, resulte representativo del siglo XVI.
¿Qué documento elegirías como ejemplo?
De preferencia iniciar con una página que contribuya a clarificar el proceso de transcripción para las personas lectoras.
Nos decantamos por la primera página de una carta fechada en 21 de mayo de 1574.
El documento proviene del Archivo General de Indias. Podemos acceder a él en línea, gracias a la plataforma Portal de Archivos Españoles (PARES). Como se sabe, PARES es patrocinado por el Ministerio de Cultura del Gobierno de España.

La referencia específica es la siguiente:
- Título atribuido: Informaciones Mérida de Yucatán.
- Signatura: México, 212, N. 54.
- Código de Referencia: ES. 41091. AGI / 22 // MEXICO, 212, N.54.
- Contenido: testimonio de lo llevado a cabo por la ciudad de Mérida de Yucatán ante el obispo (Diego de Landa), debido a las palabras de fray Melchor de Campo, de la orden de San Francisco.
El documento elegido se expidió en la ciudad de Mérida (Yucatán), el 21 de mayo de 1574.
De acuerdo con su cotenido, ahí “los procuradores” de las “Provincias de Yucatán” dan cuenta del “ánimo airado” con que culminó un sermón sobre el Santo Evangelio.
El sermón fue emitido por el sacerdote franciscano Fray Melchor de Campo.
El documento se dirige al ya por entonces obispo Fray Diego de Landa.
El referido sermón es definido, en los hechos, como incendiario y falto de verdad.
No sobra mencionar que Fray Diego de Landa es un personaje clave en la historia de Yucatán en el siglo XVI. Si quieres conocer un poco más acerca de él, accede a nuestro anterior artículo.
3. Transcripción literal
Ponemos en juego las posibilidades de Gemini 3.
Le hemos pedido que lo transcriba respetando al máximo la ortografía, la puntuación, las mayúsculas y las abreviaturas originales del siglo XVI.
La siguiente es la trascripción literal y fiel del documento que arroja el LLM, después de proporcionarle el texto.
“Merid.a 21. de Mayo / 37 d 1574 / 1 el p.de de la ciudad de Merida ante el obpo de yucatan su m.d dicipit q se aga [Rúbrica] peticion del a ciu.da de Merida ante el obpo 2
En la çiudad De merida Provinçias de yucatan A beynte e un dias del mes de mayo de mill e quinie.s e setenta e quatro años Ante el yll.e e r.mo señor don ffray diego de landa obispo de estas Provinçias del consejo de su mag.d alonso de rrojas Procurador e fischal de la m.d de todas las dichas Provinçias
IIl.e e R.mo señor la çiudad de merida de estas Provinçias de yucatan por persona de nuestros Procuradores ante v. s. deçimos que siendo como es esta çiudad e los vez.os della Personas muy Prinçipales buenos christianos temerosos de dios nro señor y de su hta ffee catolica e de nuestra madre la santa madre yglesia Romana como sus obidientes hijos debaxo de lo q emos bibido e estamos de bibir e morir y en cumplimiento dello todos los dhos vezinos estando e abitantes de la dicha çiudad y la mayor parte de su emugeres se congregaron e ayuntaron en la santa yglesia Catedral della A oyr misa y sermon y estando ansi congregados e ayuntados en la dha yglesia oyendo misa estando vuestra Señoria Ill.ma y muy rrev.mo señor por vuestra de estas Provinçias e los señores del rregimiento ffray melchior de campo ffrayle dela orden de señor san ffran.co compañero de v. s. r.ma se subio al Pulpito el dho dia a predicar al Pueblo y Predicando como Predico el santo evangelio hizo su sermon muy Prin.al asi en quanto a la declaraçion del santo Evangelio y saliendo del Al cabo dixo que sermon dixo aberseles olvidado ciertas cosas que tenia que dezir e que era mate- ria muy larga aunque el tiempo no le daba el lugar q convenia el dho ffray mel- chior con animo airado y movido e con una conminaçion terrible que bar- sa de Jeremias Proffeta quando se quexo a dios nro señor diziendo q le abia engañado en lugar de predicar a los Penitentes e huelgas q ffueron el dia pensado cuando partio de castilla para estas partes que venia a Predicar a christianos y los de esta çiudad de merida se le avian engañado por q todos los de la çiudad de merida eran mas rrobadores de la sangre de los indios Prevaricadores de la ffee de Jhesu xpto y de sus mandamientos e articulos de la ffee que no tenian sino el nombre de christianos diziendo q las mugeres eran de su luz.a y que eran muy libres q ni algunos avian dado a visitar casas agenas y no miraban por las suyas y otras cosas deste modo de q las grauezas de todos los q en ella biben e han estado de estar se han escandalizado y alborotados de aver visto y entendido como el dho ffray melchior Publicamente semejante injuria los quiso affrontar contra toda verdad diziendo q mañana ha de dezir y Pre- dicar otras cosas mas de las que avia dicho contra los de merida diziendo con tanta colera e libertad que puso gran confussion y escandalo Poniendo mucha macula en las personas de todos sin eçeptar Persona alguna y como el rrey nro señor tan santamente tiene proveydo el tributo que dan a su mag.d como a los encomenderos e como el dho ffray mel.r señor lo tiene de costumbre como los pasados rrogamos de p.te de el ayuntamiento desta çiudad junto con v. s. r.ma”.
4. Autonomía para corregir
En la transcripción, puede apreciarse que Gemini 3 toma con autonomía la decisión correcta al identificar diversas abreviaturas, como las siguientes:
- m.d (merced);
- yll.e (ilustre);
- r.mo (reverendísimo);
- v. s. (vuestra señoría);
- nro (nuestro);
- dho/dha (dicho/dicha);
- ffray (fraile); y
- Jhesu xpto (Jesucristo).
5. La versión “depurada”
Una vez revisada la versión literal que nos entregó, solicitamos a Gemini 3 que intentara “limpiar” la versión original, es decir, que nos entregara una versión transcrita según los términos que hoy emplea la lengua castellana.
En respuesta, nos propuso una versión adaptada al castellano contemporáneo.
Pero ha decidido con autonomía actualizar la ortografía, la puntuación y la sintaxis.
Es evidente que hizo lo posible por mantener el sentido jurídico y la idea de fondo de la queja ante el obispo.
Esta es la versión “depurada” que entrega.
“Mérida, 21 de mayo de 1574
En la ciudad de Mérida, provincias de Yucatán, a los veintiún días del mes de mayo de mil quinientos setenta y cuatro años. Ante el ilustre y reverendísimo señor don Fray Diego de Landa, obispo de estas provincias y miembro del consejo de Su Majestad, comparece Alonso de Rojas, procurador y fiscal de su merced en todas las dichas provincias.
Ilustre y reverendísimo señor: La ciudad de Mérida, en estas provincias de Yucatán, a través de sus procuradores, expone ante vuestra señoría lo siguiente: Siendo esta ciudad y sus vecinos personas muy principales, buenos cristianos y temerosos de Dios nuestro Señor, de su santa fe católica y de nuestra madre la Santa Iglesia Romana (como hijos obedientes que han sido y pretenden ser hasta la muerte), se reunieron todos los vecinos y habitantes de dicha ciudad, junto con la mayoría de sus mujeres, en la santa iglesia catedral para oír misa y sermón.
Estando así congregados en la iglesia y oyendo misa en presencia de vuestra señoría ilustrísima y de los señores del cabildo, Fray Melchor de Campo, fraile de la orden del señor San Francisco y compañero de vuestra señoría reverendísima, subió al púlpito el mencionado día. Comenzó su sermón sobre el santo Evangelio de manera muy adecuada en lo referente a su explicación. Sin embargo, al terminar, dijo que se le habían olvidado ciertas cosas que debía decir y que, aunque el tiempo era breve para tan larga materia, el dicho Fray Melchor, con ánimo airado y mediante una amenaza terrible, citando al profeta Jeremías cuando se quejó ante Dios nuestro Señor diciendo que le había engañado, comenzó a predicar.
En lugar de dirigirse a los penitentes, afirmó que se sentía engañado desde que partió de Castilla hacia estas tierras, pues pensaba que venía a predicar a cristianos. Acusó a todos los habitantes de la ciudad de Mérida de ser “robadores de la sangre de los indios” y prevaricadores de la fe de Jesucristo, de sus mandamientos y de los artículos de la fe, diciendo que no tenían más que el nombre de cristianos.
Afirmó también que las mujeres eran dadas a la lujuria y que eran muy libres, pues algunas se dedicaban a visitar casas ajenas y no cuidaban las suyas propias. Por estas y otras declaraciones similares, todos los que en ella viven se han escandalizado y alborotado, al ver cómo el dicho Fray Melchor los injurió públicamente contra toda verdad. Además, amenazó con que mañana dirá y predicará otras cosas peores contra los de Mérida, hablando con tal cólera que causó gran confusión y puso una mancha en la reputación de todas las personas, sin exceptuar a nadie.
Considerando que el Rey nuestro Señor ha establecido santamente el tributo que se da tanto a Su Majestad como a los encomenderos, y viendo que el dicho Fray Melchor tiene por costumbre actuar así, rogamos de parte del ayuntamiento de esta ciudad a vuestra señoría reverendísima…”
¿Cuáles son los sesgos probables de la versión “depurada”?
Lo notable de Gemini 3 es que nos advierte de su método y de los sesgos probables que comporta su transcripción.
Las siguientes son algunas advertencias razonables que nos proporcionó acerca de la transcripción “refinada”:
- “Trabajé en la traducción del documento español arcaico -señala el LLM-. El reto radica en plasmar con precisión sus matices del siglo XVI en un lenguaje moderno.
- Me centré en preservar la intención original y, al mismo tiempo, hacerlo accesible al público contemporáneo.
- Esto ha requerido una cuidadosa consideración de la ortografía, las abreviaturas y la estructura de las oraciones.
- Sobre las Acusaciones: Mi enfoque se ha centrado en las acusaciones específicas formuladas por Fray Melchor de Campo.
- Analicé cuidadosamente las acusaciones de “robadores de la sangre de los indios” y las críticas al comportamiento de las mujeres.
- También consideré las implicaciones de la acusación de “prevaricadores de la fe”.
- El lenguaje es contundente y me he esforzado por transmitir su gravedad en el contexto de la Mérida del siglo XVI.”
Autonomía para depurar
Nos propuso diversas adaptaciones. Es evidente que aún puede tener equivocaciones; y que, por ejemplo, fuera de la transcripción literal, prefiera emplear el término ‘de los indígenas’ al original: ‘de los indios’.
Creemos que este tipo de recomendaciones son procedentes, en general. Pero depende de cada persona historiadora, al dar el visto a la versión propuesta de la correspondencia; es decir, si decide tomarlas o desecharlas.
- En sintaxis: dividió párrafos y oraciones, por ser muy largos. (Le puedo solicitar que no lo haga). Se tomó también la licencia de cambiar conectores, por considerarlos repetitivos (la “y” o “el dicho”). Lo mismo, le puedo solicitarle que se abstenga de hacerlo, porque no me interesa que realice una corrección de estilo al documento.
- En ortografía: sustituyó grafías antiguas (“ff” por “f”), (“ç” por “z/c”) y “v” inicial por “u”. Colocó las tildes faltantes. Aquí no vemos problema con las sugerencias.
- En un término específico: se tomó la licencia de cambiar la expresión “mugeres eran de su luz.a”, con “dadas a la lujuria”. Resulta que Gemini 3 entendió, con razón, que ese era el verdadero sentido de la queja moralista del fraile. En este caso, aceptamos el sentido propuesto de la expresión, pero preferimos no tomarlo.
- En las fórmulas de cortesía: propuso desatar las abreviaturas (v. s. r.ma por Vuestra Señoría Reverenda, etc.), para dar fluidez al texto. Está en lo correcto, pero preferimos mantener fidelidad con las abreviaturas.
Los LLM, herramientas que llegaron para mejorarse
Como puede verse, el fragmento documental ilustra el ambiente de discordia e inconformidad ante el comportamiento de una parte de los habitantes (colonos) españoles.
Es probable que la evolución de los LLMs los lleve hacia la virtual omnipresencia y una mayor accesibilidad (como mesa de trabajo, para interacción cotidiana).
Por el momento éstos representan nuestro primer acceso para encontrar respuestas y optimización de una tarea de suyo laboriosa, como es la presente.
Gemini 3 y los LLM aportarán aún más a la Paleografía Inteligente.
Por ahora, ya no sólo transcriben e intentan explicar el contexto. También sugieren interpretaciones posibles sobre la motivación que posee cada persona involucrada en la correspondencia.
Comparten, de hecho, algunas inferencias sobre el ambiente social que podría derivarse de la lectura detenida del contenido de la correspondencia.
Mucho trabajo espera a la persona historiadora, ante el contexto especulativo vigente, que parece anticipar infinitas posibilidades.
Estimamos que se presentarán consecuencias de consideración ante el eventual arribo de la llamada Inteligencia Artificial General (AGI).
¿Qué opinión te merece el estado de avance de la PaleografIA?
Imagen de la Portada: Fusión de texto antiguo con Paleografía Inteligente, creado por Gemini 3 (modalidad: Razonamiento).


















Comentarios
Muchas gracias por el ejemplo brindado sobre la paleografía hecha con IA. Es sin duda un avance para acercarse a la lectura de documentos antiguos y habrá que ponerla a discusión en las clases de paleografía impartidas a estudiantes. Encontré algunos errores y varias inconsistencias en la transcripción literal y problemas en la versión “depurada” para utilizar y citar la información que se recupera del original. Se trata de un documento bastante legible sin mayores dificultades en la lectura de términos y abreviaturas y sin vocablos en maya u otras lenguas originarias que tal vez complicarían la lectura de la IA. Pero la discusión puede centrarse en ese muy libre acomodo de sintaxis para hacer el texto entendible al lector contemporáneo que puede influir en la interpretación del contenido.
Sin duda, lo que muestra ahora la IA con Gemini 3 y los LLM sobre transcripción de documentos antiguos es sorprendente. Hasta hace poco esta posibilidad no estaba considerada al alcance de la tecnología existente. Sin embargo, los resultados no son confiables aún, el riesgo de errores en la transcripción y la posibilidad de tergiversar el contenido del documento son altos. Quien haga uso de esta herramienta debe cotejar la lectura de la IA con el documento original. ¿Se tendrá siempre este cuidado?