PolifonIA | Inteligencia Artificial para Humanidades y Ciencias Sociales en América Latina | Proyecto de Divulgación Científica CIESAS | México
Conócenos
PolifonIA | Inteligencia Artificial para Humanidades y Ciencias Sociales en América Latina | Proyecto de Divulgación Científica CIESAS | México

Gestión de datos: API y MySQL

polifonia.org | En esta página de divulgación mostraremos dos herramientas fundamentales que potencian la Inteligencia Artificial para la gestión de datos: los sistemas API y MySQL.

Se trata de la posibilidad de habilitar nuestros acervos documentales, para llevarlos al acceso abierto, al lado de grandes bases de datos.

Es frecuente que la pila de archivos de nuestro trabajo, con información de corte cuantitativo y cualitativo, la mantengamos almacenada en formatos múltiples.

Existen diversas bases de datos que acostumbramos emplear en nuestros campos de conocimiento (Ciencias Sociales y Humanidades). Pero éstas quedan almacenadas en un conjunto diverso de formatos. Por ejemplo, .pdf, .xls, .csv, .png, jpg, .txt, entre otros.

Vamos a dividir el género de gestión, lo que podría facilitar el acceso abierto de nuestros documentos.

  • Bases de datos: API
  • Bases de datos: MySQL
Gestión de datos con API y MySQL, para sistematización y apertura documental
Imagen: generada por Gemini 3. Prompt: «Crea una imagen nítida, iluminada y colorida, que ilustrar el trabajo con fuentes documentales antiguas, que tengan alusiones al uso actual de las API y la gestión de datos MySQL, para su catalogación y puesta en consulta abierta».

Gestión de datos: API

Resulta enorme el potencial que posee la API (Interfaz de Programación de Aplicaciones) de Claude (Anthropic) para las labores de transcripción de documentos masivamente almacenados.

Con el procedmiento siguiente se podrá mejorar y simplificar aún más el manejo y empleo de los grandes repositorios documentales de carácter digital.

Integramos Anthropic con Python 3, para operarlos desde la consola (terminal) de nuestra computadora portátil.

Hemos podido obtener buenos resultados con la integración de una modalidad de Anthropic (la API) con Python 3. Los dirigimos desde nuestra laptop hacia la carpeta donde suelen residir los archivos voluminosos (Google Drive).

Los archivos de texto en formato .txt van apareciendo y se agrupan en una carpeta especial, creada en nuestra laptop. (Posteriormente se dará una instrucción para convertirlos en formato .docx

La API de Anthropic con Python 3 y Google Drive(vía su API) reúnen tres componentes técnicos robustecidos. Juntos crean una pequeña orquesta inteligente, merced a la IA.

Con esta triada y con las instrucciones de un script, apreciamos con satisfacción cómo se van apilando decenas de archivos. Uno a uno, en nuestro disco duro, ya convertidos en formato manejable, editable: .txt.

Tipo de documentos susceptibles de transcribir, con gestión de datos
Fuente: PARES, Gobieno de España, Ministerio de Cultura. Archivo General de Indias, MEXICO,1064,L.1, 1542. Documento de 1542, que refiere a Andrés de Tapia, acompañante de Hernán Cortés en la llegada a Cozumel en 1519: «Relación de personas que pasaron a Nueva España y estuvieron presentes en su descubrimiento, toma y conquista, con Hernán Cortés y con Pánfilo de Narváez, y de las mujeres e hijos de los conquistadores y pobladores, que han dado peticiones y memoriales relativos al repartimiento general de la tierra«.
Gestión de bases de datos MySQL

La base de datos que aquí presentamos está construida con base en tres acervos locales distintos (fuentes ubicadas en Mérida, Yucatan). Se contó con registros personalizados más o menos homogéneos en los años 1913-1914, 1921 y 1924, respectivamente.

Con la consolidación de las tres bases se pudo reunir información individual en cuatro rubros. Éstos se distribuyeron en otras tantas columnas: nombre, domicilio, ocupación laboral y año de registro.

Para construir esta base de datos, con cinco variables, se diseñó la plataforma idónea para su presentación y consulta en línea. Antes, se empleó el sistema de gestión MySQL (sistema de gestión de bases de datos relacionales de código abierto, basado en el lenguaje SQL).

La información de esta base fue capturada en el formato xlsx. Se organizó según las cinco columnas referidas; y una vez consolidada la base, se convirtió al formato csv.

En ese formato se procesó para el gestor de datos MySQL y para su filtro en línea. Se construyó una fuente digital, unificada y de consulta amigable.

El propósito es proveer de insumos de información en línea a los historiadores, periodistas e interesados en redes familiares. Pero también a quienes se interesan en trayectorias biográficas, genealógicas o, bien, ocupacionales.

El periodo de cobertura consiste en la primera parte del siglo XX, una época de cambios notables en la vida política, económica y social de Yucatán.

Esta base de datos digital, fusionada, que se pone a disposición de los interesados, es producto del proyecto “Transición territorial y reconfiguración social en la Península de Yucatán”, del CIESAS.

Fuente incorporada (miles de referencias) con MySQL
Catálogo: Biblioteca Yucatanense