Qué es un Modelo Lingüístico Grande

Polifonia.org | La mejor manera de ejemplificar un LLM (Modelo Lingüístico Grande o Gran Modelo de Lenguaje) quizá sea pensar en las herramientas de Inteligencia Artificial que usas a diario.

Es decir, nuestros amigos de consulta cotidiana: ChatGPT, Claude, Grok, Gemini, DeepSeek, entre otros.

Los LLM

Un Modelo Lingüístico Grande (LLM) se define como una modalidad emergente de programa de Inteligencia Artificial. Es capaz de reconocer y de generar texto. Por ello es generativo, entre otras características.

Los LLM son alimentados por conjuntos de datos enormes. Por ello se les define como grandes. Se basan en el aprendizaje automatizado, a través de modelos de transformación.

Con la recopilación de datos y ejemplos, un Modelo Lingüístico Grande (LLM) puede reconocer e interpretar el lenguaje humano u otros tipos de datos complejos.

Como están programados y entrenados, los LLM toman datos de Internet. El propio entrenamiento los capacita para rastrear de modo continuo y así obtener más contenido.

Es evidente que la calidad de las muestras que toman en un prinicipio, influye en la manera acertada en que los LLM habrán de posicionarse con un lenguaje natural. Por ello los programadores de un LLM suelen esmerarse en métodos de selección óptimos.

Aprendizaje profundo

Los LLM se inspiran en un método de aprendizaje que definen como aprendizaje profundo, para impregnarse mejor de la manera en que la genete emplea ideas, caracteres, palabras y frases.

El método que emplea el aprendizaje profundo incorpora desde luego el análisis probabilístico de datos no estructurados. Con ello, los LLM entrenados van ajustando las tareas necesarias para traducir, interpretar preguntas y generar respuestas.

Los LLM maduros, a los que todos tenemos acceso, disponen ya de una memoria de corto plazo (que es el estado dentro de una sesión y memoria de largo plazo. (Se almacena en bases vectoriales o notas sistemátcas). Ello les permite recordar lo realizado, anular repeticiones y, en especial, aprender del contexto.

Una vez más, ChatGPT, Claude, Grok, Gemini, DeepSeek, entre otros.

Imágenes: Claude y Gemini.

Imagen de la portada: generada por Gemini.

Texto: Editor.

Fuentes:

Cole Stryker, «¿Qué son los LLM?«, en AI Models, IBM Think, s.f.

Microsoft Azure, Significado de LLM, s.f.