¿Por qué hablo de modelos de lenguaje y no de inteligencia artificial?

Si han venido leyendo los artículos de Loras Mojadas posiblemente se habrán dado cuenta que evito al máximo usar la expresión “inteligencia artificial” o “IA”. La decisión es muy consciente y en este artículo quiero explicarla.

La frontera movediza de la inteligencia artificial

En 1997, el campeón mundial de ajedrez Garry Kasparov fue derrotado por Deep Blue; un computador diseñado por IBM para jugar ajedrez. El evento fue televisado y todavía hoy se puede ver el momento exacto en el que Kasparov se rinde (acá les dejo el enlace).

En su momento, periódicos como The Guardian titularon la noticia como “un hito en el progreso de la inteligencia artificial”. Sin embargo, hoy un algoritmo que juega ajedrez ya no nos parece tan impresionante. De hecho, lo vemos como una herramienta útil, específica y limitada. Pocas personas dirían que el algoritmo es una muestra de inteligencia artificial.

El ejemplo de Deep Blue muestra uno de los problemas que veo con el término de inteligencia artificial: aquello que consideramos inteligencia es cambiante. A medida que el campo avanza, también nuestras expectativas sobre este. Y así, terminamos en un escenario donde el significado exacto de la inteligencia artificial no es claro.

¿Dónde está la frontera? ¿Es ChatGPT un ejemplo de inteligencia artificial? ¿Y los algoritmos que controlan la asignación de pedidos en Uber o Rappi? ¿O los que nos recomiendan videos en TikTok o YouTube?

Una definición por empresa

Para complicar aún más las cosas, cada empresa del sector tiene su propia definición de lo que entiende por inteligencia artificial. Algunas, como OpenAI, reservan el término para hablar exclusivamente de una inteligencia artificial general. Otras lo usan para referirse a cualquier tecnología que automatice decisiones o tareas. Acá les dejo algunas ejemplos:

Google: “La inteligencia artificial (IA) es un conjunto de tecnologías que permiten que las computadoras realicen una variedad de funciones avanzadas, incluida la capacidad de ver, comprender y traducir lenguaje hablado y escrito, analizar datos, hacer recomendaciones y mucho más.”

IBM: “La inteligencia artificial (IA) es una tecnología que permite a las computadoras y a las máquinas simular el aprendizaje, la comprensión, la resolución de problemas, la toma de decisiones, la creatividad y la autonomía humanas.” (Traducción propia)

OpenAI: “con inteligencia artificial general nos referimos a sistemas altamente autónomos que superan a los humanos en la mayoría de trabajos de valor económico.”

Estas definiciones no solo son distintas entre sí, sino que también mezclan conceptos técnicos con aspiraciones futuristas. ¿Simular el aprendizaje? ¿Autonomía humana? ¿Creatividad? Son términos difíciles de definir con precisión, mucho más si queremos usarlos como base para categorizar tecnologías.

En busca de conceptos más precisos

En contraparte, el concepto de modelo de lenguaje es mucho más acotado y preciso. En esencia, un modelo de lenguaje es un sistema estadístico que ha aprendido patrones en grandes cantidades de texto para predecir cuál es la siguiente palabra más probable en una secuencia. Algunos modelos también incorporan preferencias humanas para afinar sus respuestas, pero el principio sigue siendo el mismo: predicción estadística basada en texto.

Esta definición nos permite saber con bastante claridad qué es y qué no es un modelo de lenguaje. ¿ChatGPT? Sí. ¿Un algoritmo que juega ajedrez? No. ¿Un sistema que predice la demanda de transporte en una ciudad? Tampoco. ¿Un modelo que genera imágenes? No (aunque estos modelos tienen componentes de los modelos de lenguaje).

Esa precisión conceptual es la que busco a la hora de escribir los artículos de Loras Mojadas.

Categorizando los sistemas automatizados

A lo largo del artículo he mencionado varios sistemas automatizados con los que interactuamos a diario: el algoritmo que escoge la ruta para un conductor de Uber, el sistema que organiza los horarios del transporte público, los motores de recomendación que nos sugieren contenido, o los modelos que generan imágenes.

Estos sistemas no son modelos de lenguaje, pero tampoco podemos agruparlos todos bajo un mismo nombre. Por eso, para cerrar el artículo, quiero proponer una clasificación tentativa de los tipos de sistemas que solemos llamar (con demasiada facilidad) “inteligencia artificial”:

1. Sistemas de reglas explícitas

Estos sistemas siguen reglas predefinidas del tipo “si A, entonces B”. Por ejemplo: si la temperatura supera los 30°C, enciende el aire acondicionado. Son sistemas útiles para tareas repetitivas y bien definidas. No aprenden, pero pueden ser muy eficientes.

2. Modelos de predicción estadística

Aquí encontramos la mayoría de los algoritmos de aprendizaje automático. Son modelos entrenados para detectar patrones en datos históricos y hacer predicciones o clasificaciones. Por ejemplo, el sistema que predice cuánto tiempo tomará un pedido en llegar, o el que determina si un correo es spam, o el que genera recomendaciones de canciones.

3. Sistemas generativos

Estos son los modelos más recientes y visibles, como ChatGPT, Claude o Gemini. Se entrenan para generar texto, imágenes o código, a partir de un ejemplo o una instrucción. Aquí encontramos a los modelos de lenguaje y otros modelos generativos como los de imagen o audio.

Conclusión

Todo el mundo parece hablar de inteligencia artificial. Pero al usar este término, muchas veces ocultamos más de lo que revelamos. Prefiero hablar de modelos de lenguaje cuando me refiero a herramientas como ChatGPT, y usar otras categorías cuando me refiero a algoritmos de predicción o sistemas automatizados más simples.

Creo que usar un lenguaje más preciso nos permite tener mejores conversaciones sobre lo que estas tecnologías hacen (y no hacen), sobre sus riesgos reales y sobre los espacios donde pueden ser útiles.

Una cosa que recomiendo esta semana

Lovable: Una página para crear aplicaciones web usando solamente lenguaje natural. Pueden escribir lo que quieren construir (por ejemplo: una aplicación que permita ver el clima de dos ciudades simultaneamente) y después de unos segundos de esperar verán los resultados. Pueden seguir haciendo cambios al resultado por medio de instrucciones escritas. Los invito a probarla.