GPT-5: ¿Un gran salto o un pequeño paso?

Empecé un nuevo trabajo hace varias semanas y no ha sido fácil encontrar el tiempo para escribir en mi nueva rutina. Así que, con el fin de mantener el proyecto de Loras Mojadas 🦜 vivo, decidí cambiar un poco el estilo y la frecuencia de los artículos. Quiero hacer artículos más cortos que cubran algunos puntos claves sobre un tema de actualidad relacionado con modelos de lenguaje (o modelos generativos). Al final de cada artículo pienso seguir incluyendo recomendaciones de herramientas o lecturas interesantes. En principio, la idea sería publicarlos cada 15 días.

Para complementar estos artículos cortos, quiero publicar también cada mes y medio un artículo más largo que desarrolle con mayor profundidad temas relacionados con el funcionamientos de los modelos de lenguaje o sus implicaciones en la sociedad.

Como siempre, estoy abierto a sus ideas. Si hay temas que les interesan me encantaría que me los compartieran. Para contactarme solo tienen que responder a este email.

El lanzamiento de GPT-5

El 7 de agosto, OpenAI lanzó oficialmente su nuevo modelo de lenguaje: GPT-5. Todos los usuarios de ChatGPT tienen acceso a alguna versión de este nuevo modelo. Si bien la empresa hizo alarde de las nuevas capacidades del modelo, la recepción entre los usuarios fue mixta. En plataformas como reddit varias publicaciones con quejas sobre GPT-5 alcanzaron bastante popularidad.

Diagrama 1. Hilo en reddit con quejas sobre GPT-5.

Para muchos, incluido yo, no queda muy claro qué tareas puede hacer este modelo que los modelos anteriores no pudieran hacer.

¿ Qué es exactamente GPT-5?

GPT-5 no es estrictamente un único modelo de lenguaje. En palabras de OpenAI:

“GPT‑5 es un sistema unificado con un modelo inteligente y eficiente que responde la mayoría de las preguntas, un modelo de razonamiento más profundo (GPT‑5 Thinking) para problemas más difíciles, y un enrutador en tiempo real que decide rápidamente qué usar de acuerdo con el tipo de conversación, la complejidad, las herramientas necesarias y tu intención explícita (p. ej.: si dices “piensa más sobre esto” en el mensaje).”

Si tienen la versión gratuita de ChatGPT van a ver que solamente hay una opción posible de modelo llamada “ChatGPT”. El diagrama 2 muestra exactamente esto:

Diagrama 2. Pantalla de inicio de ChatGPT versión gratuita.

Cuando usen ChatGPT, el nuevo sistema de GPT-5 escogerá detrás de escenas cuál modelo es el apropiado para realizar la tarea que le pidan. Si preguntan: “¿cuál es la capital de Grecia?”, el sistema escogerá el modelo más rápido y sencillo. Pero si, en cambio, le piden que escriba el código para generar una página web, el sistema escogerá un modelo más complejo (también llamado modelo de razonamiento) y verán un texto como este:

Diagrama 3. Texto en ChatGPT cuando el modelo avanzado es seleccionado.

Dado que los modelos de razonamiento son más costosos de ejecutar, OpenAI restringe la cantidad de veces que los usuarios gratuitos pueden utilizar estos modelos. Así que no se sorprendan si eventualmente dejan de ver este tipo de texto aún si le hacen preguntas complejas a ChatGPT.

Si tienen la versión Plus de ChatGPT, pueden elegir el modelo que quieren usar. Por defecto ChatGPT selecciona la opción de “Auto” en la que el sistema escogerá el tipo de modelo a usar dependiendo de la tarea.

Diagrama 4. Pantalla de inicio en ChatGPT Plus.

Algunas capacidades interesantes del modelo

En el artículo de lanzamiento de GPT-5, OpenAI muestra varios ejemplos de páginas y aplicaciones web creadas por GPT-5 utilizando solamente una breve descripción textual. Para probar esto, decidí pedirle que hiciera “una página personal en el estilo Bauhaus en HTML”. El resulto está bastante bien:

Diagrama 5. Página web creada por GPT-5.

No me queda tan claro que tenga el estilo Bauhaus, pero es definitivamente impresionante que el modelo hubiera creado una página así con una instrucción tan simple.

Otro aspecto de GPT-5 que destaca OpenAI en su artículo es el cambio en el tono que el modelo usa cuando genera sus respuestas: “En general, GPT‑5 es menos complaciente en su efusividad, usa menos emojis innecesarios”. Este es un punto bastante interesante porque, como expliqué en un artículo anterior, es bien sabido que algunos modelos de lenguaje exhiben niveles de complacencia muy altos que hacen díficil obtener respuestas útiles y confiables. Me parece que este es un cambio en la dirección correcta.

Me deja pensando

El lanzamiento de GPT-5 prometió un gran salto, pero en la práctica, no queda muy claro si realmente lo hemos visto.

A pesar de lo que dice OpenAI, la experiencia real de los usuarios, incluyéndome, muestra que las mejoras son más bien marginales. No es ese gran cambio que hemos visto con otros modelos. En lugar de un salto de gigante, parece que GPT-5 es, por ahora, solo un paso pequeño.

Recomendaciones

Consensus: Una aplicación que permite hacer búsquedas en fuentes académicas y generar respuestas con esas mismas fuentes. Muy interesante.
GPT-OSS: Después de muchos años de no contribuir a la comunidad de código abierto, OpenAI decidió lanzar dos modelos a los que se puede acceder libremente (si se tiene la capacidad computacional para ejecutarlos 😅).