¡OpenAI lanza ChatGPT-5! ¿Estamos más cerca de la IA general, como dice Altman?

OpenAI finalmente ha lanzado el tan esperado ChatGPT-5 y Sam Altman afirma que estamos más cerca de una AGI. Más información sobre el nuevo ChatGPT.

El nuevo ChatGPT se lanzó esta semana. Descubre todo lo que hay detrás del modelo y cuáles son las novedades.
El nuevo ChatGPT se lanzó esta semana. Descubre todo lo que hay detrás del modelo y cuáles son las novedades.

Desde la popularización de ChatGPT, la inteligencia artificial se ha vuelto cada vez más popular y presente en nuestras vidas. ChatGPT es un ejemplo de un área llamada inteligencia artificial generativa que se centra en generar textos, imágenes o vídeos. Esta área cobró fuerza cuando Google publicó un artículo en 2017 en el que presentaba una arquitectura llamada Transformer.

Transformer revolucionó el procesamiento del lenguaje natural porque permitió que los modelos aprendieran contextos y relaciones entre palabras. La empresa OpenAI utilizó esta arquitectura básica para entrenar lo que se conoció como GPT. Más tarde, varias empresas, como Google, X y Meta, utilizaron Transformers como esqueleto de sus propios modelos de lenguaje.

Esta semana, OpenAI lanzó el tan esperado ChatGPT-5, del que el director ejecutivo de la empresa, Sam Altman, llevaba meses hablando. OpenAI ha descrito este nuevo modelo como un avance significativo hacia la inteligencia artificial general (AGI). Cuenta con algo llamado "enrutador en tiempo real" que selecciona automáticamente el modelo ideal en función de la pregunta o tarea que haya realizado el usuario. El modelo ya está disponible para su uso en el sitio web de OpenAI.

Todo lo que necesitas es atención

El artículo "Attention Is All You Need", publicado por Google en 2017, se considera el trabajo más importante en el campo de la inteligencia artificial en la actualidad. En este trabajo, Google presentó la arquitectura Transformer, basada en mecanismos de atención. La idea era acelerar el proceso de lectura de secuencias, como oraciones, que pudieran utilizarse en traductores o generadores de texto.

Esta técnica revolucionó la Inteligencia Artificial generativa y eliminó la necesidad de estructuras recurrentes, permitiendo que el modelo procese todo el texto.

El artículo ha sido citado más de 180.000 veces, lo que lo convierte en uno de los diez artículos científicos más referenciados del siglo XXI. Si bien la arquitectura Transformer revolucionó la IA generativa, ahora se utiliza en otras áreas de la IA. Incluso los modelos de predicción y clasificación utilizan Transformers, o al menos capas de atención.

Mecanismo de atención

El secreto de Transformer reside en el mecanismo de atención, una técnica que permite al modelo asignar mayor importancia a partes específicas de una entrada al procesar la información. De esta forma, el modelo prestaría atención a partes importantes de los datos y encontraría relaciones más complejas. El mecanismo calcula coeficientes que indican cuánto debería influir cada parte en la salida.

En el procesamiento del lenguaje, por ejemplo, esto significa que el modelo puede centrarse más en las palabras relevantes para el contexto. En la práctica, el mecanismo de atención funciona asignando puntuaciones a cada relación entre los elementos de la secuencia. Esto permite al modelo comprender dependencias a largo plazo, como cuando una palabra al principio de una oración se conecta con el significado de algo al final.

ChatGPT-5

ChatGPT-5 se lanzó el 7 de agosto de 2025 y unifica las capacidades de razonamiento de los modelos GPT con los modelos de respuesta rápida en un solo sistema. Esto permite que el modelo elija en tiempo real el mejor modelo para realizar la tarea deseada sin tener que elegir entre diferentes versiones. Esta nueva función de ChatGPT se denomina enrutador en tiempo real.

La arquitectura Transformer ha hecho que los modelos de lenguaje sean tan potentes como lo son hoy en día. Crédito: Tensorflow.
La arquitectura Transformer ha hecho que los modelos de lenguaje sean tan potentes como lo son hoy en día. Crédito: Tensorflow.

Además, GPT-5 puede comprender interacciones más largas y es multimodal, lo que significa que admite texto, imágenes, voz e incluso vídeo. Las pruebas realizadas por usuarios de acceso temprano han demostrado que GPT-5 funciona mejor en lógica, programación, finanzas, derecho y atención médica, con menos errores que las versiones anteriores. Actualmente, el modelo está disponible en su versión completa o en variantes como mini y nano.

La búsqueda de la AGI

Desde el lanzamiento de GPT-3 en 2020, OpenAI ya ha estado discutiendo la posibilidad de haber alcanzado la AGI. La AGI sería una inteligencia artificial capaz de realizar cualquier tarea que un humano pudiera realizar. Desde la abstracción, el aprendizaje continuo y la adaptación a nuevas situaciones sin necesidad de formación específica. Todavía no existe consenso sobre la definición precisa de una AGI ni una previsión exacta de cuándo se alcanzará.

Actualmente, las principales empresas de IA del mundo están compitiendo por alcanzar la AGI. Modelos como Gemini, de Google, combinan capacidades multimodales y un razonamiento más profundo. Por su parte, el lanzamiento de DeepSeek-R1 a principios de 2025 supuso un punto de inflexión en el sector, ya que el modelo tiene un rendimiento comparable al de sus competidores, pero con un coste significativamente menor y una mayor eficiencia energética. Esto reavivó aún más la carrera por la AGI.