OpenAI ha lanzado su último modelo de inteligencia artificial, que, según afirma, es capaz de "pensar con imágenes", lo que significa que puede comprender y analizar los bocetos y diagramas del usuario, incluso si son de baja calidad, reportó CNBC.
El nuevo y principal modelo de razonamiento de OpenAI se llama o3, y la compañía lanzó simultáneamente un modelo más pequeño, o4-mini.
Con o3, los usuarios pueden subir pizarras, bocetos y otras imágenes y dejar que la IA las analice y las analice. Los modelos también pueden rotar, hacer zoom y utilizar otras herramientas de edición de imágenes.
Desde el lanzamiento de su chatbot viral ChatGPT a finales de 2022, OpenAI ha actualizado rápidamente sus modelos para abarcar mucho más allá del texto, incluyendo imágenes, voz y vídeos.
La compañía se esfuerza por mantenerse a la vanguardia de la IA generativa, donde se enfrenta a una fuerte competencia de rivales como Google, Anthropic y xAI de Elon Musk.
"Por primera vez, nuestros modelos de razonamiento pueden usar de forma independiente todas las herramientas de ChatGPT: navegación web, Python, comprensión de imágenes y generación de imágenes", escribió OpenAI.
"Esto les ayuda a resolver problemas complejos de varios pasos con mayor eficacia y a dar pasos concretos hacia la autonomía".
La compañía afirmó que o3 y o4-mini son sus primeros modelos de IA capaces de "pensar con imágenes". Esto significa que, según OpenAI, "no solo ven una imagen, sino que pueden integrar información visual directamente en la cadena de razonamiento".
Señaló que su modelo o3 está especialmente optimizado para matemáticas, programación, ciencias y comprensión de imágenes, mientras que o4-mini funciona más rápido y a un menor coste. Ambos modelos estuvieron disponibles a partir del miércoles para los clientes de ChatGPT Plus, Pro y Team.