GPT-4o: Open AI presenta su nuevo modelo de IA, que derrumba las barreras lingüísticas

La compañía explicó que la función será desplegada en sus productos en las próximas semanas. Estará disponible de manera gratuita.

La empresa OpenAI, creadora del programa ChatGPT, presentó este lunes su nuevo modelo de inteligencia artificial generativa. Se trata de GPT-4o que viene con nuevas capacidades de producción y comprensión de textos, imágenes y sonidos, que estará disponible de forma gratuita. La compañía explicó que el nuevo modelo será desplegado en los productos de OpenAI en las próximas semanas.

En las redes sociales se publicaron videos de cómo funcionaría la aplicación y generó entusiasmo por la manera en la que es capaz de reproducir de forma asombrosa la fluidez de discusiones entre humanos en diferentes idiomas. De hecho, la compañía detalló que GPT-4o puede responder a "entradas de audio en 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humano".

"GPT-4o es un paso hacia una interacción persona-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen (...) Iguala el rendimiento de GPT-4 Turbo en texto en inglés, con una mejora significativa en texto en idiomas distintos del inglés, a la vez que es mucho más rápido y un 50 % más económico en la API. GPT-4o es especialmente mejor en cuanto a visión y comprensión de audio en comparación con los modelos existentes", explicó la compañía en un comunicado publicado en su página oficial.

OpenAI explicó que, a pesar del lanzamiento, aún está revisando lo que puede hacer la aplicación y sus limitaciones. Sin embargo, detalló que con GPT-4o, "entrenamos un único modelo nuevo de extremo a extremo en texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal".

De igual manera, el asistente de IA de OpenAI es capaz de leer las emociones en los rostros a través de la cámara del teléfono inteligente, guiar a los usuarios para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático, entre otras cosas.

AFP recordó que esta nueva versión del programa de OpenAI llega un día antes de una también esperada presentación de Google sobre su motor de búsqueda Gemini, su herramienta de IA que compite con ChatGPT. Esta carrera detrás de los modelos de IA llevó a Microsoft (principal inversor de OpenAI) a convertirse en la mayor empresa del mundo por capitalización bursátil, arrebatando el primer puesto a Apple.