OpenAI presenta a GPT-4o: así es hablar con una inteligencia artificial
17 / 05 / 2024

OpenAI presenta a GPT-4o: así funciona el nuevo modelo que te permite hablar con una IA


Por Nazlhy Viviana López
Nazlhy Viviana López
17 / 05 / 2024
0

OpenAI, empresa de investigación e implementación de IA y madre de ChatGPT, presentó GPT-4o un nuevo modelo que ofrece una mayor interacción entre los usuarios y la computadora, puede entablar una conversación en audio u observar a través de tu cámara para darte respuestas, así como se mantiene el uso del texto.

A través de su sitio web, la empresa anunció las nuevas capacidades y funciones del modelo, que los acercan cada vez más a convertirse en un asistente personal digital, pues no solo podrás hacerle preguntas o peticiones sobre temas de interés, también tendrás en la palma de tu mano traducciones, resolución de problemas matemáticos, y respuestas rápidas como si tuvieran una conversación.

En el video de bienvenida al anuncio, un joven enciende su cámara y saluda a su celular, a lo que rápidamente una voz femenina cálida y risueña le pregunta ¿cómo está?, destaca el saco que está usando y le pregunta sobre el techo y el lugar en el que se encuentra, por lo que el interlocutor le muestra donde está, pidiéndole que adivine que está haciendo, sorprendentemente le contesta que, por lo que observa, debe estar en alguna producción o grabación.

Hasta ese momento el video nos mostraba una interacción fluida entre ambos y la nueva función del chatbot de analizar imágenes, sin embargo, en medio de esa introducción, la voz femenina demuestra curiosidad y hasta un poco de inquietud cuando el joven le dice que está relacionada con el anuncio, un paso gigante en la personalización y adaptación a las necesidades de los usuarios.

Pero este contenido simplemente fue la entrada, el plato fuerte viene con más videos que demuestran las nuevas habilidades de GPT-4o, que busca una interacción más natural entre usuario y máquina, con respuestas más precisas y coherentes, junto a una mejor comprensión de quien usa el nuevo modelo.

“En segundo lugar, el nuevo modo de voz (y video) es la mejor interfaz de computadora que he usado. Parece la IA de las películas; y todavía me sorprende un poco que sea real. Llegar a tiempos de respuesta y expresividad a nivel humano resulta ser un gran cambio”, explicó Sam Altman, CEO de OpenAI, en su blog.

Te interesa: 10 inventos que revolucionan el mundo actual

Novedades del modelo GPT-4º

Hay palabras suficientes para describir las nuevas actualizaciones, pero no suficientes maneras para detallar la experiencia de observar las novedades presentadas por OpenAI, por eso mejor te dejamos algunos videos para que los veas con tus propios ojos y saques conclusiones:

Simula emociones

En uno de los videos, un ejecutivo de OpenAI practica sus chistes de padre, después de contarle que pronto tendrá un hijo, una noticia celebrada por el nuevo modelo; pero lo fascinante o llamativo no es eso, sino que se riera de los comentarios del interlocutor, o que en otro de los casos fuera completamente sarcástica, mientras que en un tercer ejemplo se mostrara sorprendida.

Despídete de la voz de robot. Dile hola a una comunicación más natural

Como te contábamos unos párrafos más arriba, el video que nos daba indicios de la novedad que preparaba OpenAI era presentada por un joven que conversaba con una voz de mujer que daba la sensación de ser amigable y muy cercana. Pues esta es una de las características más relevantes del modelo que cuenta con distintas tonalidades de voz, y que no solo habla contigo, sino que también canta.

Salut. Hola. Ciao. Traducción en tiempo real

El modelo permitió que en el ejemplo presentado por los ejecutivos de OpenAI, ambos pudiesen comunicarse mientras uno de ellos hablaba en inglés y el otro en español, actuando como un traductor entre los interlocutores, lo que permitiría que las personas se entendieran sin dejar de expresarse en su lengua materna.

El ChatGPT original mostró una pista de lo que era posible con las interfaces de idiomas; Esta cosa nueva se siente visceralmente diferente. Es rápido, inteligente, divertido, natural y útil”, comentó Altman.

Identifica el contexto de lo que la cámara le muestra

En uno de los videos un ejecutivo le presentaba un perro, el cual, inmediatamente el nuevo modelo identificó hablándole de manera tierna y diciéndole que era la cosa más tierna. En otro, el modelo dedujo que estaban celebrando un cumpleaños y tras cantarle, le deseó que su petición al soplar la vela se hiciera realidad.

Lee también: La Inteligencia Artificial y su sed insaciable

¿Cómo acceder a GPT-4o?

Si quieres probar las nuevas capacidades de GPT-4o tenemos una buena noticia, dado que la empresa OpenAI señaló a través de sus redes sociales que desde el pasado lunes 13 de mayo “todos los usuarios comenzarán a tener acceso”, no obstante, también aclararon que durante las próximas semanas se implementarán las novedades de voz y visión que presentaron.

Además, podrás usar muchas de sus funciones de manera gratuita, pues según destacó Altman por medio de su blog, la inteligencia artificial es concebida como una herramienta para que las personas puedan lograr crear cosas increíbles de las que toda la sociedad pueda beneficiarse.

“Una parte clave de nuestra misión es poner en manos de las personas herramientas de IA muy capaces de forma gratuita (o a un precio excelente). Estoy muy orgulloso de haber hecho que el mejor modelo del mundo esté disponible de forma gratuita en ChatGPT, sin anuncios ni nada por el estilo”, indicó.

Por el momento, algunos de los usuarios de ChatGPT ya pueden acceder a función de carga de archivos adjuntos como imágenes o audios, mayor capacidad de procesamiento, mejor comprensión de textos más complejos, y respuestas más detalladas.