
El mundo de la inteligencia artificial está en constante evolución y OpenAI no es diferente con el lanzamiento de su último modelo de lenguaje. GPT-4o, una versión avanzada del anterior GPT-4 Turbo. Esta nueva versión no sólo mejora, sino que amplía significativamente sus capacidades para incluir más que solo eso. testo e imágenes, pero también el 'audio.
OpenAI presenta GPT-4o: qué es y de qué es capaz
GPT-4o se describe como una versión “omni” (de ahí la “o” en el nombre), ya que integra múltiples modos de interacción: testo, visión y ahora, voce. Este modelo ofrece respuesta en tiempo real a las consultas de los usuarios, permitiéndoles interrumpir el sistema mientras responde e incluso cambiar la aplicación a lo largo del camino. Además, puede reconocer emociones en la voz del usuario y responder apropiadamente, variando el estilo emocional de las respuestas, incluyendo respuestas de canto.
Usted también puede estar interesado en: ¿Qué son los modelos de lenguaje en Inteligencia Artificial?
Además de las interacciones de voz, GPT-4o Mejora enormemente las capacidades visuales de ChatGPT.. Por ejemplo, ahora puede responder rápidamente preguntas sobre fotografías o capturas de pantalla, identificando detalles como la marca de una camiseta o el contenido de un código de software mostrado. Imagine poder fotografiar un menú en un idioma extranjero y recibir inmediatamente la traducción: este es solo uno de los escenarios futuros posibles con GPT-4o.
El nuevo modelo OpenAI GPT-4o ofrece Soporte mejorado para más de 50 idiomas., garantizando el doble de rendimiento respecto al anterior GPT-4 Turbo ea la mitad del precio, con límites de uso más altos. Esto da como resultado una experiencia de usuario más fluida y accesible, ampliando el potencial de uso en diversos contextos internacionales.
Disponibilidad y salida
GPT-4o es ahora disponible de forma gratuita para los usuarios de la versión gratuita de ChatGPT y para suscriptores de planes premium, con límites de mensajes cinco veces mayores. Estos cambios van acompañados de un diseño de interfaz de usuario renovado, más intuitivo y conversacional, y una versión de escritorio para macOS, al que pronto le seguirá una versión para Windows. Además, el acceso a funciones previamente pagadas, como la capacidad de “recordar” las preferencias del usuario, ahora se extiende a todos los usuarios.