¿Estás interesado en ellos? OFERTAS? Ahorra con nuestros cupones en Whatsapp o TELEGRAMA!

ChatGPT ahora es un asistente que puede ver, oír y hablar

25 septiembre 2023

ChatGPT, desarrollado por OpenAI, presenta nuevas capacidades que le permiten interactuar a través de voz e imágenes, ofreciendo una interfaz intuitiva y más formas de integrar ChatGPT en su vida diaria. En un anuncio reciente en su sitio web, OpenAI decidió revelar estas nuevas características con anticipación. Asimismo también destacó los beneficios que aportan y los desafíos que presentan en el creciente mercado de la IA.

Temas de este artículo:

ChatGPT: interacción de voz

Con la nueva funcionalidad de voz, los usuarios pueden tener conversaciones interactivas con ChatGPT. Esto le permite utilizar el asistente incluso en movimiento, aumentando el potencial del chatbot. Por ejemplo, un usuario podría pedirle a ChatGPT que cuente una historia infantil mientras está en movimiento, haciéndolo más divertido.

Una historia creada por el chatbot

O, durante una cena con amigos, podría surgir un debate sobre un tema concreto; en este caso, los usuarios pueden utilizar el bot para obtener información precisa y resolver el debate de manera constructiva.

La tecnología de voz de ChatGPT utiliza un modelo avanzado de texto a voz. En colaboración con actores de doblaje profesionales, este modelo es capaz de generar audio humanoide a partir de texto y muestras de voz breves, lo que hace que la interacción con ChatGPT sea aún más natural e intuitiva. Además, gracias a Susurro, un sistema de reconocimiento de voz de código abierto desarrollado por OpenAI, las palabras habladas son transcrito a texto con gran precisión, permitiendo que el chatbot comprenda y responda eficazmente a las solicitudes de los usuarios.

ChatGPT: interacción visual

Como se indicó anteriormente, el modelo de IA ahora puede analizar una o más imágenes, permitiendo a los usuarios resolver problemas, planificar comidas o analizar gráficos complejos. Por ejemplo, un usuario podría enviar una fotografía del contenido de su frigorífico. Por lo tanto, se debe utilizar el chatbot. analizar los alimentos presentes y sugerir recetas basadas en estos ingredientes, También proporciona instrucciones paso a paso para la preparación.

Lea también: GPT-4: Gemini será el rival de Google. Aquí están las diferencias

Además, si el usuario necesita centrarse en un elemento particular de la imagen, La aplicación móvil de ChatGPT incluye una herramienta de dibujo lo que permite resaltar áreas específicas de la imagen, haciendo que la comunicación y el análisis sean aún más precisos y personalizados.

La comprensión de imágenes está impulsada por los modelos multimodales GPT-3.5 y GPT-4. Estos modelos avanzados Aplican sus habilidades lingüísticas a una amplia gama de imágenes, como fotografías, capturas de pantalla y documentos. que contienen texto e imágenes, lo que permite a ChatGPT comprender e interpretar el contexto visual con precisión y detalle.

Cabe mencionar que desde poco OpenAI ha integrado no solo eso Canva pero también DALL-E 3 en ChatGPT, o el modelo de imagen generativa.

Cuándo y para quién estará disponible

En las próximas dos semanas OpenAI implementará voz e imágenes en ChatGPT para los usuarios usuarios con suscripciones Plus y Enterprise.

Estará disponible la función que permite la interacción por voz en iOS y Android pero no en la versión web, que es la que utiliza la mayoría de la gente.

En su lugar estará disponible la función que permite la interacción visual. en todas las plataformas, por tanto Android, iOS y web.

Fuente | OpenAI