OpenAI, la organización detrás de la revolucionaria inteligencia artificial ChatGPT, ha anunciado recientemente una serie de mejoras impresionantes para su modelo. En un post en su blog oficial, OpenAI reveló que ChatGPT ahora tiene la capacidad de ver, escuchar y hablar. Estas nuevas características prometen cambiar la forma en que interactuamos con la inteligencia artificial y ampliar aún más sus aplicaciones en nuestra vida diaria.
Nuevas Capacidades de Voz e Imagen
OpenAI ha comenzado a implementar nuevas capacidades de voz e imagen en ChatGPT. Estas características ofrecen una interfaz más intuitiva, permitiendo a los usuarios tener una conversación por voz o mostrar a ChatGPT lo que quieren discutir. Imagina poder tomar una foto de un monumento mientras viajas y tener una conversación en vivo sobre lo que lo hace interesante. O en casa, tomar fotos de tu nevera y despensa para descubrir qué preparar para la cena, y luego pedir una receta paso a paso.
Habla con ChatGPT
La nueva capacidad de voz permite a los usuarios interactuar con ChatGPT de una manera más natural. Puedes usar tu voz para tener una conversación de ida y vuelta con tu asistente, pedirle que te cuente un cuento antes de dormir o resolver un debate en la mesa de la cena. Esta funcionalidad de voz está impulsada por un nuevo modelo de texto a voz, capaz de generar audio similar al humano a partir de solo texto y unos segundos de muestra de voz.
Interactúa con Imágenes
Además de la voz, ChatGPT ahora puede interactuar con imágenes. Ya sea que necesites ayuda para entender por qué tu parrilla no enciende, planificar una comida basada en lo que tienes en la nevera, o analizar un gráfico complejo para datos relacionados con el trabajo, ChatGPT está aquí para ayudarte. Esta comprensión de imágenes está impulsada por modelos multimodales como GPT-3.5 y GPT-4.
Despliegue Gradual y Seguridad
OpenAI enfatiza la importancia de la seguridad y la responsabilidad al implementar estas nuevas capacidades. La organización está desplegando gradualmente las capacidades de imagen y voz, permitiendo mejoras y refinamientos con el tiempo. Además, OpenAI es transparente acerca de las limitaciones del modelo y desalienta los casos de uso de alto riesgo sin la debida verificación.
Acceso Expandido
Los usuarios Plus y Enterprise tendrán acceso a las capacidades de voz e imágenes en las próximas dos semanas. OpenAI planea expandir estas características a otros grupos de usuarios, incluidos los desarrolladores, poco después.
En resumen, las nuevas capacidades de ChatGPT prometen revolucionar aún más la forma en que interactuamos con la inteligencia artificial. Estas características no solo hacen que la IA sea más accesible y útil, sino que también abren nuevas posibilidades para su aplicación en nuestra vida diaria.
Fuente: https://openai.com/blog/