ChatGPT ajoute le support de la voix et des images pour les requêtes
OpenAI fait évoluer son chatbot ChatGPT en ajoutant le support de fonctionnalités avec la voix et des images en ce qui concerne les requêtes des utilisateurs.
OpenAI annonce que les utilisateurs de ChatGPT pourront bientôt parler au chatbot. Une fois la fonctionnalité disponible sur l’application iOS et Android, les utilisateurs peuvent se rendre dans les paramètres, puis naviguer dans la section des nouvelles fonctionnalités. Ils peuvent ensuite activer les conversations vocales de l’application. Il est possible de sélectionner l’icône du casque et de choisir l’une des cinq options vocales.
Sur son blog, OpenAI indique :
La nouvelle capacité vocale est alimentée par un nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir d’un simple texte et de quelques secondes d’échantillon de discours. Nous avons collaboré avec des acteurs professionnels pour créer chacune des voix. Nous utilisons également Whisper, notre système de reconnaissance vocale open-source, pour transcrire vos paroles en texte.
De plus, les applications mobiles de ChatGPT pourront bientôt utiliser le bouton représentant une photo pour prendre une photo ou choisir une photo déjà prise. ChatGPT pourra alors vérifier la photo et effectuer un certain nombre de tâches différentes, telles que l’analyse d’un graphique pour le travail, le dépannage lorsqu’un appareil ne fonctionne pas, etc. OpenAI indique :
La compréhension des images est assurée par les modèles multimodaux GPT-3.5 et GPT-4. Ces modèles appliquent leurs compétences de raisonnement linguistique à un large éventail d’images, telles que des photographies, des captures d’écran et des documents contenant à la fois du texte et des images.
Les nouveautés vont être disponibles au fil des prochaines semaines, d’abord pour les abonnés à ChatGPT Plus et Entreprise. Les utilisateurs gratuits y auront le droit après.