Elon Musk’s xAI a ajouté des capacités de compréhension d’images à son modèle Grok AI. Ainsi, les utilisateurs payants sur la plateforme X peuvent télécharger une image et poser des questions au chatbot AI à ce sujet. Un des employés de xAI et le compte officiel de Grok ont posté à ce sujet sur X.
Dans un post séparé, Musk a déclaré que Grok peut même expliquer le sens d’une blague grâce à la nouvelle fonctionnalité de compréhension d’images. Il a ajouté que la fonctionnalité est encore au stade initial et s’améliorera avec le temps.
En août, la société d’IA de Musk a lancé Grok-2 en tant que modèle et sous la forme d’un chatbot pour les utilisateurs premium sur X. Le chatbot sur le réseau social a également acquis des capacités de génération d’images en utilisant le modèle FLUX.1 de Black Forest Labs.
À ce moment-là, xAI a indiqué qu’elle proposerait une compréhension multimodale dans le cadre de l’expérience de Grok sur X et de l’API développeur.
Grok pourrait bientôt comprendre les documents. En réponse à un feedback d’un utilisateur sur le fait que Grok ne pouvait pas gérer les photos ou les PDF, Musk a déclaré : « Pas pour longtemps. Nous faisons en quelques mois ce que les autres ont mis des années à faire. »
Le réseau social essaie d’ajouter plus de fonctionnalités au chatbot AI et aux niveaux d’utilisateurs payants pour rendre l’offre plus attrayante. Plus tôt ce mois-ci, X a déployé un nouvel outil appelé Radar pour les abonnés Premium+ pour observer les tendances en temps réel et fournir des insights sur les conversations.