L’intelligence artificielle repousse constamment les limites de l’interaction entrre l’homme et la machine. La “multimodalité permet désormais d’extraire des informations à partir de notes prises à la main. Cette avancée ouvre de nouvelles perspectives pour la création de cartes mentales. Découvrons cela ici.
Pixtral : l’IA qui déchiffre vos croquis
La licorne française Mistral, spécialisée en IA, a récemment lancé Pixtral, un modèle open source capable d’analyser les images fournies par les utilisateurs. Cette fonctionnalité, accessible gratuitement via le portail Le Chat, offre des possibilités fascinantes. J’ai décidé de tester la capacité de cette IA à « lire » et interpréter une carte mentale rapidement esquissée sur papier.
Étape par étape : de la carte papier à l’analyse IA
- Création d’une carte à bulles manuelle
Lors d’une récente formation à la pensée visuelle pour managers, j’ai utilisé une carte mentale basique (ou carte à bulles) pour recueillir les attentes des participants. Cette méthode simple et efficace a permis de capturer rapidement les échanges du groupe.
2. Interaction avec Pixtral
Ne pas oublier de sélectionner le modèle Pixtral au moment de charger la photo de la carte mentale)
J’ai ensuite soumis une photo de cette carte à Pixtral, en lui demandant : « Pourrais-tu lire cette carte mentale et lister, en respectant la hiérarchie de l’information, les éléments de cette carte qui représentent les attentes des participants au début d’une formation ? »
La réponse de Pixtral, présentée ci-dessous, démontre sa capacité à extraire les principaux sujets de la carte :
3. Transformation en mindmap numérique
Pour aller plus loin, j’ai demandé à Pixtral de générer le code OPML de la liste obtenue. J’ai ensuite :
- Copié ce code dans un éditeur de texte simple
- Sauvegardé le fichier avec l’extension .opml
- Importé ce fichier dans XMind pour créer une nouvelle carte mentale numérique
Cette expérience révèle que, bien que prometteuse, la capacité de Pixtral à reconnaître parfaitement la hiérarchie entre les sujets nécessite encore des améliorations.
Conclusions et perspectives
Cette expérience illustre une véritable révolution : la possibilité de « prompter » sur papier devient réalité. Les outils d’IA visuelle comme Pixtral sont désormais capables de « lire » diverses formes de notes manuscrites (textes, listes, schémas, cartes mentales), ouvrant la voie à de nouvelles interactions pour développer l’information.
Il est surprenant que les principaux éditeurs de logiciels de mind mapping n’aient pas encore intégré cette innovation. Cependant, il est fort probable que cette fonctionnalité sera bientôt disponible dans leurs outils.
À noter que d’autres IA, telles que ChatGPT ou Claude, offrent également des fonctionnalités similaires de « lecture de carte mentale », élargissant ainsi les possibilités d’interaction entre le monde analogique et numérique.
Cette avancée promet de transformer notre façon de capturer, d’organiser et de traiter l’information, en combinant la flexibilité du papier avec la puissance de l’IA.