L’ère de la conversation visuelle : Pixtral, l’IA Open Source qui comprend vos cartes mentales sur papier

L’intelligence artificielle  repousse constamment les limites de l’interaction entrre l’homme et la machine. La  “multimodalité permet désormais d’extraire des informations à partir de notes prises à la main. Cette avancée ouvre de nouvelles perspectives pour la création de cartes mentales. Découvrons cela ici.

Pixtral : l’IA qui déchiffre vos croquis

La licorne française Mistral, spécialisée en IA, a récemment lancé Pixtral, un modèle open source capable d’analyser les images fournies par les utilisateurs. Cette fonctionnalité, accessible gratuitement via le portail Le Chat, offre des possibilités fascinantes. J’ai décidé de tester la capacité de cette IA à « lire » et interpréter une carte mentale rapidement esquissée sur papier.

Étape par étape : de la carte papier à l’analyse IA

  1. Création d’une carte à bulles manuelle
    Lors d’une récente formation à la pensée visuelle pour managers, j’ai utilisé une carte mentale basique (ou carte à bulles) pour recueillir les attentes des participants. Cette méthode simple et efficace a permis de capturer rapidement les échanges du groupe.

2. Interaction avec Pixtral

Ne pas oublier de sélectionner le modèle Pixtral au moment de charger la photo de la carte mentale)

J’ai ensuite soumis une photo de cette carte à Pixtral, en lui demandant : « Pourrais-tu lire cette carte mentale et lister, en respectant la hiérarchie de l’information, les éléments de cette carte qui représentent les attentes des participants au début d’une formation ? »

La réponse de Pixtral, présentée ci-dessous, démontre sa capacité à extraire les principaux sujets de la carte :

3. Transformation en mindmap numérique

Pour aller plus loin, j’ai demandé à Pixtral de générer le code OPML de la liste obtenue. J’ai ensuite :

  • Copié ce code dans un éditeur de texte simple
  • Sauvegardé le fichier avec l’extension .opml
  • Importé ce fichier dans XMind pour créer une nouvelle carte mentale numérique

Cette expérience révèle que, bien que prometteuse, la capacité de Pixtral à reconnaître parfaitement la hiérarchie entre les sujets nécessite encore des améliorations.

Conclusions et perspectives

Cette expérience illustre une véritable révolution : la possibilité de « prompter » sur papier devient réalité. Les outils d’IA visuelle comme Pixtral sont désormais capables de « lire » diverses formes de notes manuscrites (textes, listes, schémas, cartes mentales), ouvrant la voie à de nouvelles interactions pour développer l’information.

Il est surprenant que les principaux éditeurs de logiciels de mind mapping n’aient pas encore intégré cette innovation. Cependant, il est fort probable que cette fonctionnalité sera bientôt disponible dans leurs outils.

À noter que d’autres IA, telles que ChatGPT ou Claude, offrent également des fonctionnalités similaires de « lecture de carte mentale », élargissant ainsi les possibilités d’interaction entre le monde analogique et numérique.

Cette avancée promet de transformer notre façon de capturer, d’organiser et de traiter l’information, en combinant la flexibilité du papier avec la puissance de l’IA.

Intelligence artificielle : menace ou opportunité ?

Cette longue et passionnante conférence de l’entrepreneur franco-libanais Oussama Ammar sur l’intelligence artificielle m’a intéressé, essentiellement les 45 premières minutes et la sketchnote ci-dessus a été réalisée par mes soins, en direct, à l’écoute de la conférence. Je ne suis ni un fan, ni détracteur d’Oussama, je pense simplement que son point de vue sur cette révolution en cours est très intéressant. Il sait traduire des notions complexes dans un langage accessible à tous et mettre le focus sur les aspects essentiels du sujet.

La vidéo de la conférence d’Oussama Ammar: