Published by

Il y a 11 ans -

Temps de lecture 3 minutes

Jazoon, IBM Watson au Jeopardy

La keynote de fin de cette première journée est faite par Dale Lane, d’IBM. Le sujet de ce soir est Watson. Quand j’ai lu le titre de la keynote et vu Jeopardy, j’ai cru à une blague. Mais j’avais tort. Il s’agit en fait de montrer le résultat de quatre années de recherche sur un sujet intéressant : « pouvoir poser des questions dans un langage naturel à un ordinateur »

Et voici comment ce système s’en sort sur un célèbre jeu télévisé américain, Jeopardy. Il a tout simplement battu deux stars. 

Voici les trois grands défis qu’impliquent un tel projet:

  • Pour un ordinateur, il est difficile de comprendre le sens d’une phrase. Les seules opérations possibles sont la numération et la comparaison.
  • Il faut être capable d’avoir une source de connaissance structurée et pouvoir évaluer différentes hypothèses.
  • Il faut que le système s’adapte et soit capable d’apprentissage.

Les sources de connaissances

Il y a deux types de sources de connaissances pour Watson :

  • Les données non-structurées
    Il s’agit de texte brut dans n’importe quel dictionnaire ou revue. L’objectif de l’algorithme en phase de lecture est d’extraire les identités et leurs relations. Autrement dit, construire un graphe de connaissance. On sait seulement que Lucene est utilisé pour la recherche non-structurée.
  • Les données structurées
    Une infime partie des données de Watson est structurée, à la main, patiemment, par des communautés sur le web. Ces données sont plus précises. Watson utilise plusieurs algorithmes en parallèle pour déterminer les réponses et pondère ensuite les hypothèses trouvées (ce que l’on voit sur la vidéo) grâce aux précisions apportées par ces données.

L’apprentissage

Pour le jeu télévisé, les chercheurs ont procédé de la façon suivante :

  • on donne de la lecture pour Watson : la leçon
  • on lui fait passer une archive de jeu (les réponses sont connues) : l’examen
  • on examine ses erreurs et on en déduit les prochaines lectures qu’il aura : l’évaluation

Un professeur de médecine qui a participé au programme de recherche (pas dans le cas de Jeopardy) a trouvé qu’il fallait autant de temps pour apprendre à un humain qu’à Watson. Il considérait vraiment l’outil comme un de ses élèves et lui faisait passer les mêmes examens !

Bien sûr, ceci reste un produit commercial. Les premiers marchés couverts sont la médecine et la finance. Dans le cas de la médecine, l’outil permettrait d’ingérer les milliers de textes médicaux produits chaque année (ce qu’une personne ne peut raisonnablement pas faire) et d’aider le praticien dans son diagnostic. L’outil croise ensuite pour lui son diagnostic avec ses données monumentales, pour pouvoir proposer d’autres pistes.

Conclusion

Pour le futur, Watson devra être capable d’établir un dialogue (gestion d’un contexte de question), puis d’expliquer et préciser les sources et références qui l’ont mené à la réponse.
Beaucoup de questions éthiques et morales ont été posées dans la salle. Le sujet ne laisse pas indifférent. Il s’agit surtout des notions de sécurité, de la validité ainsi que de l’utilisation de données personnelles qui sont sensibles. Dale reconnaît qu’il y a encore du travail sur ce point.
Pour nous rassurer, sachez que pour en arriver à gagner à Jeopardy, il a fallu côté hardware pas moins de 90 serveurs, quelques dizaines de téraoctets de mémoire et enfin des heures et des heures de « lecture ». Notre cerveau prend un peu moins de place, et consomme certainement beaucoup moins d’énergie pour en arriver là ! Le monde de Matrix, ce n’est pas pour demain.

Published by

Publié par Xavier Bucchiotty

Software Engineer Scala Fanboy FP constant learner Akka trainer

Commentaire

3 réponses pour " Jazoon, IBM Watson au Jeopardy "

  1. Published by , Il y a 11 ans

    Sauf erreur, des systèmes expert existent déjà dans le cadre de la médecine, et sont déjà utilisés par certains médecins.

  2. Published by , Il y a 11 ans

    Ce que met IBM en avant n’est pas tant les connaissances de Watson, mais bien la façon dont l’utilisateur y accède.
    Le but est d’être capable d’avoir un « dialogue » avec une machine avec un langage « naturel » et d’avoir un système qui « apprend ».
    Il doit en effet y avoir des systèmes proches existants sur le marché. Par contre, je ne suis pas un expert dans ce domaine métier pour donner plus d’informations.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Nous recrutons

Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.