IBM enrichit Watson du traitement automatique du langage naturel

La plate-forme d’intelligence artificielle Watson d’IBM s’enrichit des fonctions de Traitement Automatique du Langage Naturel (TALN) issu du projet Debater des laboratoires d’IBM.

Debater est le seul système d’IA capable de débattre avec des humains sur des sujets complexes. Parmi les nouveautés figure une nouvelle fonction d’analyse des sentiments qui a été définie pour identifier et analyser les différents discours et expressions familières.

Par cette analyse, les entreprises peuvent désormais commencer à analyser ces données linguistiques avec les API Watson. Cette nouvelle technologie permettra une meilleure compréhension des documents commerciaux tels que les PDF et les contrats, afin de les ajouter à ses modèles d’IA. IBM a amélioré l'analyse des sentiments afin de pouvoir mieux identifier et comprendre les combinaisons de mots compliqués comme les idiomes (phrases et expressions) et les soi-disant "changeurs de sentiments", c’est-à-dire des combinaisons de mots qui, ensemble, prennent un nouveau sens.

Une nouvelle technologie de classification permet aux clients de créer des modèles d’IA pouvant plus facilement classer les clauses qui figurent dans les documents commerciaux. Basée sur la technologie de classification de Project Debater, cette nouvelle fonctionnalité peut apprendre à effectuer de nouvelles classifications bien plus rapidement, et, ce, à partir de quelques centaines d’échantillons seulement. Elle sera ajoutée à Watson Discovery plus tard dans l’année. 

Autre possibilité, Cette technologie tire des données textuelles de diverses sources pour fournir aux utilisateurs un résumé de ce qui est dit et écrit sur un sujet particulier. La solution sera intégrée dans Watson Natural Language Understanding dans le courant de cette année.

Autre cas d’usage qui sera intégré plus tard dans l’année dans Watson Discovery : regrouper les données entrantes afin de créer des "sujets" d'informations connexes qui pourront ensuite être analysés par le regroupement de sujets afin de comprendre et de refléter le langage spécifique de certains métiers comme la santé, l’assurance, la finance.