Responsable : 
William Hamilton

Établissement : 
Université McGill

Année de concours : 
2020-2021

Table des matières

  1. Résumé du projet

1. Résumé du projet

Au cours des vingt dernières années, des universitaires, des organismes gouvernementaux et des entreprises ont accumulé des quantités considérables de données dans des bases de connaissances relationnelles. Ces bases de connaissances contiennent des milliards de faits sur les relations biologiques, sociales et économiques, dont le nombre ne cesse de croître. Toutefois, une base de connaissances, qu’elle porte sur des faits biomédicaux, le commerce électronique ou la fabrication, reste toujours incomplète et il importe d’élaborer des stratégies de complétion automatisées. Par exemple, nous pourrions utiliser la complétion de la base de connaissances biomédicales afin de déduire de nouvelles utilisations des médicaments existants à partir des milliards d’interactions connues qu’elle contient entre les médicaments, les maladies et les protéines. Ou, étant donné qu’il existe une base de données de commerce électronique contenant des renseignements sur les comportements d’achat des utilisateurs, nous pourrions utiliser la complétion de la base de connaissances pour déduire les attributs manquants des utilisateurs.

Il s’agit donc d’élaborer un cadre d’apprentissage machine, qui peut apprendre à transposer des stratégies de raisonnement entre des graphes de connaissances, dans le but d’améliorer la complétion de la base de connaissances dans des contextes comportant de multiples bases de connaissances interreliées. L’une des principales limites de l’état actuel des stratégies de complétion des bases de connaissances tient à ce que les modèles supposent généralement que l’apprentissage se fait à partir d’un seul graphe de connaissances fixes. Il s’agit d’une hypothèse raisonnable lorsque les connaissances sont stockées dans une seule base de connaissances statique, qui devient cependant extrêmement limitative dans de nombreuses applications réelles, où il existe plusieurs bases de connaissances interreliées à partir desquelles apprendre. Par exemple, le milieu biomédical dispose souvent de graphes de connaissances distincts correspondant au savoir biologique sur différents organismes, écosystèmes ou types de tissus. Ce projet permettra d’éliminer cette restriction, à l’aide de techniques d’apprentissage machine fondées sur les réseaux neuronaux de graphes et le méta-apprentissage, afin d’élaborer la prochaine génération d’algorithmes de complétion des bases de connaissances à même de tirer parti de multiples e bases de connaissances interreliées pour améliorer la performance.