Chercheur : 
Julien Gascon-Samson

Établissement : 
École de technologie supérieure (ÉTS)

Année de concours : 
2022-2023

Les architectures de systèmes distribués conventionnelles visent habituellement à centraliser le traitement des données; par exemple, les données produites par les appareils de l’Internet des Objets (IoT) sont habituellement traitées dans le cloud. Or, certaines applications peuvent nécessiter un traitement plus localisé des données, telles que les applications critiques qui ne pourraient pas tolérer une coupure de connexion, ou les applications nécessitant une faible latence. L’edge computing (informatique en périphérie) vise plutôt à délocaliser une partie du traitement des données afin de traiter ces dernières plus près d’où elles sont produites et consommées, ce qui peut permettre d’augmenter la performance (p. ex., diminuer le temps de réponse), de réduire les coûts monétaires ou en ressources informatiques (bande passante, stockage, etc.), et de soutenir la prise de décision rapide.

Dans plusieurs contextes, une multitude de capteurs IoT produisent des flux de données à intervalles réguliers qui doivent être traités en continu, parfois à haut débit et avec une faible latence. Les systèmes de traitement distribué par flux visent à modéliser les différentes étapes du pipeline de traitement des données au moyen d’abstractions basées sur des graphes informatiques, dans lesquels l’ensemble des éléments de la chaîne de traitement (opérateurs) sont reliés entre eux afin de modéliser le flot des données. Cette modélisation peut notamment servir à modéliser des processus d’affaire. Les modèles traditionnels de traitement distribués de flux sont toutefois limités par l’expressivité des relations entre les opérateurs, ce qui peut avoir un impact sur la performance dans le contexte d’infrastructures déployées en périphérie. D’autre part, le paradigme publish-subscribe (publication-souscription), basé sur des abstractions de files de messages, propose un éventail d’architectures de communication permettant l’échange de données de manière découplée entre différentes applications et services, ou entre les différentes composantes d’une même application. Ce paradigme est très utilisé pour modéliser les flots de données dans le monde de l’IoT. La variante content-based (orienté-contenu) ajoute une flexibilité supplémentaire en permettant aux entités intéressées de définir de manière très granulaire le contenu qu’elles souhaitent recevoir des autres entités.

Ce projet de recherche vise à explorer l’utilisation du paradigme publish-subscribe content-based afin de bonifier la sémantique de transmission des flux de données au sein des systèmes de traitement distribué par flux. L’utilisation de ce paradigme amène la possibilité pour les opérateurs de la chaîne de traitement de définir de manière très précise les informations à recevoir des nœuds en amont, ce qui ouvre la voie à des gains architexturaux et en performance (p. ex., réduction de la bande passante consommée dans la couche edge, ou edge/cloud).

Le projet de recherche proposé se décline en trois sous-objectifs de recherche. En plus des objectifs et retombées sur le plan scientifique et de la diffusion des connaissances, le projet ouvre la voie à des retombées pertinentes pour le milieu industriel du Québec et du Canada, ainsi qu’à la contribution à la formation d’un.e étudiant.e doctoral.e, tout en intégrant des principes d’équité, de diversité et d’inclusion.