Multicriteria graphics
Algorithmique ● Recherche opérationnelle
#analyse multicritère #clustering #aide à la décision
Édition, 20 p.
Laura Simonati
Illustratrice et graphiste
@baxcapece / @piccoliposti
www.laurasimonati.com
Jean Rosenfeld
Docteur
Computer & Decision Engineering, Service Mathématiques de la Gestion (CoDE / SMG), École polytechnique, ULB
« J’ai trouvé particulièrement intéressant le fait de collaborer avec des profils tout à fait différents du mien en termes de ormation et j’ai été très agréablement surpris par l’intérêt que portent les profils artistiques par rapport aux recherches scientifiques. »
« L’échange humain avec le scientifique est ce qui m’a le plus intéressé, ainsi que les compromis qu’on a dû faire ensemble, les recherches, et le lien de ce qu’on faisait avec la réalité (ce qui manque souvent dans les projets d’école). »
Développement et évaluation du clustering multicritère
Il ne fait aucun doute que l’époque actuelle est entre autres celle des données. En effet, les outils dont nous disposons aujourd’hui nous permettent de récolter une quantité immense d’information. Nous avons le pouvoir de connaître la distance exacte parcourue par une personne ou un véhicule, la quantité d’énergie utilisée par un objet ou un foyer, le nombre précis d’individu·e·s qui entrent ou sortent d’un lieu donné, les différents parcours sur des pages Internet d’un nombre toujours croissant d’utilisateur·rice·s du Web, etc. Ces données sont récoltées grâce à différents capteurs et autres processus nourris par des avancées technologiques toujours plus folles.
Cette récolte d’information ne cesse d’augmenter, quantitativement et qualitativement. Mais que pouvons-nous en faire ? Que voulons-nous en faire ? Comment l’utiliser afin d’essayer d’améliorer la société dans laquelle nous vivons ?
Grâce à ces données, des décisions peuvent donc être prises. L’un des exemples les plus communs est l’utilisation d’un GPS. Qui, aujourd’hui, n’utilise jamais un GPS afin de connaître le meilleur chemin possible pour aller d’un point A à un point B ? Il s’agit donc de l’utilisation d’information - la distance exacte de chaque chemin possible, la circulation routière dans ces différents chemins à l’instant t, la vitesse autorisée sur chaque tronçon, etc. - afin de prendre une décision à l’aide d’un algorithme. Il s’agit de l’ingénierie de la décision. C’est dans ce domaine que je fais ma thèse de doctorat.
L’ingénierie de la décision sert donc à aider un décideur (particulier, entreprise, gouvernement, etc.) à faire certains choix, à prendre certaines mesures. Souvent, l’humain a tendance à vouloir grouper les choses similaires entre elles. C’est un comportement naturel et compréhensible. En effet, face à de nombreuses alternatives, il est naturellement utile de rassembler celles qui sont semblables afin de séparer notre ensemble en différents sous-ensembles.
Nous le faisons tous quotidiennement sans toujours le remarquer : séparation des produits d’un magasin selon leur type ; division des étudiant·e·s d’une école selon leur âge, leur section ou leurs résultats ; regroupement des patient·e·s d’un hôpital selon le type d’intervention requis, l’urgence quant au traitement ou l’âge, etc. Ce type d’opérations peut s’avérer important afin de faciliter la vie d’un·e décideur·euse avant de faire un choix.
Le processus de détection de groupes dans un jeu de données s’appelle le clustering. Il s’agit donc, en partant d’une certaine quantité de données (qui peut être très importante) d’essayer d’identifier les groupes de points « proches » les uns des autres afin de les regrouper au sein d’une même catégorie (ou cluster). Il s’agit d’un champ de recherche très vaste et répandu.
La particularité de ma recherche est que la notion de similarité (pour détecter les points « proches » les uns des autres) prend en compte les préférences d’un·e décideur·euse selon différents critères. Par exemple, pour des données regroupant différents moyens de transport, un·e décideur·euse peut décider de maximiser ou de minimiser la taille du véhicule (selon sa préférence). Le fait de prendre cela en compte entraîne des relations asymétriques entre les différents points, ce qui complexifie et enrichit le problème.