Doctorant sous la direction de A. TENENHAUS

L’aide à la prise de decision est une tâche essentielle dans de nombreux contexte applicatif d’importance. Typiquement l’utilisateur en renseignant les pathologies (cholesterol, pression artérielle, . . .)
d’un ensemble de patients souhaite inférer sur la probabilité qu’un patient ait une pathologie donnée. De
manière similaire, je citerai les systèmes de prédiction du comportement d’utilisateurs dans l’optique d’inférer des recommendations personnalisées à partir d’un ensemble de classes connues de manière lacunaire.
On pensera ici au service de recommendation de vidéo préférées de NetFlix ou de constitution automatisée d’une "playlist" personnalisée sous Deezer à partir d’un ensemble de choix étant par définition un
sous-ensemble lacunaire du catalogue disponible. L’estimation de la fonction de masse (FM) jointe d’un
ensemble de variables aléatoires en se basant sur une observation partielle des données est un challenge
clé au coeur de ses contextes applicatifs importants, et plus généralement de l’apprentissage statistique, la
fouille de données ou le traitement statistique du signal. Du fait de l’accroissement des moyens de mesures
et de stockage, l’aide à la prise de decision doit faire face à un problème de traitement et d’analyse de
données massives ou encore de type "big data". Ce travail de thèse s’inscrit dans ce contexte et a pour
objectifs de :
1. proposer un formalisme basé sur l’algèbre multilinéaire adapté à la representation à l’identification
non-ambiguë de la FM jointe et des FM conditionnelles,
2. casser la "curse of dimentionality" ou encore la malediction de la course à la dimension,
3. déployer des stratégies distribuées et collaboratives d’optimisation afin d’estimer les paramètres
du modèle.