Approche bayésienne de l'estimation des composantes périodiques des signaux en chronobiologie.

Mircea DUMITRU
Soutenance de thèse de doctorat le 25 Mars 2016, 10h00 à CentraleSupelec (Gif-sur-Yvette) Amphi Ampère

La toxicité et l'efficacité de plus de 30 agents anticancéreux présente de très fortes variations
en fonction du temps de dosage. Par conséquent, les biologistes qui étudient le rythme circadien ont
besoin une méthode très précise pour estimer le vecteur de composantes périodiques (CP) de signaux
chronobiologiques En outre, dans les développements récents, non seulement la période dominante
ou le vecteur de CP présentent un intérêt crucial, mais aussi leur stabilités ou variabilités. Dans les
expériences effectuées en traitement du cancer, les signaux enregistrés correspondant à différentes
phases de traitement sont courts, de sept jours pour le segment de synchronisation jusqu'à deux ou
trois jours pour le segment après traitement. Lorsque on étudie la stabilité de la période dominante nous
devons considérer des signaux très court par rapport à la connaissance a priori de la période dominante,
placée dans le domaine circadien. Les approches classiques basées sur la transformée de Fourier (TF)
sont inefficaces (i.e. manque de précision) compte tenu de la particularité des données (i.e. la courte
longueur). Une autre particularité des signaux qui est prise en considération dans ces expériences,
est le niveau de bruit. Ces signaux étant très bruités, il est difficile de déterminer les composantes
périodiques associées aux phénomènes biologiques et de les distingue de celle qui sont associées au
bruit. Dans cette thèse, nous proposons une nouvelle méthode pour l'estimation du vecteur de CP des
signaux biomédicaux, en utilisant les informations biologiques a priori et en considérant un modèle
qui représente le bruit.

Les signaux enregistrés dans le cadre d'expériences développées pour le traitement du cancer ont
un nombre limité de périodes. Cette information a priori peut être traduit comme la parcimonie du
vecteur de CP. La méthode proposée considère l'estimation de vecteur de CP comme un problème in-
verse en utilisant l'inférence bayésienne générale afin de déduire toutes les inconnues de notre modèle,
à savoir le vecteur de CP mais aussi les hyperparamètres (i.e. les variances associées). L'information
a priori de parcimonie est modélisée en utilisant une loi a priori renforcent la parcimonie. Dans cette
thèse, nous proposons une distribution de Student, considérée comme la distribution marginale d'une
loi bivariée - la distribution Normale - Inverse Gamma. En fait, lorsque l'égalité entre les paramètres de
forme et d'échelle, de la distribution Inverse Gamma n'est pas imposée, la marginale de la distribution
Normale-Inverse Gamma est une généralisation de la distribution de Student. Nous construisons un mo-
dèle hiérarchique où nous attribuons aussi une loi a priori pour les hyperparamètres. L'expression de
la loi conjointe a posteriori du vecteur de CP et des hyperparamètres est obtenue par la règle de Bayes
et les inconnues sont estimées soit par Maximum A Posteriori (MAP) soit par l'espérance a posteriori
(EAP). Pour le calcul de EAP, l'expression de la loi a posteriori est approchée par une loi séparables en
utilisant l'approximation bayésienne variationnelle (ABV), via la divergence de Kullback-Leibler (KL).
Deux possibilités sont envisagées : une approximation avec des lois partiellement séparables ou entiè-
rement séparable. Ces algorithmes sont présentés en détail et sont comparées avec ceux correspondant
au modèle gaussien. Nous examinons la convergence des algorithmes et donnons des résultats de si-
mulation afin de comparer leurs performances. Enfin, nous montrons des résultats de simulation sur
des données synthétiques et réelles dans une application de traitement du cancer. Les données réelles
utilisées dans cette thèse representent des modèles de repos-activité et d'expression des gènes de KI /
KI Per2 : :luc souris luc, âgées de 10 semaines, seules dans leur cages des RT-BIO.

Mots-clefs: Estimation de composantes périodiques, Problèmes inverses, Approches bayesiennes, Mo-
del hierarchique, Renforcement de parcimonie, Student-t generalisé, chronobiologie, chronothérapie,
Gènes de l'horloge, Rythme circadien, Traitement du cancer.

Composition du jury

M. Ali MOHAMMAD-DJAFARI, Directeur de recherche CNRS, L2S, Gif-sur-Yvette, Directeur de thèse
M. Francis LÉVI, Professeur des Universités, University of Warwick, Angleterre, Co-directeur de thèse
M. Jean-François GIOVANELLI, Professeur des Universités, IMS, Bordeaux, Rapporteur
M. Ercan Engin KURUOGLU, Chercheur sénior CNRS, ISTI, Italie, Rapporteur
M. Alexandre RENAUX, Maître de conférences, Paris-Sud, Orsay, Examinateur
M. Michel KIEFFER, Professeur des Universités, Paris-Sud, Orsay, Examinateur