Caractérisation des limites fondamentales de l'erreur quadratique moyenne pour l'estimation de signaux comportant des points de rupture

Monsieur Lucien BACHARACH
Soutenance de thèse de doctorat le 28 Septembre 2018, 10h00 à CentraleSupelec (Gif-sur-Yvette)

a le plaisir de vous inviter à sa soutenance de Thèse de doctorat dirigés par Monsieur Alexandre RENAUX et Monsieur Mohammed Nabil EL KORSO

Cette soutenance aura lieu à CENTRALESUPÉLEC, Bâtiment Bouygues (9 rue Joliot-Curie, 91190 Gif-sur-Yvette),

Vendredi 28 Septembre 2018, à 10h00

Théâtre Joël Rousseau (salle e.070)

Vous êtes cordialement invités au pot qui suivra en Salle du conseil du L2S (Bâtiment Bréguet, salle B4.40).

 

Composition du jury :

M. Alexandre RENAUX Maître de Conférences L2S, Université Paris-Sud Directeur de thèse
M. Mohammed Nabil EL KORSO Maître de Conférences LEME, Université Paris Nanterre Co-Directeur de thèse
M. Claude DELPHA Maître de Conférences L2S, Université Paris-Sud Examinateur
M. André FERRARI Professeur Laboratoire Lagrange, Université de Nice Sophia Antipolis Examinateur
Mme Anne GéGOUT-PETIT Professeure IECL, Université de Lorraine Examinatrice
M. Olivier MICHEL Professeur GIPSA-Lab/DIS, INP de Grenoble Examinateur
M. David BRIE Professeur CRAN, Université de Lorraine Rapporteur
M. Nicolas DOBIGEON Professeur IRIT/INP-ENSEEIHT, Université de Toulouse Rapporteur

 

Résumé : 
Cette thèse porte sur l'analyse des performances d'estimateurs en traitement du signal, à travers l'étude des bornes inférieures de l'erreur quadratique moyenne (EQM) pour l'estimation de points de rupture. Ces outils permettent de caractériser le comportement d'estimateurs, tels que celui du maximum de vraisemblance (dans le contexte fréquentiste), ou ceux du maximum a posteriori et de la moyenne conditionnelle (dans le contexte bayésien). La difficulté majeure provient du fait que, pour un signal échantillonné, les paramètres d'intérêt (à savoir les points de rupture) appartiennent à un espace discret. En conséquence, les résultats asymptotiques classiques (comme la normalité asymptotique du maximum de vraisemblance) ou la borne de Cramér-Rao ne s'appliquent plus. Quelques résultats sur la distribution asymptotique du maximum de vraisemblance provenant de la communauté mathématique sont actuellement disponibles, mais leur applicabilité à des problèmes pratiques de traitement du signal n'est pas immédiate. En revanche, si l'on se concentre sur les moments d'ordre 2 des estimateurs, les bornes inférieures de l'EQM forment des outils pertinents, qui ont fait l'objet d'importants travaux ces dernières années. Ceux-ci ont notamment abouti à des inégalités plus précises que la borne de Cramér-Rao, qui jouissent en outre de conditions de régularité plus faibles, et ce, même en régime non asymptotique, permettant ainsi de délimiter la plage de fonctionnement optimal des estimateurs. Le but de cette thèse est, d'une part, de compléter la caractérisation de la zone asymptotique (en particulier lorsque le rapport signal sur bruit est élevé et/ou pour un nombre d'observations infini) pour des problèmes d'estimation de points de rupture. D'autre part, le but est de donner les limites fondamentales de l'EQM d'un estimateur dans la plage non asymptotique. Les outils utilisés ici sont les bornes inférieures de l'EQM de la famille Weiss-Weinstein, qui est déjà connue pour être plus précise que la borne de Cramér-Rao dans les contextes, entre autres, de l'analyse spectrale et du traitement d'antenne. Nous fournissons une forme compacte de cette famille dans le cas d'un seul et de plusieurs points de ruptures, puis nous étendons notre analyse aux cas où les paramètres des distributions sont inconnus. Nous fournissons également une analyse de la robustesse de cette famille vis-à-vis de la distribution a priori sur la localisation des ruptures. Enfin, nous appliquons ces bornes à plusieurs problèmes pratiques : données gaussiennes, poissonniennes et processus exponentiels.

Mots-clés :  bornes inférieures de l'erreur quadratique moyenne,borne de Weiss-Weinstein,borne de Cramér-Rao,estimation de paramètres,estimateurs du maximum de vraisemblance et du maximum a posteriori,estimation de points de rupture multiples

Abstract : 
This thesis deals with the study of estimation performance in signal processing, and focuses on the analysis of lower bounds on the Mean Squared Error (MSE) for abrupt change-point estimation. Those tools contribute to characterizing the estimation behavior for estimators such as the maximum likelihood estimator (in the frequentist context), as well as the maximum a posteriori and the conditional mean estimators (in the Bayesian context). The main difficulty comes from the fact that, when dealing with sampled signals, the parameters of interest (i.e., the change-point locations) lie on a discrete space. Consequently, the classical large sample theory results (e.g., the asymptotic normality of the maximum likelihood estimator) or the Cramér-Rao bound do not apply. Some results concerning the asymptotic distribution of the maximum likelihood estimator are available in the mathematical literature but are currently of limited interest for practical signal processing problems. Focusing on the 2nd-order moments of the estimators, lower bounds on the MSE make up essential tools, which have been the subject of many studies in the last years. As a result, new inequalities have been proposed, leading to tighter lower bounds in comparison with the Cramér-Rao bound. These new lower bounds have less regularity conditions and enable the prediction of estimators' behavior in terms of MSE, both in asymptotic and non-asymptotic regimes. The goal of this thesis is to complete previous results on lower bounds in the asymptotic area (i.e. when the number of samples and/or the signal-to-noise ratio is high) for change-point estimation, as well as to provide an analysis in the non-asymptotic region. The tools used here are the lower bounds of the Weiss-Weinstein family, which are already known in signal processing to outperform the Cramér-Rao bound in applications such as spectral analysis or array processing. A closed-form expression of this family is provided for a single and multiple change-points, and some extensions are given when the distribution parameters are unknown. An analysis in terms of robustness regarding the prior distribution on the change locations is also provided. Finally, we apply our results to specific problems, such as Gaussian data, Poisson data and exponentially distributed data.

Keywords :  lower bounds on the mean squared error,Weiss-Weinstein bound,Cramér-Rao bound,parameter estimation,maximum likelihood estimators,maximum a posteriori estimators,asymptotic and non-asymptotic performance,change-point estimation