Doctorant sous la direction de M. Kowalski

Le problème de séparation de sources audio consiste à estimer les signaux de plusieurs sources sonores enregistrées simultanément par plusieurs microphones. Ce problème est classiquement connu comme le "cocktail party problem". Plusieurs difficultés apparaissent dans ce problème. Dans le cas le plus général, on ne connait que les enregistrements des diverses sources, sans même savoir "comment", elles ont été enregistrées: c'est le cas aveugle. De plus, un effet d'écho s'ajoute naturellement, qui doit être pris en compte dans les cas les plus réalistes: on à affaire à un problème de déconvolution. Enfin, suivant le nombre de microphone et le nombre de sources enregistrées, on peut être dans un cas dit sur-déterminé, où il y a plus d'observations que de sources, ou inversement dans un cas sous-déterminés. Si le problème de la séparation aveugle des mélanges instantanés, c'est-à-dire sans écho, dans le cas sur-déterminé peut se traiter dans le cadre de l'analyse en composantes indépendantes (ICA), les cas sous-déterminés et les mélanges convolutifs posent encore de sérieux challenges. Pour les signaux audio, il est naturel d'exploiter la notion de parcimonie dans le domaine temps-fréquence. C'est le but de la transformée de Fourier à court terme. Grâce à cette représentation, on peut approcher les mélange convolutifs sur-déterminé comme plusieurs problèmes instantanées dans chaque bande fréquentielles, et exploiter les techniques d'ICA auxquels s’ajoute le problème de permutation des sources estimées. Dans le cadre sous-déterminés, la séparation se fait généralement en deux étapes: une étape d'estimation du système de mélange, et une étape de séparation de source proprement-dite. Ici encore, ces deux étapes peuvent bénéficier de l'utilisation de la parcimonie dans le domaine temps-fréquence. Cependant, lorsque le mélange est réverbérant, l'estimation du système de mélange reste un enjeux majeur. D'autant que, même lorsque celui-ci est connu, l'estimation des sources reste un problème inverse mal posé. Les approches basées sur la parcimonie permettent ici d'obtenir des résultats de références en terme de mesures de performances objectives, tels que les rapports signal à distortion, ou signal à interférence.