Séminaire de Probabilités et Statistique

Le lundi 07 avril 2008 à 10:30 - Cirad Campus Lavalette - Amphi Jacques Alliot (bât 4)

Thierry Dhorne
"Mesures de redondance en analyse Multivariée : formalisation et application à la sélection de Variables"

Il existe de nombreux problèmes statistiques liés à la redondance entre des données multivariées. Les cas limites sont la colinéarité totale qui est à l'origine de nombreux développements statistiques, par exemple dans le domaine de la sélection de modèles ou d'estimation shrinkee. A l'autre extrémité, la redondance peut-être intéressante (ou au minimum exploitée) dans la compression de données ou la sélection de variables. Il y a par conséquent une nécessité de définir des mesures de redondance compatibles avec les objectifs recherchés. Quelques propositions ont été récemment faites pour combler certaines lacunes en ce domaine ([Shimansky 00] [Kovács et al. 05]). Dans le but d'apprécier cette redondance, nous proposons une approche axiomatique du problème basée sur quelques propriétes assez naturelles. Cette axiomatique se révèle pouvoir être exprimée en terme d'algèbre lineaire ou plus précisément métrique. Nous démontrons l'existence de mesures compatibles avec l'axiomatique et montrons qu'elles ne peuvent être réduites à une simple fonction du spectre de la matrice de corrélation à l'instar de ce qui est fait pour des mesures plus classiques auxquelles nous confrontons notre approche. Nous présentons en détail le cas tridimensionnel qui se révèle être intéressant en lui-même et nous étudions par ailleurs un exemple réel sous l'angle conjoint des mesures proposées et de la sélection de variables.



Voir la liste des séminaires