Séminaire de Probabilités et Statistique

Le lundi 07 novembre 2011 à 15:00 - UM2 - Bât 09 - Salle 331 (3ème étage)

Yannick Baraud
Sélection d'estimateur en régression Gaussienne

Travail en collaboration avec C. Giraud et S. Huet
Soit Y un vecteur gaussien de moyenne f dont les coordonnées sont indépendantes et de même variance (supposée inconnue) et F une famille arbitraire d'estimateurs de f obtenus à partir de Y. Le cardinal de F peut être arbitrairement grand et la manière dont les différents estimateurs dépendent de Y éventuellement inconnue.
Nous proposons une règle de sélection, ne dépendant que de Y, en vue de sélectionner l'estimateur de la famille F ayant le plus petit risque euclidien.
Nous établissons des bornes non-asymptotiques sur le risque de l'estimateur sélectionné et montrons comment ces bornes se comparent à des inégalités de type oracle dans de nombreux cas d'intérêt. Par exemple, nous montrons comment la procédure peut être utilisée en regression pour sélectionner un noyau et une fenêtre ou en selection de variables pour choisir une procédure parmi toutes celles que l'on peut rencontrer dans la littérature (Lasso, Elastic Net, Random Forest,...). Enfin, au travers d'une étude par simulation, nous nous comparerons à la cross-validation qui est communément utilisée en pratique.



Voir la liste des séminaires