Méthodes de discrimination : comparaison et correction des biais de présélection des échantillons / Céline Gelperowic ; sous la direction de Jacqueline Pradel

Date :

Format : 1 vol. (157 p.)

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Échantillonnage (statistique)

Analyse discriminante

Pradel, Jacqueline (19..-.... ; auteure en économie mathématique) (Directeur de thèse / thesis advisor)

Université Paris Dauphine-PSL (1968-....) (Organisme de soutenance / degree-grantor)

Relation : Méthodes de discrimination : comparaison et correction des biais de présélection des échantillons / Céline Gelperowic ; sous la direction de Jacqueline Pradel / , 2000

Résumé / Abstract : Cette thèse porte sur la comparaison de trois méthodes de discrimination, et plus particulierement sur les corrections à apporter à ces méthodes quand les échantillons utilisés ont été présélectionnés. On s'intéresse à trois méthodes (l'analyse discriminante - linéaire ou quadratique-, la régression-logistique, probit- et le partitionnement récursif -ou segmentation par arbre binaire) dans le cas où celles-ci sont employées pour faire de la prévision. On compare tout d'abord ces méthodes (résumé et complément). L'emploi des courbes de sélection comme critère de comparaison, fréquent pour les méthodes paramétriques, est étendu à la règle obtenue par partitionnement récursif. Ce critère trouve d'autres applications pour cette règle (réduction du grand arbre notamment). Lorsqu'elles sont construites à partir d'échantillons présélectionnés, les règles sont toutes moins performantes. On appelle biais de sélection l'effet de la présélection de l'échantillon sur la règle de discrimination. Les méthodes classiques de traitement des données manquantes sont inefficaces pour corriger ce biais. Pour la règle obtenue par analyse discriminante (linéaire), on propose une modélisation (modèle bivarié fondé sur deux analyses discriminantes corrélées) permettant de prendre en compte et de corriger le biais de sélection. Pour ce modèle, le biais apparait comme une erreur de spécification ; de plus, la dualité qui existe entre la régression et l'analyse discriminante dans le cas d'échantillons complets se prolonge pour les modèles bivariés employés pour faire la correction. Pour la règle obtenue par partitionnement récursif, l'aspect non-paramétrique rend plus difficile la prise en compte de la présélection. On propose alors une méthode semi-paramétrique, qui découle de celle utilisée en régression, et qui permet de corriger le biais au niveau des noeuds terminaux de l'arbre.