Apprentissage statistique et données massives / [17ème Journées d'étude en statistique, JES, 2016 ; organisées par la Société française de statistique] ; Myriam Maumy-Bertrand,... Gilbert Saporta,... Christine Thomas-Agnan,...

Date : 2018

Type : Livre / Book

Langue / Language : français / French

ISBN : 978-2-7108-1182-4

EAN : 9782710811824

Statistiques

Données massives

Classification Dewey : 006.31

Maumy, Myriam (1973-....) (Auteur / author)

Saporta, Gilbert (1946-....) (Auteur / author)

Thomas-Agnan, Christine (1956-.... ; professeur de mathématiques) (Auteur / author)

Journées d'étude en statistique (17 ; 2016) (Auteur / author)

Société française de statistique (Organisateur de réunion / organizer of meeting)

Résumé / Abstract : "La numérisation du monde a pour conséquence la mise à disposition de masses de données inédites, notamment celles provenant du web. La statistique qui s'est développée autrefois dans un contexte de rareté des données fait face à de nouveaux défis. Donner du sens aux données, développer des algorithmes prédictifs sans nécessairement avoir de modèle génératif, tels sont quelques-uns des objectifs de l'apprentissage statistique. L'apport d'autres disciplines - informatique et optimisation en particulier - est essentiel compte tenu de la nécessité de traiter rapidement les volumes de données impliqués. On distingue l'apprentissage supervisé, où l'objectif est de prévoir une réponse à partir de prédicteurs, de l'apprentissage non supervisé, qui recherche des structures et des formes sans chercher à prévoir une réponse particulière. Depuis les réseaux de neurones jusqu'aux forêts aléatoires, en passant par les séparateurs à vaste marge (SVM), de nombreux algorithmes ont été développés, ne reposant que faiblement sur des hypothèses probabilistes. Dans ce contexte, la validation, la capacité de généralisation à de nouvelles données et le passage à l'échelle sont donc essentiels."