Parallel itemset mining in massively distributed environments / Saber Salah ; sous la direction de Florent Masseglia

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Exploration de données

Motifs (mathématiques)

Analyse des données

Masseglia, Florent (Directeur de thèse / thesis advisor)

Boucelma, Omar (19..-....) (Président du jury de soutenance / praeses)

Termier, Alexandre (Rapporteur de la thèse / thesis reporter)

Giacometti, Arnaud (1967-....) (Rapporteur de la thèse / thesis reporter)

Hilgert, Nadine (Membre du jury / opponent)

Akbarinia, Reza (1977-...) (Membre du jury / opponent)

Université de Montpellier (2015-....) (Organisme de soutenance / degree-grantor)

École Doctorale Information, Structures, Systèmes (Montpellier ; 2015) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 199.-....) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Le volume des données ne cesse de croître. À tel point qu'on parle aujourd'hui de "Big Data". La principale raison se trouve dans les progrès des outils informatique qui ont offert une grande flexibilité pour produire, mais aussi pour stocker des quantités toujours plus grandes. Les méthodes d'analyse de données ont toujours été confrontées à des quantités qui mettent en difficulté les capacités de traitement, ou qui les dépassent. Pour franchir les verrous technologiques associés à ces questions d'analyse, la communauté peut se tourner vers les techniques de calcul distribué. En particulier, l'extraction de motifs, qui est un des problèmes les plus abordés en fouille de données, présente encore souvent de grandes difficultés dans le contexte de la distribution massive et du parallélisme. Dans cette thèse, nous abordons deux sujets majeurs liés à l'extraction de motifs : les motifs fréquents, et les motifs informatifs (i.e., de forte entropie).

Résumé / Abstract : Le volume des données ne cesse de croître. À tel point qu'on parle aujourd'hui de "Big Data". La principale raison se trouve dans les progrès des outils informatique qui ont offert une grande flexibilité pour produire, mais aussi pour stocker des quantités toujours plus grandes.à l'extraction de motifs : les motifs fréquents, et les motifs informatifs (i.e., de forte entropie).