Elementary functions : towards automatically generated, efficient, and vectorizable implementations / Hugues de Lassus Saint-Genies ; sous la direction de David Defour et de Guillaume Revy

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Catalogue Worldcat

Générateurs de code source -- logiciels

Fonctions (mathématiques)

Calcul intensif (informatique)

Analyse numérique

Loi multinomiale

Classification Dewey : 004

Defour, David (Directeur de thèse / thesis advisor)

Revy, Guillaume (1982-....) (Directeur de thèse / thesis advisor)

Dupont de Dinechin, Florent (1970-....) (Rapporteur de la thèse / thesis reporter)

Jézéquel, Fabienne (Rapporteur de la thèse / thesis reporter)

Daumas, Marc (Membre du jury / opponent)

Lacassagne, Lionel (19..-....) (Membre du jury / opponent)

Ménard, Daniel (19..-.... ; professeur) (Membre du jury / opponent)

Petit, Éric (1981-.... ; informaticien) (Membre du jury / opponent)

Université de Perpignan (1979-....) (Organisme de soutenance / degree-grantor)

École doctorale Énergie environnement (Perpignan) (Ecole doctorale associée à la thèse / doctoral school)

Résumé / Abstract : Les fonctions élémentaires sont utilisées dans de nombreux codes de calcul haute performance. Bien que les bibliothèques mathématiques (libm) auxquelles font appel ces codes proposent en général plusieurs variétés d'une même fonction, celles-ci sont figées lors de leur implémentation. Cette caractéristique représente un frein à la performance des programmes qui les utilisent car elles sont conçues pour être polyvalentes au détriment d'optimisations spécifiques. De plus, la duplication de modèles partagés rend la maintenance de ces libms plus difficile et sujette à l'introduction de bugs. Un défi actuel est de proposer des "méta-outils" visant la génération automatique de code performant pour l'évaluation des fonctions élémentaires. Ces outils doivent permettre la réutilisation d'algorithmes efficaces et génériques pour différentes variétés de fonctions ou architectures matérielles. Il devient alors possible de générer des libms optimisées pour des besoins très spécifiques avec du code générateur factorisé, qui facilite sa maintenance. Dans un premier temps, nous proposons un algorithme original permettant de générer des tables sans erreur pour les fonctions trigonométriques et hyperboliques. Puis nous étudions les performances de schémas d'évaluation polynomiale vectorisés, premier pas vers la génération de fonctions vectorisées efficaces. Enfin, nous proposons une méta-implémentation d'un logarithme vectorisé, factorisant la génération de code pour différents formats et architectures. Ces contributions sont compétitives comparées à d'autres solutions, justifiant le développement de tels méta-codes.

Résumé / Abstract : Elementary mathematical functions are pervasive in many high performance computing programs. However, although the mathematical libraries (libms), on which these programs rely, generally provide several flavors of the same function, these are fixed at implementation time. Hence this monolithic characteristic of libms is an obstacle for the performance of programs relying on them, because they are designed to be versatile at the expense of specific optimizations. Moreover, the duplication of shared patterns in the source code makes maintaining such code bases more error prone and difficult. A current challenge is to propose "meta-tools" targeting automated high performance code generation for the evaluation of elementary functions. These tools must allow reuse of generic and efficient algorithms for different flavours of functions or hardware architectures. Then, it becomes possible to generate optimized tailored libms with factorized generative code, which eases its maintenance. First, we propose an novel algorithm that allows to generate lookup tables that remove rounding errors for trigonometric and hyperbolic functions. The, we study the performance of vectorized polynomial evaluation schemes, a first step towards the generation of efficient vectorized elementary functions. Finally, we develop a meta-implementation of a vectorized logarithm, which factors code generation for different formats and architectures. Our contributions are shown competitive compared to free or commercial solutions, which is a strong incentive to push for developing this new paradigm.