Modélisation de la mortalité par cause de décès / Samuel Piveteau ; sous la direction de Christian Yann Robert et de Julien Trufin

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Langue / Language : anglais / English

Catalogue Worldcat

Mortalité -- Modèles mathématiques

Séries chronologiques

Décès -- Causes

Processus stochastiques

Robert, Christian Yann (1975-....) (Directeur de thèse / thesis advisor)

Trufin, Julien (19..-....) (Directeur de thèse / thesis advisor)

Planchet, Frédéric (19..-....) (Président du jury de soutenance / praeses)

Cairns, Andrew J. G. (Rapporteur de la thèse / thesis reporter)

Debón Aucejo, Ana María (19..-....) (Rapporteur de la thèse / thesis reporter)

Arnold, Séverine (19..-....) (Membre du jury / opponent)

Kallestrup-Lamb, Malene (19..-....) (Membre du jury / opponent)

Université de Lyon (2015-....) (Organisme de soutenance / degree-grantor)

École doctorale Sciences économiques et gestion (Lyon) (Ecole doctorale associée à la thèse / doctoral school)

Université Claude Bernard (Lyon) (Autre partenaire associé à la thèse / thesis associated third party)

Laboratoire de Sciences Actuarielle et Financière (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Cette thèse traite de la modélisation de la mortalité par cause de décès. Nous proposons d'aborder ce sujet sous trois angles : l'extrapolation de la mortalité par cause aux âges avancés, le regroupement des causes de décès et la prévision de la mortalité par cause. La première partie traite de l'extrapolation de la mortalité par cause aux âges avancés, qui est un sujet important en raison de l'incertitude des données aux âges avancés. L'objectif est d'extrapoler les forces de mortalité par cause aux âges avancés tout en maintenant la cohérence avec les méthodes habituelles d'extrapolation toutes causes confondues. Nous proposons une méthode top-down que nous adaptons à la mortalité par cause distribuée comme une variable de Poisson. La vraisemblance du modèle est divisée en deux parties, représentant respectivement la mortalité toutes causes confondues et la contribution des causes de décès. L'extrapolation de la mortalité aux âges élevés est obtenue en deux étapes. La première étape consiste à extrapoler la mortalité toutes causes aux âges avancés en utilisant les techniques standards de fermeture des tables de mortalité. La deuxième partie de l'algorithme consiste à extrapoler les contributions des causes de décès à la mortalité globale en utilisant une approche multinomiale P-splines. En recombinant les extrapolations des forces de mortalité aux âges élevés et des contributions des causes à la mortalité globale, nous obtenons l’extrapolation de la mortalité par cause. Dans la deuxième partie, nous proposons un algorithme pour diviser une base de mortalité en plusieurs groupes de telle sorte que l'ajustement obtenu en utilisant un modèle de Lee-Carter sur chaque groupe soit optimal. Le cadre est le suivant : nous disposons de séries temporelles de forces de mortalité calculées pour un ensemble de caractéristiques tels l'âge, la cause de décès ou le pays. Afin d'obtenir un meilleur ajustement et une estimation plus précise de la dynamique de l'ensemble des séries, il peut être utile de diviser la base de données en plusieurs groupes, sur chacun desquels un modèle de Lee-Carter est calibré. Nous proposons un algorithme dérivé des K-centroïdes et adapté au modèle LC que nous appelons le K-LC. A partir d'un algorithme apparemment complexe, nous montrons que la méthode est équivalente à un algorithme de K-centroïdes pour une fonction de distance spécifique. Deux applications sont proposées pour illustrer l'algorithme. La première traite de la division par sexe dans la prévision de la mortalité et la seconde aborde la question du regroupement des séries de mortalité par cause de décès. La troisième partie traite de la projection des taux bruts de mortalité par cause. Nous avons proposé un modèle pour traiter trois problèmes fondamentaux qui se posent lors de la projection de la mortalité par cause : les changements de tendances, le problème de la dépendance temporelle des causes de décès et la présence de biais dans les prévisions de mortalité. Nous introduisons un modèle espace-état de Poisson permettant de contourner ces problèmes au moyen d’une dynamique particulière. Cette dynamique nous permet de saisir la structure de dépendance temporelle entre les variations des causes de décès et d'inclure le potentiel de changement de tendance. La calibration du modèle est réalisée par l'algorithme Espérance-Maximisation. Nous adaptons cette méthode au modèle de Poisson de la mortalité, et montrons que pour certains paramètres, l'estimation peut être obtenue par formule fermée. Une application à la population féminine américaine entre 1979 et 2012 est proposée. Nous détaillons les structures de dépendance obtenues et mesurons leur impact sur la dépendance entre les causes de décès à l'aide de simulations. Nous faisons ensuite des prédictions sur les années 2012 à 2017, que nous comparons à celles d'un modèle LC standard appliqué à chaque cause séparément.

Résumé / Abstract : This thesis deals with the modelling of mortality by cause of death. We propose to tackle this topic from three angles: cause-specific mortality extrapolation at advanced ages, causes of death clustering and mortality forecasting by cause of death. The first part deals with the extrapolation of cause-specific mortality to older ages, which is an important topic because of the uncertainty in the data at older ages. The purpose is to extrapolate the cause-specific forces of mortality at older ages while maintaining consistency with the usual all-cause extrapolation methods. To do so, we propose a top-down that we adapt to cause-specific mortality distributed as a Poisson variable. The likelihood of the cause-specific mortality model is split into two parts, representing respectively all-cause mortality and the contribution of the causes of death. The extrapolation of mortality at older ages is obtained in two steps. The first step consists in extrapolating the all-cause mortality at older ages using standard life table closure techniques. The second part of the algorithm consists in extrapolating the causes of death contributions to overall mortality using multinomial P-splines approach. By recombining extrapolations of the forces of mortality at older ages and of the contributions of causes to overall mortality, we obtain extrapolations of cause-specific mortalities. In the second part of this thesis, we propose an algorithm to build groups among a mortality database such that the fitting obtained using a Lee-Carter model on each group is optimal. The framework is as follows: we have at our disposal time series of forces of mortality computed for a finite set of characteristics, for example age, cause of death or country, and we wish to fit them with a Lee-Carter model. Because of the dynamics of some groups of characteristics, it may be useful to divide the database into several groups, on each of which a Lee-Carter model is calibrated, in order to obtain a better fit and a more accurate estimation of the dynamics of the whole series. We propose an algorithm derived from the K-centroids and adapted to the LC model which we call the K-LC. Starting from a complex looking algorithm, we show that, with a modification of the usual constraints on the parameters of the model, the method is equivalent to a K-centroids algorithm with a specific distance function. Two applications are proposed to illustrate the algorithm. The first one deals with the division by sex in mortality forecasting and the second one tackles the issue of mortality clustering by cause of death. The third part deals with the projection of crude cause-specific mortality rates. We have proposed a model to deal with three fundamental problems arising in projecting cause-specific mortality: changes in trends, the problem of time dependence of causes of death, and the presence of bias in mortality forecasts. We introduce a Poisson State-Space model allowing to override these issues by defining a particular dynamic. This dynamic allows us to catch the time dependence structure between cause of death variations and include trend change potential. The calibration of the model is achieved through the Expectation-Maximization algorithm. We adapt this method to the mortality Poisson model, and show that for some parameters, the estimation may be straightforward. An application to the US female population between 1979 and 2012 is then proposed. We detail the obtained dependence structures and measure their impact on the dependence between causes of death using simulations. We then make predictions over the years 2012 to 2017, which we compare with those from a standard LC model applied on each cause separately.