www.uhasselt.be
DSpace

Document Server@UHasselt >
Research >
Research publications >

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/20735

Title: Statistical Models for Incomplete Longitudinal Data
Authors: Michiels, Bart
Advisors: Molenberghs, Geert
Issue Date: 1999
Abstract: Since in many longitudinal studies missing data appear, it is necessary to explore methods to take this missingness into account. Most theory established for this problem is based on selection models, where a marginal measurement model is combined with the missing data model, conditional on the measurements. Selection models fit naturally into the different missing data mechanisms defined by Little and Rubin (1987). They divide the assumptions into basically three groups: MCAR, where independence between the measurements and the missingness process is assumed, MAR, where missingness can depend on the observed data, and MNAR, where missingness can also depend on the unobserved measurements. A special case of MNAR is the protective estimator, where one assumes missingness to depend on the unobserved, but not on the observed measurements. Brown (1990) defined the protective estimator for normal data. In Chapter 4, we translated the protective estimator to a version for categorical data, adding methods to estimate the precision. In some cases, this protective assumption can be much more realistic than MAR, for example when the measurements are taken relatively far apart in time, and there is sufficient washout. In contrast to selection models, another factorization of the full density is possible, leading to pattern-mixture models. Here, for all the different missing data patterns, different models need to be fitted. It is clear that, if one assumes similar models for different patterns, not all these models are identifiable, due to the missingness. Therefore, identifying restrictions are needed (Little 1993, 1995). These restrictions are the counterpart of the modelling assumptions used in selection modelling. But if one uses pattern-mixture models, it is clear what information is missing, and what assumptions about the missingness process are made. We established the ACMV restrictions (Chapter 5), a counterpart for the MAR assumption in case of monotone dropout. Due to this assumption, we can, in the case of dropout, make the same subdivision for pattern-mixture models as for selection models. In case of non-monotone missingness, the ACMV restrictions are not equivalent to MAR, and further research is therefore needed to formulate plausible restrictions. Now that the same assumption can be used in a selection model and a patternmixture model, different methods combining both factorizations can be explored. First, we created a pseudo-likelihood, combining the interesting parts of both models: the pattern-specific measurement models on the one hand, and the dropout model, conditioned on the outcomes on the other (Chapter 7). This method has the advantage that interesting models can be chosen for both parts (with mild conditions on the compatibility), leading to results that are easy to interpret, or that are of direct interest to the investigator. A second reason for combining selection models and pattern-mixture models is sensitivity analysis. If a selection model analysis and a pattern-mixture model analysis lead to similar conclusions, more confidence can be given to these results. We have carried out such a sensitivity analysis for categorical data assuming a Dale model (Chapter 6) and for continuous data assuming mixed models (Chapter 8). Pattern-mixture models are in fact much more honest than selection models, because one can easily see which information is missing. Furthermore can it be of interest to have the measurement model parameters for different missing data patterns, values that demand quite some calculation after a selection model analysis. Still most analyses containing missing data fix on selection models. Therefore, pattern-mixture models should be included more in a comprehensive study, leading to a more thorough sensitivity analysis. Finally, pattern-mixture models deserve to be studied as sensitivity tools in their own right.
In veel studies komt men het probleem tegen dat sommige waarden ontbreken. Vooral in longitudinale studies, waar gegevens op regelmatige tijdstippen opgemeten worden, moet met dit probleem rekening gehouden worden. Een speciaal geval van ontbrekende waarden is dropout, waar men per subject in de studie een aantal opeenvolgende metingen heeft, waarna verdere metingen ontbreken. Little en Rubin (1987) gaven een opsplitsing in de veronderstellingen omtrent het ontbreken van waarden. Ze gingen hiervoor uit van een selectiemodel, waar de gezamelijke dichtheidsfunctie van zowel het meetproces als het proces dat aangeeft welke waarden ontbreken, wordt opgesplitst in het product van het meetproces met het proces van de ontbrekende waarden, geconditioneerd op de meetresultaten. Little en Rubin spitsten de assumpties op in drie groepen: MCAR: Het ontbreken van gegevens heeft niets met de metingen te maken. MAR: Het ontbreken van gegevens kan verklaard worden door de metingen die men geobserveerd heeft. MNAR: Ook de niet geobserveerde metingen zijn nodig om het ontbreken van gegevens te verklaren. Brown (1990) introduceerde de protective estimator, een speciaal geval van MNAR, waarbij het ontbreken van een gegeven op een bepaald tijdstip enkel afhangt van dit ontbrekende gegeven zelf. Deze aanname kan bij voorbeeld heel logisch zijn als de tijd tussen verschillende metingen heel groot is. Brown heeft de protective estimator enkel gedefinieerd voor Normaal verdeelde gegevens. In Hoofdstuk 4 breiden we deze schatter verder uit naar categorische gegevens. Het schatten van de kansen vraagt het oplossen van een stelsel, maar een vereenvoudigde methode is mogelijk, waarbij een aantal kleine stelsels moet opgelost worden. Een extra voordeel van deze methode is dat een contradictie in de voorwaarden tot uiting komt als negatieve kansen. Er worden ook drie methoden behandeld om de precisie van de schattingen te bepalen. De assumpties van Little en Rubin zijn gebaseerd op selectiemodellen. Een andere factorisatie van de volledige dichtheid geeft aanleiding tot pattern-mixture modellen. Hier bekijkt men voor elk patroon van ontbrekende waarden een afzonderlijk meetmodel, en wordt het model van de ontbrekende waarden apart behandeld. Aangezien er gegevens ontbreken, is het duidelijk dat niet voor alle patronen het meetmodel identificeerbaar zal zijn. Daarom heeft men restricties nodig. Little (1993, 1995) geeft een overzicht van een aantal restricties. De MCAR-assumptie, die onafhankelijkheid veronderstelt tussen het meetproces en het proces van de ontbrekende waarden, is natuurlijk hetzelfde in een selectiemodel en een pattern-mixture model. Maar de andere assumpties kunnen niet eenvoudig vertaald worden naar restricties voor pattern-mixture modellen. In Hoofdstuk 5 wordt de ACMV-restrictie gedefinieerd. Volgens deze restrictie moet men, om een dichtheid op een bepaald tijdstip, gegeven de vorige metingen, te berekenen voor een patroon waar niet alle informatie beschikbaar is, deze informatie gaan lenen bij alle patronen waar deze dichtheid wel kan berekend worden. In het geval van dropout hebben we in dit hoofdstuk bewezen dat ACMV en MAR equivalent zijn. Dit geeft de mogelijkheid om voor pattern-mixture modellen eenzelfde soort opsplitsing te maken als voor selectiemodellen. Daardoor kan men een selectiemodel en een pattern-mixture model fitten aan data, waarbij voor beide modellen dezelfde veronderstelling gemaakt wordt over het ontbreken van metingen. Zo kan men een sensitiviteitsanalyse uitvoeren. Als de twee modellen vergelijkbare resultaten geven, bij voorbeeld wat betreft het effect van de behandeling, kan men veel meer vertrouwen hebben in deze resultaten. Een ander voordeel is dat de resultaten van het selectiemodel soms van klinisch belang zijn, maar soms is men juist ge¨ınteresseerd in de resultaten van het pattern-mixture model: is het effect van de behandeling verschillend voor pati¨enten die op een ander moment de studie ver laten? Door de equivalentie van beide modellen, kan d`at model gekozen worden dat het beste aansluit bij de klinische vraag. In Hoofdstuk 6 hebben we zo het therapeutisch effect en de nevenwerkingen bestudeerd van het toedienen van fluvoxamine aan psychiatrische pati¨enten. Gebruik makend van een bivariaat Dale model hebben we de kans op nevenwerkingen en de kans op therapeutisch effect geschat, met als covariaten de leeftijd, het geslacht en de psychiatrische voorgeschiedenis van de pati¨enten. Beide modellen gaven vergelijkbare resultaten: voor de kans op nevenwerkingen was er stijging met de leeftijd, en deze kans was hoger voor pati¨enten die uitvielen na de eerste meting, dan voor pati¨enten die ook op de tweede meting aanwezig waren. Er was ook een sterke associatie aanwezig tussen de verschillende metingen. De psychiatrische voorgeschiedenis had helemaal geen invloed, en het geslacht had een klein effect op de kans op nevenwerkingen. Voor het therapeutisch effect was er helemaal geen invloed van leeftijd, geslacht, of psychiatrische voorgeschiedenis. Ook hier was er wel een sterke associatie aanwezig. Al deze conclusies kunnen zowel uit het selectiemodel als uit het pattern-mixture model getrokken worden. Een andere dataset, waar pati¨enten met borstkanker behandeld worden met Vorozole of met Megestrol Acetate, wordt behandeld in Hoofdstuk 8. Voor deze pati¨enten werd gekeken naar de FLIC-score, een maat voor de levenskwaliteit tijdens de behandeling. Gebruik makend van mixed models, gaven het selectiemodel en het pattern-mixture model weer vergelijkbare resultaten: er is geen invloed van de behandeling op de FLIC-score. Een combinatie van selectiemodellen en pattern-mixture modellen is mogelijk door gebruik te maken van de theorie van de pseudo-likelihood (zie Hoofdstuk 7). Voor de interessante stukken van zowel het selectiemodel als het pattern-mixture model worden aparte, relevante modellen gedefinieerd, gebruik makend van dezelfde assumptie voor het ontbreken van gegevens. Natuurlijk zijn er milde voorwaarden nodig om de compatibiliteit te verzekeren. Die modellen worden dan gecombineerd in een pseudo-likelihood, dewelke dan gefit wordt. In de meeste studies wordt gebruik gemaakt van selectiemodellen. Dit wordt mee veroorzaakt door de handige opsplitsing van de veronderstellingen omtrent het ontbreken van gegevens. Maar vermits dezelfde opsplitsing nu ook mogelijk is voor pattern-mixture modellen, kan zo’n model ook gemakkelijk gebruikt worden. Dit geeft de mogelijkheid om een model te gebruiken dat beter aansluit bij de klinische vraag, of om meer vertrouwen te hebben in de gevonden resultaten, als zowel het selectiemodel als het pattern-mixture model tot hetzelfde besluit leiden. Toch is er nog meer onderzoek nodig naar pattern-mixture modellen, bij voorbeeld in het geval van niet-monotone ontbrekende waarden, of om de sensitiviteitsanalyse verder uit te werken.
URI: http://hdl.handle.net/1942/20735
Category: T1
Type: Theses and Dissertations
Appears in Collections: PhD theses
Research publications

Files in This Item:

Description SizeFormat
N/A706.43 kBAdobe PDF

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.