Hallo allemaal,
Zoals beloofd heb ik de relevante delen van "The Analysis of Biological Data" gescand en op de server gezet, onder "Onderwijsmateriaal
> Werkgroepen (Extra & Logistiek) > WG19".
Ik heb ook nog eens goed nagelezen wat dat "The Analysis of Biological Data" nu zegt over pseudoreplicatie (opgenomen aan het
einde van de scan), en dat heb ik voor mezelf en andere geïnteresseerden hieronder wat verder uitgewerkt.
Daarnaast ga ik proberen mijn bespreking van het infarct-voorbeeld zo goed mogelijk te laten aansluiten op het boek. Ik zal dat
vanavond dan ook op de server zetten, voor wie dat leuk vindt.
Groeten,
Elske.
Over pseudoreplicatie: Volgens mij komt het er op neer dat je altijd te maken hebt met pseudoreplicatie als je het aantal onafhankelijke
metingen wat je hebt overschat doordat je hetzelfde meerdere malen meet.
Wat dat betreft maakt het dus niet uit of opeenvolgende metingen elkaar kunnen beïnvloeden of niet - zelfs als dat volkomen onmogelijk
is, dan is het nog steeds pseudoreplicatie omdat je de eigenlijke steekproefgrootte overschat. En omgekeerd, ook al kunnen opeenvolgende metingen elkaar wel beïnvloeden, als je die in je analyse maar beschouwt als één meting, dan is het volgens mij volgens
deze definitie niet per sé pseudoreplicatie.
Dus, bij de t-shirts: Als je elke vrouw in totaal 6 gelijkende-MHC-shirts laat beoordelen en 6 afwijkende-MHC-shirts, dan maak
je je schuldig aan pseudoreplicatie als je dat beschouwt als 12 metingen, maar niet als je per t-shirt type middelt en het beschouwt als 2 metingen.
Maar… dan heb je natuurlijk wel andere problemen, zoals bijvoorbeeld de mogelijke effecten van reuk-volgorde die staan beschreven
in onze uitwerking (als je per vrouw eerst de 6 gelijkende-MHC-shirts doet en dan de 6-afwijkende-MHC-shirts, dan ruiken alle afwijkende-MHC-shirts misschien minder lekker omdat je neus inmiddels moe is, niet omdat ze MHC-afwijkend zijn).
Dat is volgens mij volgens het boek niet echt een pseudoreplicatie probleem, maar eerder een voorbeeld van een confounding variable
(de variabele “volgorde” vertroebelt de relatie tussen MHC-type en aantrekkelijkheid) of van een experimental artifact (je vindt het effect van MHC-type alleen als bijeffect van je eigen experimentele opzet) – welke het precies is, is me niet duidelijk.
Hoe dan ook, als je hierbij een voorbeeld van pseudoreplicatie wilt geven wat wél heel mooi aansluit op het boek, dan kun je
het hebben over het aantal verschillende t-shirts:
Stel, je hebt twee MHC-types, A en B, en je laat veertig type A vrouwen eerst hetzelfde type A t-shirt ruiken, en dan hetzelfde
type B t-shirt, dan is je sample-size per “MHC-gelijkenis” eigenlijk maar één, en is de rest pseudoreplicatie.
Omdat alle vrouwen telkens hetzelfde t-shirt ruiken, zijn de metingen niet onafhankelijk; misschien ruikt de man achter t-shirt A gewoon lekkerder dan de man achter t-shirt B, om redenen die niks te maken hebben met hun
al dan niet gelijkende MHC-complexen.
Overigens: Als iemand dit naleest en denkt dat het niet klopt of er anderszins nog verder over wil brainstormen, dan hoor ik
dat graag!