Test de test

1 februari 2009

Door foute diagnoses lopen talloze patiënten in ontwikkelingslanden een behandeling mis. Anderen krijgen juist ten onrechte een soms dure en zware medicijnkuur. Oorzaak: de betrouwbaarheid van diagnostische tests laat te wensen over. De afdeling Klinische Epidemiologie, Biostatistiek en Bioinformatica van het AMC werkt er al jaren aan om de kwaliteit van de evaluatie van dergelijke tests te verbeteren. Dit doet zij via wetenschappelijke publicaties en met het opstellen van richtlijnen.

Twee miljoen dollar voor het opzetten van een database over tuberculosebehandelingen, 59,1 miljoen dollar voor onderzoek naar de behandeling en preventie van malaria, aids en tuberculose, 168,7 miljoen dollar voor het ontwikkelen van een malariavaccin. Zomaar een greep uit de subsidies die de Bill en Melinda Gates Foundation in 2008 toekende. Miljoenen trekken de weldoeners uit voor de bestrijding van infectieziekten in derdewereldlanden. Prachtig, daar is geen twijfel over. Maar wat heb je aan een behandeling als er geen goede test is om te beoordelen of iemand echt ziek is en of de patiënt na behandeling ook genezen is? Aan die diagnostische tests schort het nog wel eens, meent Patrick Bossuyt, hoogleraar Klinische Epidemiologie: ‘Er komen nieuwe tests op de markt zonder dat er uitgebreid onderzoek naar is gedaan. En als dat wel is gebeurd, is het vaak slecht uitgevoerd. De kennis van de evaluatie van diagnostische tests loopt achter bij het onderzoek naar behandelingen en geneesmiddelen.’ Al ruim vijftien jaar richt de hoogleraar zich met de medewerkers van de afdeling Klinische Epidemiologie, Biostatistiek en Bioinformatica op die evaluaties.
Bossuyt: ‘Stel: de minister van gezondheidszorg van Vietnam wil een malariatest aanschaffen. ‘Waar moet hij dan op letten? Als hij een test kiest die beproefd is in een Londens ziekenhuis waar deze prima malariapatiënten detecteerde, geeft dat geen garantie dat de test het ook doet in Vietnam. Misschien is de aard van de ziekte in het Oosten anders. Of komen daar veel andere ziektes voor die de uitslagen van die test beïnvloeden. Of er ontstaan fouten in de uitslag door de condities waaronder bloed wordt afgenomen zoals de omgevingstemperatuur, de luchtvochtigheid of de duur van het transport van afname tot analyse. Allemaal factoren die kunnen maken dat een test die het in Londen goed deed in Vietnam veel foute uitslagen geeft.’

geen wetgeving
Het is niet alleen lastig voor een minister in Vietnam. Ook fabrikanten zelf weten vaak niet hoe ze een test moeten evalueren. Het zijn vaak kleine bedrijven of laboratoria die diagnostische tests op de markt brengen. Anders dan bij grote farmaceutische bedrijven, die de werkzaamheid van nieuw ontwikkelde medicijnen uitgebreid testen, is de expertise op het gebied van evaluatieonderzoek daar vaak beperkt. De noodzaak tot onderzoek ontbreekt ook, omdat er nauwelijks wetgeving en controlerende instanties op dit gebied zijn (zoals het College ter Beoordeling van Geneesmiddelen in Nederland wel waakt over de introductie van nieuwe geneesmiddelen). Bossuyt: ‘Als je een test voor de ziekte van Pfeiffer op de markt brengt, is hooguit een CE-keurmerk nodig. Er hoeft geen uitgebreid onderzoek te zijn waaruit blijkt dat de test detecteert wat je beweert dat hij detecteert. In Europa zijn er alleen richtlijnen voor de diagnose van ziekten als HIV en hepatitis C; aandoeningen die via bloedbankproducten verspreid kunnen worden.’
De valkuilen bij het evalueren van diagnostische tests zijn divers. ‘Vaak denkt men dat je de werkzaamheid van een test kunt aantonen door de uitslag van flink zieke personen te vergelijken met die van gezonde vrijwilligers. Als de test werkt, geeft hij bij de zieken een positief resultaat en bij de gezonden niet. In werkelijkheid gebruik je de test in een veel diffusere groep, namelijk bij patiënten die iets minder ziek zijn dan in de testsituatie en bij patiënten die met vergelijkbare klachten maar een andere aandoening bij de arts komen. De evaluatie geeft dan een veel te rooskleurig beeld. Dat krijg je ook als er ter vergelijking van een test gebruik wordt gemaakt van verschillende referentiestandaarden. Dat gebeurt heel veel met dit soort evaluatie-onderzoek. Sterker nog, vaak wordt helemaal niet beschreven waarmee de nieuwe test is vergeleken. Ook wordt de nauwkeurigheid van een test vaak overschat omdat die in een te kleine groep wordt onderzocht.’

checklist
In 2003 lanceerde Patrick Bossuyt met collega’s uit de Verenigde Staten, Canada en Australië het STARD Initiative (Standards for Reporting of Diagnostic Accuracy), dat gelijktijdig werd gepubliceerd in zeven belangrijke tijdschriften, waaronder Annals of Internal Medicine, British Medical Journal, Lancet, Clinical Chemistry, en Radiology. STARD omvat een checklist met daarop 25 onderwerpen die elk goed onderzoek moet rapporteren. Zo moet de onderzoekspopulatie tot in detail beschreven zijn – waar komen ze vandaan, gaat het om mannen of vrouwen, welke symptomen hebben ze. Daarnaast moet de wijze van dataverzameling duidelijk zijn en moeten de technische gegevens over de test vermeld worden.
De STARD-regels zijn inmiddels omarmd door meer dan tweehonderd medisch-wetenschappelijke vakbladen. Bossuyt: ‘Veel reviewers geven aan dat ze een stuk niet kunnen beoordelen als het niet voldoet aan de STARD. En het tijdschrift Clinical Chemistry stelt het zelfs verplicht om per onderwerp aan te geven op welke bladzijde het in het manuscript is terug te vinden.’
Ook het topblad Nature Reviews Microbiology heeft aandacht voor het onderwerp. Sinds 2006 publiceert het tijdschrift regelmatig bijlagen die volledig gewijd zijn aan het evalueren van diagnostische tests voor infectieziekten. De reeks wordt verzorgd door het Diagnostic Evaluating Expert Panel (DEEP) waar Bossuyt deel van uitmaakt. DEEP is een commissie van het TDR, een samenwerkingsverband op het gebied van tropische ziekten van de World Health Organisation (WHO), Unicef, de UNDP en de Wereldbank. De bijlagen bij Nature Reviews bevatten steeds een algemene introductie en een uitleg van de basisprincipes van het evalueren. Vervolgens staat een bepaalde diagnose centraal, zoals voor seksueel overdraagbare aandoeningen, leishmaniasis, en het testen van CD4-cellen bij HIV-patiënten – de drie meest recente onderwerpen. De experts geven daarnaast adviezen aan de FDA en ze worden regelmatig geconsulteerd door overheden.
De TDR richt zich op ontwikkelingslanden. Vooral daar leiden gebrekkige diagnostische tests tot falen van de gezondheidszorg. Bossuyt: ‘Maar ook hier in Nederland heeft het effect. Via internet en bij de drogist is elke denkbare test te koop. Onderzoek van de Universiteit van Maastricht liet onlangs zien dat je jezelf kunt testen op meer dan honderd verschillende aandoeningen. Deels integere producten die helaas slecht geëvalueerd zijn, maar er is ook regelrechte piraterij: in landen als China en India komen veel lege tests op de markt. Of het onzinproducten zijn is niet te beoordelen, maar of het gezondheidswinst oplevert valt te betwijfelen. Het leidt er in elk geval toe dat gezonde maar bezorgde Nederlanders, de zogenoemde worried well, een onnodig beroep doen op de gezondheidszorg.’

Connie Engelberts

Deel dit |