Wat is de kans dat een positieve uitslag correct is indien een test voor 95% accuraat is?

Stel dat 5% van de bevolking drugs gebruikt. Je gebruikt een test die 95% accuraat is. Iemand wordt willekeurig gekozen en krijgt de test. Het resultaat is positief. Wat is de kans dat deze persoon echt drugs gebruikt?

PS er wordt soms gesteld dat de kans 50% is maar is dat ook correct?

erotisi

een jaar geleden

in: Wiskunde

2.2K

2.2K keer bekeken

LeonardN

een jaar geleden

"PS er wordt soms gesteld dat de kans 50% is maar is dat ook correct?" Nee natuurlijk niet. Als dat zo is dan is de test net zo goed als een munt opgooien.
Overigens zou dan een niet-werkende test (die constant negatief geeft) nog beter zijn, aangezien minder dan 50% van de bevolking drugs gebruikt.

tinus1969

een jaar geleden

Wat bedoel je met accuraat? Sensitief of specifiek (vals positief of vals negatief)?

tinus1969

een jaar geleden

In metrologie en vergelijkbare testwetenschap zijn accuratesse, sensitiviteit, en specificiteit verschillende issues.

SingingCoyote13

een jaar geleden

@Leonard zelfs al zou een test die bv belangrijk is en maar een foutpercentage van 5% hebben dan heb je er in veel gevallen niks aan want die ene 5% (foutieve uitslag) kan het altijd zijn zonder dat je het zeker weet omdat je niet kan zien wanneer je fout of goed zit.

tinus1969

een jaar geleden

@SingingCoyote13 nouja, dan zijn er een hoop testen waar je niks aan hebt, want een fout percentage van 5% is bepaald niet ongebruikelijk.

erotisi

een jaar geleden

@LeonardN, jij bent goed in logica denk; is de volgende uitleg correct: "Stel, de algemene bevolking bestaat uit 10.000 mensen en 95% van hen (9.500) zijn niet-gebruikers en 5% van hen (500) zijn gebruikers. Van de 9.500 niet-gebruikers zal 95% (9.025) negatief testen, aangezien de test voor 95% nauwkeurig is. Dit betekent dat 5% van hen (475) positief zal testen. Van de 500 gebruikers zal 95% (475) positief testen. Er zijn dus 475 fout-positieven en 475 echt-positieven. Wanneer we een persoon in de positieve groep vinden, is de kans fifty-fifty dat hij een drugsgebruiker is."

LeonardN

een jaar geleden

ah nu snap ik je pas. mijn eerdere reactie kan je als niet verzonden beschouwen

erotisi

een jaar geleden

Ok, maar kun je ook uitleggen waarom de kans dat de positief geteste persoon echt drugs gebruikt niet gewoon 95% is?

LeonardN

een jaar geleden

Dat heb je zelf toch al gedaan?

erotisi

een jaar geleden

Ok, laten we er nu vanuit gaan dat een random gekozen persoon negatief test. Wat is dan volgens jou de kans dat deze echt negatief is. Ook 50%?

LeonardN

een jaar geleden

Nee.
De kans dat iemand die negatief getest wordt ook negatief is is heel groot. (omdat bijna iedereen sowieso al negatief zou moeten zijn) Bedenk dit.
Ik zeg dat ik een waarzegger ben. (maar ik ben eigenlijk iemand die statistiek misbruikt)
In plaats van een chemische test laat een bedrijf mij bepalen of iemand drugsgebruiker is.
Ik zeg steeds dat een werknemer geen drugsgebruiker is.
Als het bedrijf een aardige afspiegeling is van de werkelijkheid, dan zal ik ~95% correct zijn. Bijzondere is dat als je een zwangerschapstest gebruikt als drugstest in een bedrijf met enkel mannen, dat je OOK 95% accuraat bent (als 95% v.d bevolking geen druggie is en wederom het bedrijf een aardige afspiegeling is).

erotisi

een jaar geleden

Akkoord. Ik denk dat het verschil tussen die 95% en 50% erin zit wat je precies bedoelt. In de volgende proef werd dat onderscheid ook aanwezig gezien:
"Toen een lezer schreef over het willekeurig selecteren van 100 van de 400 werknemers per kwartaal voor drugstesten, vroeg hij hoe groot de kans is dat een persoon in de loop van een jaar wordt uitgekozen. U beantwoordde een andere vraag: "Als een persoon in de eerste drie kwartalen niet is geselecteerd, wat is dan de kans dat hij of zij in het vierde kwartaal wordt gekozen?" Het antwoord op de laatste vraag is inderdaad 25 procent, zoals je schreef, maar het antwoord op de eerste is ongeveer 68 procent.
https://parade.com/45916/marilynvossavant/22-sunday-column-2/
Zo kan ook hier misschien worden gezegd dat bij de test alleen dat het wel 95% kans is dat het correct is, maar met de selectie vooraf wordt dat anders (50%).

erotisi

een jaar geleden

De uitslag met bijv 20% echte gebruikers komt overigens neer op meer dan 50% nl 82,6%. Daarnaast is het wel bijzonder dat bij een test waarbij de tester niet weet hoeveel echte gebruikers er zijn hij denkt dat de uitslag voor 95% zeker is maar als een collega zou zeggen dat er maar 5 echte gebruikers zijn
hij nog maar 50% zeker zal zijn terwijl zijn test toch echt 95% accuraat is. Zou hij dan niet eerder denken dat de accuratesse van de test niet klopt ipv dat hij alleen 50% zeker is?

tinus1969

een jaar geleden

@erotisi je moet bij dit soort vragen heel goed opletten wat je precies vraagt en wat de randvoorwaarden zijn. Je noemt in vraag toelichting en reacties al snel 3-4 verschillende situaties met heel verschillende randvoorwaarden en uitkomsten.

tinus1969

een jaar geleden

Mbt ‘ Ok, laten we er nu vanuit gaan dat een random gekozen persoon negatief test. Wat is dan volgens jou de kans dat deze echt negatief is. Ook 50%?’
Dat is iig geen 50%, en het precieze antwoord hangt van de zogenaamde specificiteit vd test, en ook van de prevalentie van wat je test.

tinus1969

een jaar geleden

Je laatste reactie is een statistische warboel die niet klopt.

Thecis

een jaar geleden

@Erotisi
95% accuraat wil inderdaad zeggen dat je met 95% zekerheid kan zeggen dat je uitslag klopt. De uitslag kan zowel positief als negatief zijn. Wat je aangeeft, is de kans op een vals-positief resultaat. Je negeert echter de kans op een vals-negatief resultaat. Daarbij is de 95% zekerheid van je test niet hetzelfde als 5% van de bevolking die drugs gebruikt (en dus 95% niet). Maar door de getallen zo te kiezen, ga je wel verwarring in je hoofd creëren door de 95 en 5 correlatie te benoemen.

Thecis

een jaar geleden

"Als een persoon in de eerste drie kwartalen niet is geselecteerd, wat is dan de kans dat hij of zij in het vierde kwartaal wordt gekozen?" Bij elke ronde heb je een kans van 25% dat je gekozen wordt en 75% kans dat je niet gekozen wordt. met 3 rondes is de kans 0.75 * 0.75 * 0.75 dat iemand niet gekozen is. Dat is 42,19%. Het getal van 68% klopt dus niet.

erotisi

een jaar geleden

Telt een jaar geen vier kwartalen?

Thecis

een jaar geleden

ja, een kwartaal telt 4 kwartalen. Al een tijdje. Ik had dat stuk niet goed gelezen.
Hoe groot is de kans dat een werknemer in de loop van een jaar wordt uitgenodigd voor de test. Dat is 100% - de kans dat iemand helemaal niet wordt uitgenodigd. dus 1-(0.75)^4 = 100% - 31.6% is inderdaar 68,4% kans dat iemand in de loop van het jaar wordt uitgenodigd. Mijn fout, de berekening aldaar gedaan is dus wel goed. Sorry.

tinus1969

een jaar geleden

@erotisi, als je willekeurig 100 mensen uit 400 test, zullen er na 4 kwartalen mensen zijn die nooit zijn getest en mensen die 4 keer zijn getest.

Heb je meer informatie nodig om de vraag te beantwoorden? Reageer dan hier.

Geef jouw antwoord

Antwoorden (1)

In feite is dit antwoord heel simpel. Als een test voor 95% accuraat is, zal in 95% van de gevallen het testresultaat kloppen. Dit geldt voor positieve resultaten en ook voor negatieve resultaten.
In 5% van de gevallen zal een testresultaat dus een foutief resultaat geven. Dus ook daar geldt dat het in 95% van de gevallen correct is en in 5% van de gevallen niet correct.

Wanneer je dit soort brakke methodes gebruikt (95% accuraat vind ik de minimale ondergrens, eigenlijk zou je een methode op minstens 99% accuraat moeten hebben, maar dat is vakdeformatie), moet je een extra stap inbouwen. De duplo of zelfs triplo meting. Normaal gesproken doe je dat om de analytische variatie mee te nemen (en te kijken of die goed genoeg is), maar je kan ook kiezen om je monster 2 of 3x volledig te meten. Om dan een vals resultaat te krijgen (3x vals positief of 3x vals negatief) is 5% x 5% x 5% = 0.0125%. Bij 2x een vals resultaat is de kans 0.25% (5% x 5%). Dat is op zich ook al een acceptabele kans.

De accuraatheid is een waarde die bepaald wordt bij het valideren van een methode. Daarbij worden samples met bekende concentraties (of bekende uitslagen) gebruikt om te testen hoe goed je methode is. Daaruit bepaal je de 95%. Vervolgens ga je de methode gebruiken op je populatie. Daaruit kan je dan een waarde bepalen voor hoeveel procent een positieve uitslag heeft op je test (en daarbij moet je dus officieel de accuraatheid van je methode vermelden zodat mensen je resultaten op waarde kunnen schatten).

Thecis

een jaar geleden

erotisi

een jaar geleden

Ben jij het dus niet eens dat antwoord 50% is of begrijp ik je verkeerd

Thecis

een jaar geleden

Die 50% is een toevalligheid. Ik kan elke kans op 50% laten uitkomen als ik mijn populaties maar goed kies. Je kiest in dit geval een test met een accuracy van 95% en een prevalentie ook van 95% (of 5%, komt op hetzelfde neer).
Als je ook maar iets veranderd (bijvoorbeeld niet afronden omdat de accuraatheid geen 95% maar 95,47684186% is, zie je al dat alles verschuift.
Ook haal je andere dingen aan die niet met elkaar samen hangen. Zoals ook weergegeven in mijn antwoord, is de accuraatheid van 95% niet bepaald door je populatie te testen, maar door gecontroleerde proeven in een laboratoriumomgeving met vooraf bekende monsters. Die monsters/testen zijn onafhankelijk van de populatie die je wilt testen. En juist daardoor kan je zien wat je tegen komt. Op die manier zie je bijvoorbeeld ook dat er (bleek uit testen gedaan in 1994) in Amerika 75% van de dollarbiljetten sporen van cocaïne bevatten (ik weet niet of het nog steeds zo is).

Thecis

een jaar geleden

De test die je daarvoor gebruikt, moet eerst in een lab ontwikkelt zijn (en ja, dat krijg je dus de beschikking over (kleine hoeveelheden) cocaïne zodat je die test kan gaan ontwikkelen en valideren). Dan krijg je wellicht een test met 95% of 99% accuracy (er zijn ook testen met een veel lagere accuraatheid, maar m.i. kan je daar niks mee, toch worden dat soort dingen nog wel eens in een rechtszaak gebruikt *facepalm). Dus haal geen dingen door elkaar heen. En zeker met statistiek gebeurd dat heel gemakkelijk.

erotisi

een jaar geleden

Ok, maar onder welke voorwaarden zou de uitkomst voor jou dan wel 50% zijn.

Thecis

een jaar geleden

2 vragen:
1. Welke uitkomst moet 50% worden
2. Hoeveel mogelijkheden wil je horen?

erotisi

een jaar geleden

Thecis

een jaar geleden

Hiervoor heb ik strikt genomen te weinig informatie. De reden is namelijk dat je niet precies weet hoe de test werkt. Maar met de beperkte informatie kan je het volgende zeggen:
De kans dat deze persoon echt drugs gebruikt is 95%. Dat is namelijk de accuraatheid van de test. Maar ik zou graag de voorgestelde casus willen aanpassen voor toekomstige berekeningen.
We gaan uit van een accuraatheid van 95% en we gebruiken een populatie waarvan bekend is dat 10% drugs gebruikt (en we hanteren een heel saaie wereld, er is 1 soort drugs bekend). Daarbij weten we dat de test zéér specifiek is, de test reageert alléén met die ene drug.

erotisi

een jaar geleden

Je gaat nu van 5 naar 10% waarom doe je dat. Verder is nog het volgende gegeven: De test die voor 95 procent nauwkeurig is, betekent dat als het individu een gebruiker is, de test 95% van de tijd positief zal zijn, en als het individu een niet-gebruiker is, de test 95% van de tijd negatief zal zijn. Is deze voorwaarde voldoende om een uitkomst te krijgen van 50%?

Thecis

een jaar geleden

Ik verhoog het percentage om niet de verwarring te krijgen dat de 95% accuraatheid verbonden is aan de 5% drugsgebruikers. Dit zijn 2 onafhankelijke parameters. Dus vandaar dat we die op 10% zetten zodat je de materie goed gaat begrijpen..
De accuraatheid is 95%. Dat wil zeggen dat je in 95% van de gevallen een betrouwbaar resultaat krijgt. Waarom wil je graag naar een uitkomst van 50%. En welke uitkomst wil je op 50% krijgen. De accuraatheid is immers 95%.
(Met bovenstaande reacties van de vraag heb ik wel een idee waar je naar toe wilt, maar mijn vraag is tweeledig.
1. Je pakt een heel specifiek geval en baseert daar de hele kennis op. Dat is niet handig.
2. Je haalt kansen door elkaar. Denk Ik.
Kan je daarom eens heel gedetailleerd uitleggen wat je nu precies wil?

tinus1969

een jaar geleden

Overigens, nogmaals, is het woord accuraatheid hier verkeerd gebruikt. Zie bv https://www.ema.europa.eu/en/documents/scientific-guideline/ich-q-2-r1-validation-analytical-procedures-text-methodology-step-5_en.pdf

Thecis

een jaar geleden

The accuracy of an analytical procedure expresses the closeness of agreement between the
value which is accepted either as a conventional true value or an accepted reference value and
the value found. Dus de gemeten waarde tov de nominale waarde (de echte waarde).
Die probeer ik in dit geval zo goed mogelijk te benaderen. Het moeilijke is dat de vraag in basis al zodanig de verkeerde kant op gaat, dat ik dit verschil voor lief neem.
We zouden het eigenlijk over 95% betrouwbaarheid moeten hebben ipv accuraatheid. Maar om dat mee te nemen, zouden we een stuk validatie van methodes moeten meenemen (met bepalingen van precisie, specificiteit etc etc) zodat men snapt hoe dit werkt. Dat gaat voor hier echter even te ver. Vandaar dat ik deze onvolkomenheid/ fout in definitie dus even voor lief neem omdat ik denk dat het probleem van begrip ergens anders ligt.

erotisi

een jaar geleden

Wat ik wil is dat jij aangeeft onder welke voorwaarden ook jij vindt dat het antwoord 50% moet zijn en geen 95%. Dus het antwoord op de vraag : Stel dat 5% van de bevolking drugs gebruikt. Je gebruikt een test die 95% accuraat is. Iemand wordt willekeurig gekozen en krijgt de test. Het resultaat is positief. Wat is de kans dat deze persoon echt drugs gebruikt? Met het gegeven dat: De test die voor 95 procent accuraat is, betekent dat als het individu een gebruiker is, de test 95% van de tijd positief zal zijn, en als het individu een niet-gebruiker is, de test 95% van de tijd negatief zal zijn.

Thecis

een jaar geleden

We gaan het toch even iets correcter doen. We moeten inderdaad spreken over 95% betrouwbaarheid, niet accuraatheid. Accuraatheid is de waarde die je vindt ten opzichte van wat het had moeten zijn. Dit kan je dus alleen voor controle monsters zeggen. Bijvoorbeeld je neemt een concentratie van 100 mg/mL en je vind een waarde van 93,6 mg/mL, dan is de accuracy 93,6%. Vanwege de definitie van accuracy kan je dit nooit zeggen over onbekende samples. Daar is de waarde niet van bekend, die meet je.
De betrouwbaarheid van een test wordt vooraf bepaald. Die zal niet veranderen, dat is een van de eigenschappen van de test. In de randvoorwaarden die je stelt, kan ik dus NOOIT een antwoord geven dat kans 50% is en geen 95%. Dat is omdat het om 2 verschillende waardes gaat.

Thecis

een jaar geleden

Het voorbeeld wat je geeft, is een omstandigheid waarbij de kans TOEVALLIG als 50% omschreven kan worden. Dit is iets anders dan dat de kans 50% is. Dit heeft te maken met hoe statistiek daadwerkelijk werkt en hoe mensen het vaak interpreteren. Dit is een klein, maar heel belangrijk verschil. Ik zal je uitleggen waarom. De kans dat de test een juist uitslag geeft, is 95% Dat verandert dus niet omdat het een eigenschap is van de test. Dat is wat ik ook al die tijd gezegd heb. Om uit te rekenen wat de kans is dat iemand de juiste uitslag krijgt (jij wil weten voor iemand die drugs heeft gebruikt), kunnen we dat alleen doen als we de randvoorwaarden en overige informatie duidelijk hebben. Als je niet alle info hebt, kan je ook geen harde uitspraken doen over kansen en geef je aan dat resultaat / kans 95% (betrouwbaar) is (want dat is de betrouwbaarheid van de test en daarom heb ik dat altijd gezegd).

Thecis

een jaar geleden

Randvoorwaarden (en ik zal ze niet allemaal opnoemen, gewoon een paar zodat je snapt hoe precies dit komt):
- De test is superspecifiek. Dat wil zeggen dat de test uitsluitend op de drug in kwestie aanslaat.
- Betrouwbaarheid van de test is 95,0etc%
- Prevalentie drugsgebruikers is 5,0etc% (bepaald m.b.v. een andere methode)
- Nu komt het meest venijnige stuk (en hetgeen je niet wilt horen). We kunnen op basis van deze informatie geen kans geven hoeveel procent van de resultaten vals positief OF vals negatief zullen zijn (let op, dit hoeft zeker niet hetzelfde te zijn, zeker niet als je een treshold test doet!). Het enige wat we dus kunnen zeggen is dat je een bepaalde waarde vindt en dat die waarde statistisch gezien 95% betrouwbaar is. Het is dan heel verleidelijk om te zeggen dat het dus in 5% van de gevallen een foutief antwoord is, maar dat is statistisch niet juist.

Thecis

een jaar geleden

Daarom zei ik bovenaan al, dat de kans als 50% omschreven kan worden, maar geen 50% is (en het getal 50% is hier toevallig omdat je de beginwaardes goed hebt gekozen). Kansberekening wordt een stuk gemakkelijker wanneer je het hebt over balletjes pakken met of zonder terugleg. Dan heb je een absolute kans (4 balletjes, 2 wit, 2 blauw, 50% kans dat je een blauwe pakt). Binnen analytische methodes wordt het geheel ineens een stuk ingewikkelder. En moet je dus heel erg oppassen hoe je de resultaten interpreteert. Hoe kan je dan toch op methodes uitkomen waar je kans 50% is (zoals ik eerder had vermeld)? Een test met 100% betrouwbaarheid en een prevalantie van 50% (en op het laatste kan je talloze variaties maken). Bottomline is dat dit soort zaken eigenlijk heel ingewikkeld zijn. Ik probeerde het in het antwoord simpel uit te leggen om een idee te vormen waarbij de terminologie meteen al goed had moeten gebruiken. Daar heb ik een inschattingsfout in gemaakt.

Thecis

een jaar geleden

Je ziet al aan de lengte van de reactie dat dit echt niet zo gemakkelijk is. Anders had ik het echt wel korter opgeschreven. Statistiek is heel ingewikkeld en dit is nog maar de basis (en een echte statisticus zal mij waarschijnlijk nog uitlachen omdat ik het veel te simpel voor stel).

erotisi

een jaar geleden

Bedankt voor de uitgebreide toelichting.

Deel jouw antwoord

Bekijk alle vragen in deze categorieën:

Wetenschap

Aardrijkskunde

Astronomie

Biologie

Filosofie

Natuur- en scheikunde

Psychologie

Sociale wetenschap

Techniek

Wiskunde