cwbe coordinatez:
101
63535
21
3382550

ABSOLUT
KYBERIA
permissions
you: r,
system: public
net: yes

neurons

stats|by_visit|by_K
source
tiamat
K|my_K|given_K
last
commanders
polls

total descendants::
total children::13
14 ❤️


show[ 2 | 3] flat


ziman0
timko0
Stručná jednohubka:

Na Slovensku je cca 200 HIV pozitívnych ľudí. Úspešnosť HIV testu je 99.9%.
Spravil(a) si si test. Výsledok: POZITÍVNY. Aká je šanca, že test sa pomýlil?


Najprv sa nad tým skús zamyslieť a potom klikni sem pre odkrytie riešenia.




0000010100063535000000210338255008040129
Macarat
 Macarat      20.11.2015 - 14:41:06 [1K] , level: 1, UP   NEW
Som si spomenul na tento blog pri tomto clanku https://dennikn.sk/293154/slovaci-vyvinuli-novy-test-odhalenie-downovho-syndromu-plodu/#comment-138156

0000010100063535000000210338255005581609
nanda
 nanda      03.10.2010 - 22:50:15 (modif: 03.10.2010 - 22:51:58), level: 1, UP   NEW !!CONTENT CHANGED!!
nedefinujes co myslis pojmom "uspesnost"

http://en.wikipedia.org/wiki/Precision_and_recall

(ziadna z uvedenych dvoch metrik nieje kompletna bez druhej. a pochybujem ze tym 99% hovoris o Area Under Curve ROC kriviek - http://en.wikipedia.org/wiki/Receiver_operating_characteristic )

000001010006353500000021033825500558160905582122
ziman
 ziman      04.10.2010 - 17:16:59 , level: 2, UP   NEW
Je to accuracy.
http://en.wikipedia.org/wiki/Accuracy_and_precision

0000010100063535000000210338255003384705
dark matter
 dark matter      22.09.2007 - 02:24:23 , level: 1, UP   NEW
test je uspesny na 99,9% teoreticky alebo je to realne statistika z jeho pouzivania?
pouzivas vela tichych predpokladov

ak je 99,9% realna statistika doterajsej uspesnosti testovania, potom test HIV je v priemere uspesny 99,9% pre _nenahodny_ vyber celosvetovej populacie (rizikovi sa davaju testovat viac), navyse celosvetova populacia ma ine percento HIV pozitivnych ako Slovensko (odhadom 8 promile na svete voci 0,004 promile na slovensku)

na to aby, aby sme zistili uspesnost testu na Slovensku, by sme potrebovali vediet pravdepodobnost pre falosnu pozitivnu (nespravne urcenie ze niekto ma HIV) a falosnu negativnu (nespravne urcenie, ze niekto nema HIV) identifikaciu (z tej potom vyplyva celkova pravdepodobnost uspesnosti testu, nie opacne, ako si ratal ty), pravdepodobnost falosnej pozitivnej a falosnej negativnej identifikacie totiz nemusi byt rovnaka a len v kombinacii so zlozenim svetovej populacie dava onych 99,9%

vratme sa k tvojmu prikladu, preratajme ho tvojou metodikou na svetove cisla:
svet ma 6 050 000 000 obyvatelov, z toho 50 000 000 nakazenych
1. 0,999 * 50 000 000 = 49 950 000 ľudí je chorých a dostane pozitívny výsledok testu.
2. 0,001 * 50 000 000 = 50 000 ľudí dostane negatívny výsledok, aj keď sú chorí
3. 0,999 * 6 mld = 5 994 000 000 zdravých ľudí dostane negatívny výsledok.
4. 0,001 * 6 mld = 6 000 000 zdravých ľudí dostane pozitívny výsledok testu.

pravdepodobnost, ze sme pozitivni, ale zdravi je 60 000 000/55 950 000 = 10,7%

kym nie su zname presne ciatkove pravdepodobnosti pre pripady 1,2,3,4, moj aj tvoj priklad je iba hra s cislami bez velkeh vztahu k realite

ale pod ten vlak sa nehadzte aj tak...

000001010006353500000021033825500338470503384797
ziman
 ziman      22.09.2007 - 08:59:35 , level: 2, UP   NEW
Test je úspešný na 99.9% štatisticky, ináč by sa tu s ním nedalo pracovať. Možno reálny HIV test má mierne posunuté úspešnosti u zdravých a chorých ľudí, ale v princípe nám je to jedno, pretože to imho nebudú posuny z 99.9% na 4%. To, čo nám vyrába tie 4% je niečo iné a to druhý výber.

Tu je totiž zádrheľ v tom, že vyberáš dvakrát. Prvýkrát vyberáš ľudí na testovanie. Na tomto výbere skutočne nezáleží, test má rovnakú úspešnosť bez ohľadu naň. Ale potom vyberáš druhýkrát, keď z testovaných ľudí sa pri hodnotení spoľahlivosti výsledku obmedzíš iba na pozitívnych. A práve to zdanlivo skresľuje výsledok na tie 4% (zdanlivo preto, lebo si treba uvedomiť že tie 4% je čosi iné než úspešnosť testu).

Skús si pozrieť ilustráciu černochmi (http://kyberia.sk/id/3384585, posledné dva odstavce)

00000101000635350000002103382550033847050338479703392808
dark matter
 dark matter      26.09.2007 - 10:22:42 [1K] , level: 3, UP   NEW
posledna poznamka
ochorenie HIV sa nezjavuje cisto nahodne, pravdepodobnosti pre jednotlivcov z druheho vyberu lisia a preto nema zmysel ratat "priemernu" pravdepodobnost falosneneho pozitivneho nalezu (odhliadnuc od toho, ze 200 je pocet uz diagnostikovanych, nie HIV pozitivnych z celej populacie)

najrizikovejsie skupiny su uzivatelia injekcnych drog, muzi stykajuci sa pohlavne s muzmi, prostituti/ky, pristahovalci, vazni a mladez do 25 rokov

to percento je presne vyratany nezmysel

0000010100063535000000210338255003384705033847970339280805581564
niekt0
 niekt0      03.10.2010 - 22:25:47 , level: 4, UP   NEW
Toto je klasicky priklad na pravdepodobnost co sa uci na matfyze,
a funguje to prekvapivo s vsetkym, len tie choroby su take do zivota.

Problem ti nastane vzdy ked mas velmi riedky jav, redsi nez mnozstvo falosnych poplachov testu.

Ano, v praxi sa davaju testovat hlavne ludia po nechranenom styku, a teda pravdepodobnost bude vacsia, ale ide o princip.

00000101000635350000002103382550033847050338479703391698
obiaman
 obiaman      25.09.2007 - 17:41:21 , level: 3, UP   NEW
Zas jeden, čo sa naváža do 4% !

0000010100063535000000210338255003384280
b.b.
 b.b.      21.09.2007 - 19:21:30 , level: 1, UP   NEW
Si dost mimo. Skusme to z opacnej strany.
Na Slovensku je potvrdenych 183 HIV pozitivnych ludi.
Podla tvojej teorie su oni medzi tymi 4%, co mali pozitivny vysledok a naozaj aj boli pozitivni.
To by ale znamenalo ze uz 4575 ludi na Slovensku dostalo pozitivny HIV vysledok (a z nich 4% naozaj su pozitivni), a z toho 96% nespravne pozitivnych je 4392. Podla tvojej teorie by museli teda otestovat cca 4.4 miliona ludi aby nasli tych 183 pozitivnych.
To je podla mna asi cela dospela populacia, a ja som teda na teste este nebol.

000001010006353500000021033825500338428003384387
ziman
 ziman      21.09.2007 - 20:32:49 , level: 2, UP   NEW
Toto je veľmi dobrá poznámka.

Môj príklad vraví o tom, že si vyberieš náhodne jedného človeka z populácie a dáš mu test, resp. že sa jedno ráno zobudíš a povieš si, že si ideš spraviť HIV test.

Avšak v skutočnosti na test chodia ľudia s podozrením na pozitivitu; u ľudí s podozrením na pozitivitu je však pravdepodobnosť skutočnej pozitivity zrejme o dosť vyššia než tá necelá desatina promile, takže tam je pravdepodobnosť omylu testu v prípade pozitívneho výsledku o dosť nižšia.

Takže podozrenie na pozitivitu (s ním v praxi na HIV test obyčajne ideš) dosť zvyšuje spoľahlivosť pozitívneho výsledku, ktorá, aj keď je síce (zrejme o dosť) vyššia než tie 4%, ale vo všeobecnosti sa nerovná tým 99.9%.

Pointa článku je v tom, že úspešnosť testu 99.9% znamená: "Ak som chorý, tak na 99.9% mi to povie, že som chorý a naopak". To ale nie je to isté ako "Ak mi to povie, že som chorý, tak som na 99.9% chorý". Vtedy je to iné číslo; v prípade náhodne vybraného Slováka sú to 4%, v prípade človeka s podozrením na chorobu je to viac, na čo si správne poukázal.

00000101000635350000002103382550033842800338438703384448
b.b.
 b.b.      21.09.2007 - 21:44:14 , level: 3, UP   NEW
Clovece, ty by si mal ist do politiky.

0000010100063535000000210338255003384280033843870338444803384498
ziman
 ziman      21.09.2007 - 22:20:12 , level: 4, UP   NEW
Prečo? Neznie to veľmi povzbudzujúco...

000001010006353500000021033825500338428003384387033844480338449803384513
b.b.
 b.b.      21.09.2007 - 22:39:15 , level: 5, UP   NEW
Ze si dokazes vylozit cisla tak ako chces. Znie to vsetko logicky a tak, ale je to hlupost.

Proste najprv si tvrdil ze ked si das urobit HIV test, a bude pozitivny tak na 96% nie si HIV pozitivny.
Teraz je to zrazu o tom ze ked si das urobit test, tak asi mas podozrenie na pozitivitu, a preto je pravdepodobnost omylu nizsia.
Ja si ale tvrdim ze pravdepodobnost omylu je stale rovnaka, bez ohladu na to kolko ludi zije v nasej krajine, kolko ich bolo a bude testovanych a kolko z nich je HIV pozitivnych.

00000101000635350000002103382550033842800338438703384448033844980338451303384585
ziman
 ziman      21.09.2007 - 23:53:07 , level: 6, UP   NEW
Hm, nie ja si vykladám čísla, ako chcem, ale ja vykladám, čo chcú čísla. Nemám dôvod vymyslieť si niečo a potom pokrútiť všetko, aby som to podoprel.

Reči o ovplyvnení spoľahlivosti som si dovolil zjednodušiť iba na dôsledok -- na to, že podozrenie ovplyvňuje pravdepodobnosť. Ale zjavne to musím rozpísať, neurobím však nič iné, len dosadím iné konštanty do toho, čo celý čas tvrdím.

Majme 1000 ľudí podozrivých na HIV. Nech je 5% ľudí s podozrením na HIV skutočne chorých. Potom:
1) chorý, test pozitívny: 49.95
2) chorý, test negatívny: 0.05
3) zdravý, test negatívny: 949.05
4) zdravý, test pozitívny: 0.95
Spoľahlivosť výsledku "pozitívny": 49.95/(49.95+0.95) = 98.1%. Čo je už celkom slušné.

Je to to isté, čo v článku, úspešnosť testu je opäť 99.9%, akurát je tam dosadená iná pravdepodobnosť (5% namiesto 0.004%), že náhodne vybraný jedinec bude chorý.

V prípade HIV testu máme tri čísla:
1) úspešnosť testu (počet_správnych_diagnóz/počet_všetkých_diagnóz), u nás 99.9%
Toto je vec, ktorá závisí len od testu a nikdy sa nemení, bez ohľadu na to, či si v USA, Afganistane alebo na Marse. Čo je logické.
2) spoľahlivosť verdiktu "pozitívny", u nás 4%, 73%, 98.1%, ...
Toto už je komplikované a rozhodne sa nerovná úspešnosti testu! Práve o tom je článok, že táto hodnota môže aj v prípade testu s 99.95 úspešnosťou nadobúdať takých hodnôt ako 4%. Závisí totiž aj od vlastností populácie, z ktorej vyberáš.
3) spoľahlivosť verdiktu "negatívny". u nás 99.9999xxx%, ...
Toto je úplne rovnaké ako v bode 2), je to symetrické, akurát z opačnej strany spektra. Tiež závisí aj od úspešnosti testu, aj od vlastností populácie, z ktorej vyberáš.

Ak hovoríme o "úspešnosti testu", tak to nemôže byť nič iné, než bod 1), pretože jedine ten nezávisí od ničoho iného než testu samotného; práve táto charakteristika sa musí používať na opis úspešnosti testu, pretože je jediná pre daný test konštantná. Všetky ostatné sa musia udávať aj s charakteristikou populácie, na ktoré sa vzťahujú. Okrem toho by názov nemohol byť "úspešnosť testu", ale "úspešnosť bla bla bla vzhľadom na populáciu s charakteristikami X Y Z". Preto považujem túto terminológiu za nezavádzajúcu.

Pravdepodobnosť omylu testu pri náhodne vybranom jedincovi je naozaj vždy rovnaká. Ale ak obmedzíš výber (vždy vyberáme po vykonaní testu) podľa nejakých pravidiel (napríklad z neho vyradíš ľudí so správnym verdiktom, čo sa práve stáva pri obmedzení sa na tých s pozitívnym výsledkom), zmení sa aj pravdepodobnosť, že vyberieš jedinca, pri ktorom sa test pomýlil. A presne to robí rozdiel medzi bodmi 1), 2) a 3).

Máme ľudí v Etiópii, z nich drvivá väčšina su černosi. Potom máme testerov, ktorým zaviažeme oči, tí nám budú predstavovať test. Ich úspešnosť rozpoznávania černocha je povedzme 75%, pretože to robia ohmataním vlasov, či majú krátke kučierky (existujú nekučeraví černosi, existujú kučeraví ľudia iných rás). Tj. ak povie tester, že daný človek je černoch, tak sa pomýlil v 25 prípadoch zo sto.

Teraz sa obmedzíme len na ľudí, ktorých testeri označili za nečernochov a ideme počítať spoľahlivosť verdiktu "nečernoch". Máme však problém, pretože obmedzením výberu na nekučeravých ľudí sme spôsobili, že vo výbere bude pár nečernochov a veľa nekučeravých černochov (aj keď je nekučeravých černochov málo, ľudí iných rás je ešte menej, je to dôsledok tak drvivej prevahy černochov). A tak nameriame oveľa horšiu úspešnosť našich testerov pri posudzovaní rasy, než je 75%.

Nepripomína ti to niečo?

0000010100063535000000210338255003384278
dan0
 dan0      21.09.2007 - 19:19:45 (modif: 21.09.2007 - 19:26:19), level: 1, UP   NEW !!CONTENT CHANGED!!
no toto je pekny priklad stretu dvoch roznych interpretacii pravdepodobnosti. existuje viacero podobnych paradoxov, ktore vznikaju prave preto, ze nie je vzdy jasne, co pod "pravdepodobnostou" myslime. takze sa uz nehadajte a checknite si radsej http://en.wikipedia.org/wiki/Probability_interpretations#Practical_controversy

0000010100063535000000210338255003384159
sven{outKasted}
 sven{outKasted}      21.09.2007 - 18:05:39 , level: 1, UP   NEW
hmhm.. prva hodina statistiky v tomto semestri ?

000001010006353500000021033825500338415903384246
ziman
 ziman      21.09.2007 - 19:03:54 , level: 2, UP   NEW
Škola ešte nezačala.

Inak sústredenie fyzikálnej olympiády v Terchovej, asi tri roky dozadu.

0000010100063535000000210338255003383664
Trilobite
 Trilobite      21.09.2007 - 14:12:16 , level: 1, UP   NEW
toto mi pripada ako ten for s tym, ze clovek ma 11 prstov na rukach - zacni odpocitavat od 10 na jednej ruke a pripocitaj 5 - vyjde cislo 11.

0000010100063535000000210338255003383619
blurec
 blurec      21.09.2007 - 13:56:40 , level: 1, UP   NEW
Výsledok: POZITÍVNY. Aká je šanca, že test sa pomýlil?
Pôsobí to prekvapujúco, ale šanca, že test sa pomýlil, je viac než 96%.

cize zo ak sto ludom vyjde pozitivny test, 96 z nich bude zdravych?

000001010006353500000021033825500338361903383670
ziman
 ziman      21.09.2007 - 14:14:19 , level: 2, UP   NEW
Presne tak. Za predpokladu, že je to 100 náhodne vybraných Slovákov (ty sám si náhodne vybraný Slovák).

00000101000635350000002103382550033836190338367003383730
blurec
 blurec      21.09.2007 - 14:31:38 , level: 3, UP   NEW
nemam dalsie otazky :)

0000010100063535000000210338255003383573
yelowcap
 yelowcap      21.09.2007 - 13:42:34 , level: 1, UP   NEW
5000 zdravych a 0,2 chorych ludi z celkovych 5000200 testovanych dostalo nespravnu informaciu o svojom zdravotnom stave.

to znamena ze error je 5000,2/5000200, tj 0,1%, alebo robim niekde chybu?






väčšina ľudí si väčšinu vecí vo svojom živote väčšinou zaslúži

000001010006353500000021033825500338357303383596
ziman
 ziman      21.09.2007 - 13:47:10 , level: 2, UP   NEW
Presne tak, chyba u celej populácie (ergo i u náhodne vybraného jedinca z nej) je 0.1%.

Ty ale nie si náhodne vybraný jedinec z celej populácie. Ty si náhodne vybraný jedinec z tých, čo dostali pozitívny výsledok. A to je práve ten rozdiel :)

00000101000635350000002103382550033835730338359603383681
yelowcap
 yelowcap      21.09.2007 - 14:16:39 , level: 3, UP   NEW
.
mas pravdu. moju namietku voci nespravnosti beriem spet.
.
neuvedomil som si predpoklad vysledku:POZITIVNY

väčšina ľudí si väčšinu vecí vo svojom živote väčšinou zaslúži

0000010100063535000000210338255003383525
grzegorz brzeczyszczykiewicz
 grzegorz brzeczyszczykiewicz      21.09.2007 - 13:33:30 , level: 1, UP   NEW
imho miesanie hrusiek s jablkami a k tomu nepresne zadefinovane pojmy.

000001010006353500000021033825500338352503383635
ziman
 ziman      21.09.2007 - 14:03:28 , level: 2, UP   NEW
Čo konkrétne je nepresne zadefinované? Budem rád, ak mi to pomôžeš zlepšiť.

Kľúčový pojem, a to úspešnosť HIV testu je myslím nesporný a neprekvapujúci:
- vezmeš n ľudí
- každému spravíš test
- počet správnych výsledkov nech je m
- úspešnosť je m/n
čiže taká definícia úspešnosti, ako ju všetci poznáme, na tom sa snáď zhodneme.

00000101000635350000002103382550033835250338363503383776
grzegorz brzeczyszczykiewicz
 grzegorz brzeczyszczykiewicz      21.09.2007 - 14:46:22 , level: 3, UP   NEW
uspesnost je teda schopnost testu spravne klasifikovat - tato je overena na zaklade dodatocneho porovnania, ako pises. na zaciatku svojho prispevku pises o uspesnosti testu 99.9% - tzn. test ta nespravne zaradi v jednom promile pripadov. pravdepodobnost, ze sa test pomylil, a zaradil ta do nespravnej skupiny, je teda 1/1000.

citujem: "Ale test hodí pozitívny výsledok (a teda sa stane nespoľahlivým) len pri mizivom počte ľudí (cca jedno promile)." usudzujem teda, ze prave tu chapes uspesnost zle - 99,9% vs. 0,1% je len pomer, ktory hovori o rozlozeni vysledku klasifikacie (99,9% ludi da test do jednej a 0,1% do druhej skupiny). ale nie je to uspesnost testu. prave percento spravne zaradenych ludi do jednotlivych skupin hovori o uspesnosti tohto testu. preto moja vycitka ohladom chaosu v pojmoch.

0000010100063535000000210338255003383525033836350338377603383823
ziman
 ziman      21.09.2007 - 15:09:35 , level: 4, UP   NEW
Takto,

"Ale test hodí pozitívny výsledok (a teda sa stane nespoľahlivým) len pri mizivom počte ľudí (cca jedno promile)." usudzujem teda, ze prave tu chapes uspesnost zle

aby som bol presný, test hodí pozitívny výsledok (a teda sa stane nespoľahlivým) pri počte ludí 5000+199.8, čo naozaj je cca jedno promile z populácie, ale nie preto, že by test hodil na 99.9% negatívny výsledok (tj. akoby bol úspech byť negatívnym), ale preto, lebo bude pozitívny u
1) zdravých ľudí nesprávne zaradených (5000 kusov)
2) chorých ľudí správne zaradených (199.8 ks)
Čo robí dokopy 5199.8 človeka a z päťmiliónovej populácie to ozaj je to jedno promile, ale z iného dôvodu, než to zrejme vyznelo.

0000010100063535000000210338255003383052
visby
 visby      21.09.2007 - 10:55:55 , level: 1, UP   NEW
milujem statistiku... da sa s nou krasne manipulovat...

000001010006353500000021033825500338305205424363
repelent
 repelent      30.06.2010 - 18:51:52 , level: 2, UP   NEW
statistik sa utopil v rieke s priemernou hlbkou tri centimetre

0000010100063535000000210338255003382897
whiteline
 whiteline      21.09.2007 - 09:51:42 , level: 1, UP   NEW
?

a i tak sa ma robit viacero testov s urcitym casovym rozostupom (6-12 mesiacov?).. alebo sa mylim?

000001010006353500000021033825500338289703383659
ziman
 ziman      21.09.2007 - 14:10:38 , level: 2, UP   NEW
Ale áno, určite. :) Test aplikovaný druhýkrát na otáznu (štvorpercentne istú) 5200-člennú skupinu potencionálne pozitívnych, z ktorých je štatisticky 200 naozaj chorých, už dáva výsledky s rozumnou spoľahlivosťou.

Navyše, neverím, že by ti lekár-sadista s kamennou tvárou oznámil 99.9% úspešnosť testu namiesto štvorpercentnej spoľahlivosti tvojho výsledku. :)

Pointa bola v tom, že úspešnosť testu je "jednosmerka", tj. že ak si naozaj chorý, tak ti zahlási na 99.9%, že si chorý. Ale ak ti zahlási, že si chorý, tak to ešte neznamená (a zďaleka nie s 99.9% pravdepodobnosťou), že si naozaj chorý. (Je to čosi ako nelegitímne otáčanie implikácie).