Psykologia 2021
Tervetuloa traditionaaliseen, legendaan jo syntyessään, Vauvan Psykologia 2021 -ketjuun!
Täällä puhutaan hakemisesta opiskelemaan psykologiaa yliopistoon, ei vauvoista eikä kehityspsykologiasta.
Psykologiaa voi opiskella Helsingissä, Turussa, Tampereella, Jyäskylässä ja Joensuussa sekä ruotsiksi Åbo Akademissa.
Helsingissä on lisäksi psykologiksi valmistava maisterihaku, johon on hakukelpoinen alemmalla korkeakoulututkinnolla ja psykologian perus- ja aineopinnoilla.
Jyväskylässä on lisäksi avoimen väylä filosofian maisteriksi pääaineena psykologia. Siitä ei pätevöidy psykologiksi, mutta pääsee tutkijaksi, opettajaksi, HR:ään tai konsultiksi.
Tutustu avoimien yliopistojen tarjontaan! Joensuun avoimesta löytyy työ- ja organisaatiopsykologia sekä oikeuspsykologia.
Psykologia on lääkiksen jälkeen yksi vaikeimmista aloista päästä sisään, vaikeampi kuin oikis tai kauppis. Todistusvalinnassa saa pisteitä 5 aineesta: psykologia, äidinkieli, matematiikka, kieli, muu reaali. Eniten pisteitä reaalissa antaa fysiikka, vähiten terveystieto. Vanhanmallisesta yleisreaalista ei saa yhtään pistettä.
Vuoden 2020 todistusvalinna pisterajat toukokuussa (70 % kiintiö, ei sisällä lisäpaikkoja, ensikertalaiset, max 157,9 p):
Helsinki: 140,9
Turku: 135,6
Tampere: 135,6
Jyväskylä: 131,9
Joensuu: 129,1
130 pistettä saa E-rivillä, jossa pitkä matikka. Helsinkiin tarvittiin 2-3 L.
Pääsykokeessa on tyypillisesti (ei kevät 2020, vaikka tarkoitus oli) vaadittu vahvaa tilastomenetelmien osaamista.
Vanhoja pääsykoekirjoja:
- Nummenmaa, L. Holopainen, M. & Pulkkinen, P., Tilastollisten menetelmien perusteet.
- Nummenmaa, L., Käyttäytymistieteiden tilastolliset menetelmät
- Karjalainen, L., Tilastotieteen perusteet
Vanhoja valintakokeita (loogista päättelyä myös logopediassa ja tietojenkäsittelytieteessä)
https://www.helsinki.fi/fi/opiskelijaksi/yhteishaku/tietoa-valintakokei…
Tärkeitä / usein esiintyviä linkkejä
Yhteisvalinnan tiedotussivu
https://www.helsinki.fi/fi/verkostot/psykologian-yhteisvalinta/
Lisäpaikkoja vuodelle 2021
https://www.psykologilehti.fi/psykologi/tyo/kymmenia_lisaaloituspaikkoj…
Todistuksen pisteytys
https://opintopolku.fi/wp/opo/korkeakoulujen-haku/mika-korkeakoulujen-o…
VIPUNEN (hakijamäärät ja valitut)
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…
Kaikki pisterajat valintatavoittain
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…
Hakijoiden ja sisäänpäässeiden ylioppilastutkintomenestys
graafinen
https://app.powerbi.com/view?r=eyJrIjoiYzYwOWYyOWMtNTllZC00MzU1LTk2OWIt…
taulukko
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/K…
valmiiksi analysoituna tekstinä
https://tilastoneuvos.vipunen.fi/2020/01/20/korkeakoulutukseen-paasseid…
Aikaisempien vuosien ketjuja:
2020 koronakevät ja AMK-valintakoe
https://www.vauva.fi/keskustelu/3496665/psykologia-2020
2019 valintakoeyhteistyövuosi
https://www.vauva.fi/keskustelu/3217889/psykologia-2019
2018 erilaiset kokeet HTT ja J ja J
https://www.vauva.fi/keskustelu/3067511/psykologia-2018
2017 ensimmäinen löytynyt ketju
https://www.vauva.fi/keskustelu/2753394/psykologia-2017-muita-hakijoita
Kommentit (8033)
Aika moneen aineeseen pisteet nousivat ihan sikana viime keväästä.
Ollaan parin vuoden päästä siinä pisteessä, että perusabit eivät pääse papereilla minnekään, koska kaikki paikat menevät korottajille. Abi tarvitse ällärivin päästäkseen kouluun.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Noi on aivan järkyttäviä noi pääsykoesekoilut! Käsittämätöntä! Miten tosta 2014 maailmanpolitiikan kokeestakaan ei opittu mitään?! Luulisi että ne tarkastaisivat useampaan kertaan kaikki kokeet ennen koetilaisuutta, no ilmeisesti ei kiinnosta pätkääkään kun näitä virheitä tapahtuu aina uudelleen. Myös 2019 filosofian kokeessa oli sama juttu, että yksi esseetehtävistä oli väärästä kirjasta ja lopulta pidettiin kokonaan uusi koe. Viime vuoden koronasekoilu oli myös aivan järkyttävää, tietysti vieläpä eniten meille psykan hakijoille. Mutta toi tän vuotinen vakava-juttu on kyllä pahin kaikista! Toivottavasti yliopistoille lähtee nyt kunnolla vihaista palautetta että tulee joku roti siihen toimintaan!
Vierailija kirjoitti:
Vierailija kirjoitti:
Turku 2022, psykologian, logopedian ja folkloristiikan yhteisvalinta: Kaikki joilla on ruotsinkielinen sukunimi tekevät kokeen Kårenilla samalla kun siellä on bändikilpailun finaali. Kaikki joiden nimi viittaa luontoon tekevät kokeen syksyllä hirvestysaikaan Vakka-Suomen metsissä. Kaikki joiden nimi ei tarkoita mitään tekevät kokeen Topinojan kaatopaikalla. Kruskal-Wallisit, Youdenit ja Puolalalakanahot pääsevät messukeskukseen. Freudit ja Jungit tekevät kokeen "tois puol jokkee".
Unohdit kulttuuriantropologit, joiden vuoksi kokeeseen on lisätty pari artikkelia Samoan alkuperäiskansojen historiasta ja fysiikan osaston. Fysiikan vuoksi olemme opiskelleet valmennuskeskuksessa kaiken yhtälön.https://futurism.com/_next/image?url=https%3A%2F%2Fwp-assets.futurism.c…
jes alotin opettelemaan tuota kaavaa ulkoa jo viime syksynä. Pakko muistaa kunnolla itse, kun kokeessa saatavassa kaavaluettelossa saattaa olla vääriäkin kaavoja.
Tehtävä, jota tämän palstan parviälykään ei osaa kokeen jälkeen rauhassa tehdä, on liian vaikea ja epäonnistunut.
Toivottavasti Ouluun pääsisi paljon pohjoisessa asuvia, koska he todennäköisesti jäisivät pohjoiseen töihin. Siellä psykologipula valtava.
Vierailija kirjoitti:
Aika moneen aineeseen pisteet nousivat ihan sikana viime keväästä.
Ollaan parin vuoden päästä siinä pisteessä, että perusabit eivät pääse papereilla minnekään, koska kaikki paikat menevät korottajille. Abi tarvitse ällärivin päästäkseen kouluun.
Siinäpä sitten on taas opetus- ja kulttuuriministeriölle vähän pähkinää purtavaksi, että millainen järjetön uudistus vielä kehiteltäis.
Vierailija kirjoitti:
Noi on aivan järkyttäviä noi pääsykoesekoilut! Käsittämätöntä! Miten tosta 2014 maailmanpolitiikan kokeestakaan ei opittu mitään?! Luulisi että ne tarkastaisivat useampaan kertaan kaikki kokeet ennen koetilaisuutta, no ilmeisesti ei kiinnosta pätkääkään kun näitä virheitä tapahtuu aina uudelleen. Myös 2019 filosofian kokeessa oli sama juttu, että yksi esseetehtävistä oli väärästä kirjasta ja lopulta pidettiin kokonaan uusi koe. Viime vuoden koronasekoilu oli myös aivan järkyttävää, tietysti vieläpä eniten meille psykan hakijoille. Mutta toi tän vuotinen vakava-juttu on kyllä pahin kaikista! Toivottavasti yliopistoille lähtee nyt kunnolla vihaista palautetta että tulee joku roti siihen toimintaan!
Mulla on jos sellainen sopivan alistuva, pitkä ja seikkaperäinen analyysi kokeen kieliasusta luonnoskansiossa valmiina.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Ärsyttääkö muitakin toi prevalenssi-sana? Miksi ei voida puhua esiintyvyydestä, sitä se kuitenkin tarkoittaa.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.
https://online.stat.psu.edu/stat507/lesson/10/10.3
Tässä on ihan kuvien avulla havainnollistettu, miten prevalenssi vaikuttaa testin positiiviseen ja negatiiviseen ennustearvoon.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.
Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.
Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.
Ei tehtävän annossa sanota niin.
Milloin mahtaa olla se vuosi, kun kaikki paikat joudutaan arpomaan koska inhimillinen tai tekninen virhe alkuperäisissä valintatavoissa?
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.
Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.
Ei tehtävän annossa sanota niin.
Miten niin ei sanota? Aivan selvästihän siinä kerrotaan, että testin suoritti 250 henkilöä, joista 125 oli lukihäiriö ja 125 ei ollut. Tällä joukolla testattiin tuota testiä.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?
Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.
Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.
Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.
No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?
Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.
Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.
Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:
Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84
Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684
Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216
Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16
Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28
Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.
Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.
Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.
Voi olla, että ajattelenkin :)
Wikipedia kuitenkin sanoo esimerkiksi, että "In case-control studies the PPV has to be computed from sensitivity, specificity, but also including the prevalence"
https://en.wikipedia.org/wiki/Positive_and_negative_predictive_values
Eikö aineiston tilanne ollut juuri case-control-study, jossa oli 250 tutkittavaa, jotka oli jaettu terveiden ja lukihäiriöisten ryhmiin? Näin ollen esiintyvyys täytyy ottaa huomioon PPV:tä laskiessa.
Joo, mutta se prevalenssi on ikään kuin "leivottu sisään" jos lasketaan 2x2 taulukosta. PPV on edelleen oikeiden positiivisten osuus kaikista positiivisista, kuten kaavakin kertoo (TP/TP÷FP). Tämä kaavahab oiisi täysin turha ja vajaa, jos p pitäisi lisätäberikseen.
" In the above example, if the group of people tested had included a higher proportion of people with bowel cancer, then the PPV would probably come out higher and the NPV lower. If everybody in the group had bowel cancer, the PPV would be 100% and the NPV 0%.
To overcome this problem, NPV and PPV should only be used if the ratio of the number of patients in the disease group and the number of patients in the healthy control group used to establish the NPV and PPV is equivalent to the prevalence of the diseases in the studied population, or, in case two disease groups are compared, if the ratio of the number of patients in disease group 1 and the number of patients in disease group 2 is equivalent to the ratio of the prevalences of the two diseases studied"
Mä ymmärrän nyt tuosta, ettei tuolla meidän aineistolla edes ole mielekästä laskea PPV:tä ja NPV:tä. Luin siis jonkun linkkaamaa wikiä. Mitä uhnettä. Oon silti sen kannalla, eträ 0,10 prevalenssia täs haettiin.
Kannattaa ehdottomasti panostaa ennemmin todistusvalintaan! Viime vuoden pääsykoesekoilun takia multa meni niin maku kaikkeen tohon p*skaan että panostin suosiolla kirjoituksiin tänä vuonna, vaikka pitikin kirjoittaa 4 ainetta uudestaan. Kannatti, pääsin sisäänkin ja hermot todellakin säästyivät. Yo-kirjoitukset on todella hyvin järjestetyt ja toimivat hienosti kaikin puolin, plus koeaika ja valmistautumisaika on paljon inhimillisemmät. Lisäksi valintakiintiö on 60%. Kaikille joilla on ensikertalaisuus tallella niin ihan ehdottomasti suosittelen todistusväylää.