Psykologia 2021
Tervetuloa traditionaaliseen, legendaan jo syntyessään, Vauvan Psykologia 2021 -ketjuun!
Täällä puhutaan hakemisesta opiskelemaan psykologiaa yliopistoon, ei vauvoista eikä kehityspsykologiasta.
Psykologiaa voi opiskella Helsingissä, Turussa, Tampereella, Jyäskylässä ja Joensuussa sekä ruotsiksi Åbo Akademissa.
Helsingissä on lisäksi psykologiksi valmistava maisterihaku, johon on hakukelpoinen alemmalla korkeakoulututkinnolla ja psykologian perus- ja aineopinnoilla.
Jyväskylässä on lisäksi avoimen väylä filosofian maisteriksi pääaineena psykologia. Siitä ei pätevöidy psykologiksi, mutta pääsee tutkijaksi, opettajaksi, HR:ään tai konsultiksi.
Tutustu avoimien yliopistojen tarjontaan! Joensuun avoimesta löytyy työ- ja organisaatiopsykologia sekä oikeuspsykologia.
Psykologia on lääkiksen jälkeen yksi vaikeimmista aloista päästä sisään, vaikeampi kuin oikis tai kauppis. Todistusvalinnassa saa pisteitä 5 aineesta: psykologia, äidinkieli, matematiikka, kieli, muu reaali. Eniten pisteitä reaalissa antaa fysiikka, vähiten terveystieto. Vanhanmallisesta yleisreaalista ei saa yhtään pistettä.
Vuoden 2020 todistusvalinna pisterajat toukokuussa (70 % kiintiö, ei sisällä lisäpaikkoja, ensikertalaiset, max 157,9 p):
Helsinki: 140,9
Turku: 135,6
Tampere: 135,6
Jyväskylä: 131,9
Joensuu: 129,1
130 pistettä saa E-rivillä, jossa pitkä matikka. Helsinkiin tarvittiin 2-3 L.
Pääsykokeessa on tyypillisesti (ei kevät 2020, vaikka tarkoitus oli) vaadittu vahvaa tilastomenetelmien osaamista.
Vanhoja pääsykoekirjoja:
- Nummenmaa, L. Holopainen, M. & Pulkkinen, P., Tilastollisten menetelmien perusteet.
- Nummenmaa, L., Käyttäytymistieteiden tilastolliset menetelmät
- Karjalainen, L., Tilastotieteen perusteet
Vanhoja valintakokeita (loogista päättelyä myös logopediassa ja tietojenkäsittelytieteessä)
https://www.helsinki.fi/fi/opiskelijaksi/yhteishaku/tietoa-valintakokei…
Tärkeitä / usein esiintyviä linkkejä
Yhteisvalinnan tiedotussivu
https://www.helsinki.fi/fi/verkostot/psykologian-yhteisvalinta/
Lisäpaikkoja vuodelle 2021
https://www.psykologilehti.fi/psykologi/tyo/kymmenia_lisaaloituspaikkoj…
Todistuksen pisteytys
https://opintopolku.fi/wp/opo/korkeakoulujen-haku/mika-korkeakoulujen-o…
VIPUNEN (hakijamäärät ja valitut)
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…
Kaikki pisterajat valintatavoittain
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…
Hakijoiden ja sisäänpäässeiden ylioppilastutkintomenestys
graafinen
https://app.powerbi.com/view?r=eyJrIjoiYzYwOWYyOWMtNTllZC00MzU1LTk2OWIt…
taulukko
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/K…
valmiiksi analysoituna tekstinä
https://tilastoneuvos.vipunen.fi/2020/01/20/korkeakoulutukseen-paasseid…
Aikaisempien vuosien ketjuja:
2020 koronakevät ja AMK-valintakoe
https://www.vauva.fi/keskustelu/3496665/psykologia-2020
2019 valintakoeyhteistyövuosi
https://www.vauva.fi/keskustelu/3217889/psykologia-2019
2018 erilaiset kokeet HTT ja J ja J
https://www.vauva.fi/keskustelu/3067511/psykologia-2018
2017 ensimmäinen löytynyt ketju
https://www.vauva.fi/keskustelu/2753394/psykologia-2017-muita-hakijoita
Kommentit (8033)
Musta on muuten outoa, että näinkin halutulla alalla ensikertalaiset paikan saaneet eivät ole juurikaan vahvistellut paikkojaan, ei edes Helsingissä, mikä ilmeisesti on kaikista halutuin paikka? Mitäköhän nuo Helsingistä paikan saaneet odottelevat?
Vierailija kirjoitti:
Musta on muuten outoa, että näinkin halutulla alalla ensikertalaiset paikan saaneet eivät ole juurikaan vahvistellut paikkojaan, ei edes Helsingissä, mikä ilmeisesti on kaikista halutuin paikka? Mitäköhän nuo Helsingistä paikan saaneet odottelevat?
Nythän voi vahvistaa vain sen ykköstoiveen.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Miksi kukaan haluaisi laskea todennäköisyyden, että positiivisen testituloksen saanut on oikeasti sairas, kun tiedetään jo kuka on sairas ja kuka ei, niinkuin tuossa tutkimusotoksessa? PPV lasketaan siksi, että voitaisiin arvioida, kuinka todennäköisesti positiivisen testituloksen saanut on oikeasti sairas eli kuinka hyvin testin tulokseen voidaan luottaa silloin kun ei tiedetä, onko tutkittava oikeasti sairas vai ei. Siksi käytetään populaation esiintyvyyttä. Oletetaan, että x osuus väestöstä on sairaita. Millä todennäköisyydellä joku testistä positiivisen tuloksen saanut todella kuuluu näihin x sairaisiin? PPV laskettuna jonkun itse päätetyn otoksen esiintyvyyden perusteella on ihan turha.
Ei hyvää päivää. Se on TUTKIMUS, jolla mitataan testin TARKKUUTTA. Eli kuinka hyvä se testi on erottelemaan terveet sairaista. Jos kyseessä olisi paska testi, niin se jakelisi testituloksia täysin sattumanvaraisesti. PPV:lla mitataan sitä, kuinka suuren osan oikeasti sairaista testi tunnistaa oikeasti sairaiksi. Tässä se on 78,7% prosenttia. Sitten kun tätä lähdetään soveltamaan todellisuuteen niin tilanne on eri ja riippuu prevalenssista. Miten tämä on niin vaikea ymmärtää!
Tuolle aineistolle mitattu PPV ei kerro mitään testin tarkkuudesta. Jos tutkittavana ois pelkästään sairaita niin kaikki positiivisen tuloksen saaneet olisi sairaita ja PPV olisi 100%. Hienoa, kylläpäs meillä on tarkka testi, joka tunnistaa kaikki sairaat oikein.
Tottakai se kertoo testin tarkkuudesta. Jos tässä tutkimuksessa TP olisi 125 ja FP olisi 0, niin silloin testin PPV olisi 125/125=1 eli 100%. Tällöin tutkittava testi tunnistaisi kaikki oikein.
Mitä se oikeastaan silloin kertoo? Tiedettiin jo, että kaikki on sairaita. Mitä lisäarvoa saadaan laskemalla todennäköisyys, että positiivisen tuloksen saanut on sairas, kun kaikki on sairaita? :D
Etkö ymmärtänyt mun vastausta. Eli jos tässä tutkimuksessa uusi lukitesti olisi luokitellut TP=125, FP=0, FN=0 ja TN=125. Niin tästä voitaisiin laskea että PPV =100% ja NPV=100% eli kyseessä olisi tarkkuudeltaan täydellinen testi, joka osaisi luokitella kaikki sairaat ja terveet oikein.
Mutta eipä ollut tämmöstä testiä, jossa 100% olisi saita jne. vaan oli se kokeessa annettu testi. Väitteesi ei koske asiaa, josta väitellään vaan jotain omaa mielikuvitus maailmaasi. Lopeta
Öö ei ollutkaan? Kuka niin väittää? Minähän vastasin tuohon viestiin, jossa väitettiin että aineistosta laskettu PPV ei muka kertoisi testin tarkkuudesta mitään. Tuolla kuvitteellisella esimerkillä havainnollistin, että tottakai se kertoo.
Vierailija kirjoitti:
Nythän voi vahvistaa vain sen ykköstoiveen.
Aivan, tämä asiaa selittää. Eli suurin osa ei vain ole päässyt ykköstoiveen paikkaan. Kuvittelisin kuitenkin, että esim. juuri Helsingin psyka olisi suuremmalla osalla ykköstoiveena niiden paikkojen saaneista, kun mitä nyt on todistusvalinnalla päässeet paikkoja vastaanottaneet. Mutta eipä paikkojen vastaanottamisen nopeus mun elämään vaikuta, kun olen joka tapauksessa jo yhden tutkinnon suorittanut hakija.
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Miksi kukaan haluaisi laskea todennäköisyyden, että positiivisen testituloksen saanut on oikeasti sairas, kun tiedetään jo kuka on sairas ja kuka ei, niinkuin tuossa tutkimusotoksessa? PPV lasketaan siksi, että voitaisiin arvioida, kuinka todennäköisesti positiivisen testituloksen saanut on oikeasti sairas eli kuinka hyvin testin tulokseen voidaan luottaa silloin kun ei tiedetä, onko tutkittava oikeasti sairas vai ei. Siksi käytetään populaation esiintyvyyttä. Oletetaan, että x osuus väestöstä on sairaita. Millä todennäköisyydellä joku testistä positiivisen tuloksen saanut todella kuuluu näihin x sairaisiin? PPV laskettuna jonkun itse päätetyn otoksen esiintyvyyden perusteella on ihan turha.
Ei hyvää päivää. Se on TUTKIMUS, jolla mitataan testin TARKKUUTTA. Eli kuinka hyvä se testi on erottelemaan terveet sairaista. Jos kyseessä olisi paska testi, niin se jakelisi testituloksia täysin sattumanvaraisesti. PPV:lla mitataan sitä, kuinka suuren osan oikeasti sairaista testi tunnistaa oikeasti sairaiksi. Tässä se on 78,7% prosenttia. Sitten kun tätä lähdetään soveltamaan todellisuuteen niin tilanne on eri ja riippuu prevalenssista. Miten tämä on niin vaikea ymmärtää!
Tuolle aineistolle mitattu PPV ei kerro mitään testin tarkkuudesta. Jos tutkittavana ois pelkästään sairaita niin kaikki positiivisen tuloksen saaneet olisi sairaita ja PPV olisi 100%. Hienoa, kylläpäs meillä on tarkka testi, joka tunnistaa kaikki sairaat oikein.
Tottakai se kertoo testin tarkkuudesta. Jos tässä tutkimuksessa TP olisi 125 ja FP olisi 0, niin silloin testin PPV olisi 125/125=1 eli 100%. Tällöin tutkittava testi tunnistaisi kaikki oikein.
Mitä se oikeastaan silloin kertoo? Tiedettiin jo, että kaikki on sairaita. Mitä lisäarvoa saadaan laskemalla todennäköisyys, että positiivisen tuloksen saanut on sairas, kun kaikki on sairaita? :D
Etkö ymmärtänyt mun vastausta. Eli jos tässä tutkimuksessa uusi lukitesti olisi luokitellut TP=125, FP=0, FN=0 ja TN=125. Niin tästä voitaisiin laskea että PPV =100% ja NPV=100% eli kyseessä olisi tarkkuudeltaan täydellinen testi, joka osaisi luokitella kaikki sairaat ja terveet oikein.
Puhuin otoksesta, jossa jokainen tutkittava on sairas
Sä et taida nyt yhtään ymmärtää mistä puhutaan. Eihän kukaan tutki testiä otoksella, jossa kaikki on sairaita????????? Kun ideana on tutkia, miten hyvin testi erottelee sairaat ja terveet toisistaan.
Se siinä oli pointtina, että tuollaisesta itse päätetystä otoksesta laskettu PPV ei kerro testin tarkkuudesta mitään
Tottakai se kertoo, mitä ihmettä oikeesti :D jos uusi lukitesti olisi luokitellut TP=0, FP=125, FN=125 ja TN=0, niin PPV =0 ja NPV =0. Eli testi luokittelisi kaikki terveet sairaiksi ja sairaiksi. Eli tarkkuudeltaan täysin käyttökelvoton testi. Ootko trolli?
Mieti nyt vielä uudestaan, mitä tarkoittaa että kaikki tutkittavat on sairaita :D
Kerropa mulle, miten sä tutkit testin tarkkuutta ja luokittelukykyä otoksella, jossa kaikki on sairaita? Kiinnostaa oikeasti tietää.
Älä jumitu tuohon :D se oli vaan hypoteettinen esimerkki. Pointtina se, että PPV heittelee ihan miten sattuu sen mukaan, kuinka suuri osuus otoksessa on sairaita. Jos tulkittaisiin testin tarkkuutta PPV:llä aineiston esiintyvyyden perusteella, niin aineisto jossa on korkea sairauden esiintyvyys antaa korkean PPV:n vaikka testissä olisikin matala sen ja spe. Voiko testiä silloin sanoa tarkaksi?
No eihän anna. Jos testi antaa paljon vääriä positiivisia laskee tuo todennäköisyys. Tässä on kyse oikeiden positiivisten suhteesta kaikkiin positiivisiin.
Ei vääriä positiivisia voi tulla paljoa, jos terveitäkään ei ole paljoa.
Baysesillä: PPV = sen x p / (sen x p + (1-p) x (1-spe).
Jos p lähenee 1, niin 1-p lähenee 0.
Jos 1-p on 0, niin (1-p) x (1-spe) on myös 0.
Jos (1-p) x (1-spe) on 0, niin kaavaan jää
sen x p / sen x p, joka on 1 oli sen tai spe mitä tahansa. Kun p taas pienenee niin PPV vastaavasti pienenee.
tp/tp+fp kaavalla esimerkiksi, jos kaikki on sairaita, ei terveitä ole ollenkaan. Silloin kaavaan jää tp/tp + 0 ja on ihan sama montako oikeaa positiivista on, kun vääriä positiivisia (sairaiksi luokiteltuja terveitä) ei ole ollenkaan. Tp/tp = 1
Joojoo miksi olisi sellainen tutkimus, jossa kaikki olisivat sairaita. Huvin vuoksi vain esimerkkinä.
Vierailija kirjoitti:
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Se mikä on lukihäiriön esiintyvyys väestössä, ei ole mitään väliä tässä. Tässä piti laskea vain lukitestille nuo arvot eli tutkimukseen osallistuneelle henkilölle. Tuota testiähän voidaan käyttää vaikka jossain erityisluokassa, jossa lukihäiriön esiintyvyys on 0,5. Tai ihan missä tahansa. Ei siinä sanottu että pitäisi laskea PPV jollekin väestöstä valitulle sattumanvaraiselle tyypille.
Vierailija kirjoitti:
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Voi siitä tulla oikaisupyyntyjä, mutta ei sillä ole mitään väliä. Aika varmasti hyväksytään artikkelissa olleella bayesin kaavalla lasketut tulokset ja luultavasti myös oikealla bayesilla lasketut. Se, että osa kuvittelee, että taulukosta olisi voinut laskea suoraan ilman prevalenssia, johtuu ainoastaan siitä, etteivät he ole ymmärtäneet lähdeartikkelia eivätkä muutenkaan ymmärrä bayesin teoreemasta mitään. Tästä ei seuraa, että tehtävän pisteytyksessä hyväksyttäisiin tuo väärä näkökulma: muutenhan pitäisi hyväksyä kaikki muutkin sellaiset väärät vastaukset, joita on vastattu paljon. Summa summarun: tehtävä ei ollut epäselvä, toiset ei vaan ole ymmärtäneet ollenkaan, mistä PPV:ssä on kyse. Totuus ja sitä kautta oikeat vastaukset eivät onneksi riipu huutoäänestyksestä.
Vierailija kirjoitti:
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Vaikka artikkelin laskukaava (ja kokeen suorat kaavat PPV:lle) oli väärä, tulisi osata korjata spesifisyys 1-spesifisyydeksi, jos ymmärtää kaavan TP/TP+FP eli sen ketkä ylipäätänsä voivat saada oikeita pos ja ketkä vääriä pos. Sen lisäksi, kun ymmärtää, että ennustearvot riippuvaisia esiintyvyydestä ja PPV = kun saa testipos, mikä nyt on tn olla sairas -> ehdollinen tn. Ja Bayesin teoreeman kaava löytyy kaavaliitteestä.
Vierailija kirjoitti:
Vierailija kirjoitti:
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Voi siitä tulla oikaisupyyntyjä, mutta ei sillä ole mitään väliä. Aika varmasti hyväksytään artikkelissa olleella bayesin kaavalla lasketut tulokset ja luultavasti myös oikealla bayesilla lasketut. Se, että osa kuvittelee, että taulukosta olisi voinut laskea suoraan ilman prevalenssia, johtuu ainoastaan siitä, etteivät he ole ymmärtäneet lähdeartikkelia eivätkä muutenkaan ymmärrä bayesin teoreemasta mitään. Tästä ei seuraa, että tehtävän pisteytyksessä hyväksyttäisiin tuo väärä näkökulma: muutenhan pitäisi hyväksyä kaikki muutkin sellaiset väärät vastaukset, joita on vastattu paljon. Summa summarun: tehtävä ei ollut epäselvä, toiset ei vaan ole ymmärtäneet ollenkaan, mistä PPV:ssä on kyse. Totuus ja sitä kautta oikeat vastaukset eivät onneksi riipu huutoäänestyksestä.
Tästä nyt huomaa, että sä et ymmärrä tuota PPV:tä. Mitä esiintyvyyttä käytetään siinä tapauksessa, että lasketaan PPV erityisluokalle, jossa lukihäiriön arvioitu esiintyvyys on 0,5? Eihän tehtävässä sanota, että PPV pitäisi laskea koko väestön esiintyvyydelle?
Sellainen pointti vielä myös tähän PPV/NPV -keskusteluun, että matala PPV:hän ei kerro suoraan testin "huonoudesta" mitään. Sitä arvoa pitää tulkita suhteessa siihen, millaisessa populaatiossa sitä on laskettu. Eli pelkkä irrallinen lukuarvo ei kerro vielä juurikaan mitään.
Jos esimerkiksi käytetään tiettyä testiä jonkun hyvin harvakseltaan esiintyvän sairauden diagnosoimiseen väestössä ja sen testin PPV on pieni, se käytännössä tarkoittaa sitä, että koska sairautta esiintyy niin vähän, vääriä positiivisia kertyy enemmän kuin sellaisessa joukossa, jossa sairautta esiintyy paljon. Se taas tarkoittaa sitä, että käytännössä testin merkitystä täytyy arvioida siinä mielessä, että tulisiko olla joku tiukka seula, jonka perusteella ohjataan ihmiset testiin kustannusten säästämiseksi. Tämähän tapahtui 2020 keväänä koronatestien kanssa. Eli pitää punnita hyödyt ja haitat suhteessa sekä kustannuksiin, että siihen, kuinka iso haitta on siitä, jos joku jääkin diagnosoimatta tiukan seulan takia. Testi ei siltikään ole välttämättä suoranaisesti huono tai epätarkka.
Minä oon ollut koko ajan tässä sen kannalla, että PPV olisi pitänyt laskea koko populaation esiintyvyydestä, mutta nyt keskustelua seuratessa oon kyllä kallistumassa siihen, että periaatteessa kumpi tahansa olisi voinut olla kokeen laatijan tarkoitus. Kyse on vaan sanamuodoista ja vivahde-eroista, kumpaa prevalenssia tässä olisi pitänyt käyttää (koko populaatio 0,1 vai tutkimusjoukko 0,5).
Tämä väittely on ollut mielenkiintoinen ja ainakin minä opin lisää prevalenssista! Kiitos siis minunkin puolesta tiukoille haastajille!
No, jos nyt mitään johtopäätöksiä voin keskustelusta tehdä, niin ainakin että tämä ROC-artikkelin sisällyttäminen materiaaleihin oli pahimman luokan moka, paitsi huonon kieliopin ja väärien kaavojen mutta myös selvästi sen sisällön monitulkintaisuuden takia..
Vierailija kirjoitti:
Sellainen pointti vielä myös tähän PPV/NPV -keskusteluun, että matala PPV:hän ei kerro suoraan testin "huonoudesta" mitään. Sitä arvoa pitää tulkita suhteessa siihen, millaisessa populaatiossa sitä on laskettu. Eli pelkkä irrallinen lukuarvo ei kerro vielä juurikaan mitään.
Jos esimerkiksi käytetään tiettyä testiä jonkun hyvin harvakseltaan esiintyvän sairauden diagnosoimiseen väestössä ja sen testin PPV on pieni, se käytännössä tarkoittaa sitä, että koska sairautta esiintyy niin vähän, vääriä positiivisia kertyy enemmän kuin sellaisessa joukossa, jossa sairautta esiintyy paljon. Se taas tarkoittaa sitä, että käytännössä testin merkitystä täytyy arvioida siinä mielessä, että tulisiko olla joku tiukka seula, jonka perusteella ohjataan ihmiset testiin kustannusten säästämiseksi. Tämähän tapahtui 2020 keväänä koronatestien kanssa. Eli pitää punnita hyödyt ja haitat suhteessa sekä kustannuksiin, että siihen, kuinka iso haitta on siitä, jos joku jääkin diagnosoimatta tiukan seulan takia. Testi ei siltikään ole välttämättä suoranaisesti huono tai epätarkka.
Minä oon ollut koko ajan tässä sen kannalla, että PPV olisi pitänyt laskea koko populaation esiintyvyydestä, mutta nyt keskustelua seuratessa oon kyllä kallistumassa siihen, että periaatteessa kumpi tahansa olisi voinut olla kokeen laatijan tarkoitus. Kyse on vaan sanamuodoista ja vivahde-eroista, kumpaa prevalenssia tässä olisi pitänyt käyttää (koko populaatio 0,1 vai tutkimusjoukko 0,5).
Tämä väittely on ollut mielenkiintoinen ja ainakin minä opin lisää prevalenssista! Kiitos siis minunkin puolesta tiukoille haastajille!
Ja sama toisin päin eli korkea PPV ei itsessään vielä kerro, että testi olisi tarkka. Se pitää suhteuttaa, että millaisesta populaatiosta eli tarkasteltavasta joukosta on kyse. Tätä selitti varmaan aiempi keskustelija sillä, että se, millaisen joukon valitsen, määrittää PPV-arvon ja kaikissa tilanteissa sen laskeminen ei ole mielekästä tai ainakaan se ei kerro mitään.
Vierailija kirjoitti:
No, jos nyt mitään johtopäätöksiä voin keskustelusta tehdä, niin ainakin että tämä ROC-artikkelin sisällyttäminen materiaaleihin oli pahimman luokan moka, paitsi huonon kieliopin ja väärien kaavojen mutta myös selvästi sen sisällön monitulkintaisuuden takia..
Ei ROC-artikkelissa minusta mitään vikaa ollut (paitsi se harmittava kaavavirhe), mutta kokeen tehtävänanto oli epäselvä.
Joo, minunkin melipide on tässä jo pariin kertaan ehtinyt muuttua tämän väittelyn aikana, mutta nyt oon sitä mieltä että piti käyttää 0,5 prevalenssia, vaikka ymmärrän että tehtävän voi periaatteessa tulkita toisinkin. En ole koskaan keskustelupalstoilla väitellyt mistään näin "verissä päin" :D
Vierailija kirjoitti:
Vierailija kirjoitti:
Tuleekohan tästä PVV ja NPV-testistä ihan hurja oikaisuvaatimusryöppy ja mitähän lie tekeevät sitten. Kuitenkin artikkelin laskukaava oli väärä, sitä ei koskaan oikaistu (esim. tehtävän annossakaan...) ja tehtävänanto on selkeästi ollut monitulkintainen suhteessa siihenkin, kumpaa prevalenssia olisi pitänyt soveltaa. Luulen, että 10%, mutta on kyllä totta, että prevalenssi muuttuu, jos valitaankin testiryhmästä joku. Näin tosin ei varmaan tehtäisi reaalimaailmassa, vaan testiä verrattaisiin vain todellisuuteen (10% esiintyvyyteen). Testiryhmälle mitattaessa NPV ja PPV ei oikein anna mitään uutta informaatiota minusta.
Se mikä on lukihäiriön esiintyvyys väestössä, ei ole mitään väliä tässä. Tässä piti laskea vain lukitestille nuo arvot eli tutkimukseen osallistuneelle henkilölle. Tuota testiähän voidaan käyttää vaikka jossain erityisluokassa, jossa lukihäiriön esiintyvyys on 0,5. Tai ihan missä tahansa. Ei siinä sanottu että pitäisi laskea PPV jollekin väestöstä valitulle sattumanvaraiselle tyypille.
Sana testille ei ole peruste laskea tutkimusaineiston esiintyvyydellä. Yhtä lailla, kun lasketaan väestön esiintyvyydellä, lasketaan PPV testille.
Itse tuosta artikkelista ymmärsin, että testin PPV kertoo, millä todennäköisyydellä testistä positiivisen saanut sai oikean positiivisen (eli juurikin tp/tp+fp) ja Bayes sopii nimenomaan tilanteeseen, jossa testiä ei ole vielä tehty, joten täytyy arvioida sairauden esiintyvyyden perusteella samaa mahdollisuutta. Testin tekemisen jälkeen PPV voidaan laskea "päivitetyn prevalenssin" perusteella, mutta mielestäni artikkelissa ei selkeästi kuvattu, miten tällainen laskettaisiin muuten kuin 2x2-taulukosta.
Voin olla väärässäkin, koska nää perustuu omiin tulkintoihin artikkelista. En käynyt valmennuskursseja ja pitää myöntää, että jos tuo tp/tp+fp -kaava paljastuu oikeaksi laskutavaksi, niin olen kyllä vähän vahingoniloinen, jos valmennuskursseilla tosiaan tuota Bayesin kaavaa on korostettu niin paljon, ettei artikkelissa varsin selkeästi ilmaistua 2x2-taulukon PPV:n laskutapaa ole koettu olennaiseksi esiin nostettavaksi. Mielestäni se esitettiin artikkelissa pätevänä laskukaavana juuri kokeen tehtävänantoakin vastaavassa tilanteessa (testi on jo tehty ja halutaan selvittää, millä todennäköisyydellä siitä positiivisen saanut on oikeasti sairas). 2x2-kaavan laskemista puoltaa myös se, että Bayesin virheellistä kaavaa ei missään välissä korjattu ja kokeen kaavaliitteessäkin se oli vain erilaisissa väärissä muodoissa.
Mutta lopulta taitaa olla turha väitellä tästä, heinäkuussa selviää mikä oli oikein! Itse kuitenkin 2x2-taulukkoon päädyin omalla artikkelin melko kirjaimellisella tulkinnalla ja vähäisellä tilasto-osaamisella.
Kävitkö maksullisen valmennuskurssin?
Peukku ylös = kävin
Peukku alas = en käynyt
Haittaakohan, jos tossa ekassa tehtävässä vastauksen ilmaisi muodossa (esim) 00,800? Luulin jostain syystä, että ne kaikki ruudut pitää täyttää...
Oli hauska väitellä vähän aikaa, mutta nyt on aika jäädä kesälomalle :D Palaan sitten tulosten julkaisun jälkeen kertomaan, että mitäs minä sanoin :D no ei, kiitos keskusteluista!