Tapahtumat

Kun kirjaudut sisään näet tässä ilmoitukset sinua kiinnostavista asioista.

Kirjaudu sisään

Psykologia 2021

Vierailija
10.07.2020 |

Tervetuloa traditionaaliseen, legendaan jo syntyessään, Vauvan Psykologia 2021 -ketjuun!
Täällä puhutaan hakemisesta opiskelemaan psykologiaa yliopistoon, ei vauvoista eikä kehityspsykologiasta.

Psykologiaa voi opiskella Helsingissä, Turussa, Tampereella, Jyäskylässä ja Joensuussa sekä ruotsiksi Åbo Akademissa.
Helsingissä on lisäksi psykologiksi valmistava maisterihaku, johon on hakukelpoinen alemmalla korkeakoulututkinnolla ja psykologian perus- ja aineopinnoilla.
Jyväskylässä on lisäksi avoimen väylä filosofian maisteriksi pääaineena psykologia. Siitä ei pätevöidy psykologiksi, mutta pääsee tutkijaksi, opettajaksi, HR:ään tai konsultiksi.
Tutustu avoimien yliopistojen tarjontaan! Joensuun avoimesta löytyy työ- ja organisaatiopsykologia sekä oikeuspsykologia.

Psykologia on lääkiksen jälkeen yksi vaikeimmista aloista päästä sisään, vaikeampi kuin oikis tai kauppis. Todistusvalinnassa saa pisteitä 5 aineesta: psykologia, äidinkieli, matematiikka, kieli, muu reaali. Eniten pisteitä reaalissa antaa fysiikka, vähiten terveystieto. Vanhanmallisesta yleisreaalista ei saa yhtään pistettä.

Vuoden 2020 todistusvalinna pisterajat toukokuussa (70 % kiintiö, ei sisällä lisäpaikkoja, ensikertalaiset, max 157,9 p):

Helsinki: 140,9
Turku: 135,6
Tampere: 135,6
Jyväskylä: 131,9
Joensuu: 129,1

130 pistettä saa E-rivillä, jossa pitkä matikka. Helsinkiin tarvittiin 2-3 L.

Pääsykokeessa on tyypillisesti (ei kevät 2020, vaikka tarkoitus oli) vaadittu vahvaa tilastomenetelmien osaamista.

Vanhoja pääsykoekirjoja:
- Nummenmaa, L. Holopainen, M. & Pulkkinen, P., Tilastollisten menetelmien perusteet.
- Nummenmaa, L., Käyttäytymistieteiden tilastolliset menetelmät
- Karjalainen, L., Tilastotieteen perusteet

Vanhoja valintakokeita (loogista päättelyä myös logopediassa ja tietojenkäsittelytieteessä)
https://www.helsinki.fi/fi/opiskelijaksi/yhteishaku/tietoa-valintakokei…

Tärkeitä / usein esiintyviä linkkejä

Yhteisvalinnan tiedotussivu
https://www.helsinki.fi/fi/verkostot/psykologian-yhteisvalinta/

Lisäpaikkoja vuodelle 2021
https://www.psykologilehti.fi/psykologi/tyo/kymmenia_lisaaloituspaikkoj…

Todistuksen pisteytys
https://opintopolku.fi/wp/opo/korkeakoulujen-haku/mika-korkeakoulujen-o…

VIPUNEN (hakijamäärät ja valitut)
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…

Kaikki pisterajat valintatavoittain
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…

Hakijoiden ja sisäänpäässeiden ylioppilastutkintomenestys
graafinen
https://app.powerbi.com/view?r=eyJrIjoiYzYwOWYyOWMtNTllZC00MzU1LTk2OWIt…

taulukko
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/K…

valmiiksi analysoituna tekstinä
https://tilastoneuvos.vipunen.fi/2020/01/20/korkeakoulutukseen-paasseid…

Aikaisempien vuosien ketjuja:

2020 koronakevät ja AMK-valintakoe
https://www.vauva.fi/keskustelu/3496665/psykologia-2020

2019 valintakoeyhteistyövuosi
https://www.vauva.fi/keskustelu/3217889/psykologia-2019

2018 erilaiset kokeet HTT ja J ja J
https://www.vauva.fi/keskustelu/3067511/psykologia-2018

2017 ensimmäinen löytynyt ketju
https://www.vauva.fi/keskustelu/2753394/psykologia-2017-muita-hakijoita

Kommentit (8033)

Vierailija
4181/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Tulisipa psykologian kokeestakin tällainen sähköpostiviesti koskien kaikkia kokeen virheitä:

"Kasvatusalan valtakunnallinen valintakoe nk. VAKAVA-koe järjestettiin eilen 27.5. yhdeksällä paikkakunnalla. Kaksi tuntia kokeen alkamisen jälkeen kokeen ohjeistuksissa huomattiin virhe. Tehtävän 10 oli kokeessa kerrottu koskevan vain toista aineistona olleista artikkeleista, vaikka se koski molempia artikkeleita. Tämän jälkeen koesaleissa kuulutettiin korjaus koeohjeisiin liittyen.

Tänään kuitenkin kävi ilmi, että Oulun yliopistossa oli kuulutettu lisäksi, että kyseinen tehtävä jätetään arvostelematta. Näin ollen Oulussa kokeen tehneet olivat jättäneet tehtävän tekemättä. Tästä syystä kyseinen tehtävä kaikkine alakohtineen on pakko poistaa arvostelusta kokonaan. Ikävä kyllä muilla koepaikkakunnilla hakijat käyttivät aikaa kyseisen tehtävän ratkaisemiseen.

Pahoittelemme tapahtunutta inhimillistä virhettä!

Ystävällisin terveisin Kasvatusalan valintayhteistyöverkosto"

Siis onhan tämäkin nyt aivan tähtitieteellisen hirveä ja anteeksiantamaton moka kokeen järjestäjältä. Miten noin voi käydä?! Hakijoita on runnottu nyt jo toista vuotta ihan huolella ja meno vaan muuttuu hullummaksi koko ajan. Itse en tule osallistumaan enää yhteenkään tällaiseen naurettavaan pääsykoesirkukseen, vaan palaan lukion penkille kolmatta kertaa hiomaan sen todistuksen niin vatun timanttiseksi, että oksat pois. 

Kannattaa ehdottomasti panostaa ennemmin todistusvalintaan! Viime vuoden pääsykoesekoilun takia multa meni niin maku kaikkeen tohon p*skaan että panostin suosiolla kirjoituksiin tänä vuonna, vaikka pitikin kirjoittaa 4 ainetta uudestaan. Kannatti, pääsin sisäänkin ja hermot todellakin säästyivät. Yo-kirjoitukset on todella hyvin järjestetyt ja toimivat hienosti kaikin puolin, plus koeaika ja valmistautumisaika on paljon inhimillisemmät. Lisäksi valintakiintiö on 60%. Kaikille joilla on ensikertalaisuus tallella niin ihan ehdottomasti suosittelen todistusväylää.

Vierailija
4182/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Aika moneen aineeseen pisteet nousivat ihan sikana viime keväästä.

Ollaan parin vuoden päästä siinä pisteessä, että perusabit eivät pääse papereilla minnekään, koska kaikki paikat menevät korottajille. Abi tarvitse ällärivin päästäkseen kouluun.

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla
Vierailija
4183/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Vierailija
4184/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Noi on aivan järkyttäviä noi pääsykoesekoilut! Käsittämätöntä! Miten tosta 2014 maailmanpolitiikan kokeestakaan ei opittu mitään?! Luulisi että ne tarkastaisivat useampaan kertaan kaikki kokeet ennen koetilaisuutta, no ilmeisesti ei kiinnosta pätkääkään kun näitä virheitä tapahtuu aina uudelleen. Myös 2019 filosofian kokeessa oli sama juttu, että yksi esseetehtävistä oli väärästä kirjasta ja lopulta pidettiin kokonaan uusi koe. Viime vuoden koronasekoilu oli myös aivan järkyttävää, tietysti vieläpä eniten meille psykan hakijoille. Mutta toi tän vuotinen vakava-juttu on kyllä pahin kaikista! Toivottavasti yliopistoille lähtee nyt kunnolla vihaista palautetta että tulee joku roti siihen toimintaan!

Vierailija
4185/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Turku 2022, psykologian, logopedian ja folkloristiikan yhteisvalinta: Kaikki joilla on ruotsinkielinen sukunimi tekevät kokeen Kårenilla samalla kun siellä on bändikilpailun finaali. Kaikki joiden nimi viittaa luontoon tekevät kokeen syksyllä hirvestysaikaan Vakka-Suomen metsissä. Kaikki joiden nimi ei tarkoita mitään tekevät kokeen Topinojan kaatopaikalla. Kruskal-Wallisit, Youdenit ja Puolalalakanahot pääsevät messukeskukseen. Freudit ja Jungit tekevät kokeen "tois puol jokkee".

Unohdit kulttuuriantropologit, joiden vuoksi kokeeseen on lisätty pari artikkelia Samoan alkuperäiskansojen historiasta  ja fysiikan osaston. Fysiikan vuoksi olemme opiskelleet valmennuskeskuksessa kaiken yhtälön.https://futurism.com/_next/image?url=https%3A%2F%2Fwp-assets.futurism.c…

jes alotin opettelemaan tuota kaavaa ulkoa jo viime syksynä. Pakko muistaa kunnolla itse, kun kokeessa saatavassa kaavaluettelossa saattaa olla vääriäkin kaavoja. 

Vierailija
4186/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Tehtävä, jota tämän palstan parviälykään ei osaa kokeen jälkeen rauhassa tehdä, on liian vaikea ja epäonnistunut.

Sisältö jatkuu mainoksen alla
Vierailija
4187/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Toivottavasti Ouluun pääsisi paljon pohjoisessa asuvia, koska he todennäköisesti jäisivät pohjoiseen töihin. Siellä psykologipula valtava.

Vierailija
4188/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Aika moneen aineeseen pisteet nousivat ihan sikana viime keväästä.

Ollaan parin vuoden päästä siinä pisteessä, että perusabit eivät pääse papereilla minnekään, koska kaikki paikat menevät korottajille. Abi tarvitse ällärivin päästäkseen kouluun.

Siinäpä sitten on taas opetus- ja kulttuuriministeriölle vähän pähkinää purtavaksi, että millainen järjetön uudistus vielä kehiteltäis. 

Sisältö jatkuu mainoksen alla
Vierailija
4189/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Noi on aivan järkyttäviä noi pääsykoesekoilut! Käsittämätöntä! Miten tosta 2014 maailmanpolitiikan kokeestakaan ei opittu mitään?! Luulisi että ne tarkastaisivat useampaan kertaan kaikki kokeet ennen koetilaisuutta, no ilmeisesti ei kiinnosta pätkääkään kun näitä virheitä tapahtuu aina uudelleen. Myös 2019 filosofian kokeessa oli sama juttu, että yksi esseetehtävistä oli väärästä kirjasta ja lopulta pidettiin kokonaan uusi koe. Viime vuoden koronasekoilu oli myös aivan järkyttävää, tietysti vieläpä eniten meille psykan hakijoille. Mutta toi tän vuotinen vakava-juttu on kyllä pahin kaikista! Toivottavasti yliopistoille lähtee nyt kunnolla vihaista palautetta että tulee joku roti siihen toimintaan!

Mulla on jos sellainen sopivan alistuva, pitkä ja seikkaperäinen analyysi kokeen kieliasusta luonnoskansiossa valmiina. 

Vierailija
4190/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Sisältö jatkuu mainoksen alla
Vierailija
4191/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Ärsyttääkö muitakin toi prevalenssi-sana? Miksi ei voida puhua esiintyvyydestä, sitä se kuitenkin tarkoittaa.

Vierailija
4192/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.

Sisältö jatkuu mainoksen alla
Vierailija
4193/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

https://online.stat.psu.edu/stat507/lesson/10/10.3

Tässä on ihan kuvien avulla havainnollistettu, miten prevalenssi vaikuttaa testin positiiviseen ja negatiiviseen ennustearvoon.

Vierailija
4194/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.

Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.

Sisältö jatkuu mainoksen alla
Vierailija
4195/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.

Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.

Ei tehtävän annossa sanota niin.

Vierailija
4196/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Milloin mahtaa olla se vuosi, kun kaikki paikat joudutaan arpomaan koska inhimillinen tai tekninen virhe alkuperäisissä valintatavoissa?

Vierailija
4197/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Tää ei lopu koskaan. :) Ei lukitestille voi laskea mitään PPV-arvoa ilman määrättyä joukkoa, jolle testi tehdään. Mikä oli tehtävänannon perusteella tuo määrätty joukko? En todellakaan tiedä.

Se "määrätty joukko" on ne 250 henkilöä, jotka osallistuivat testiin.

Ei tehtävän annossa sanota niin.

Miten niin ei sanota? Aivan selvästihän siinä kerrotaan, että testin suoritti 250 henkilöä, joista 125 oli lukihäiriö ja 125 ei ollut. Tällä joukolla testattiin tuota testiä.

Vierailija
4198/8033 |
28.05.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Mua hämää tää PPV tosi paljon, en osaa sanoa kumpi tapa nyt on oikein lopulta. Mitä järkeä olisi valita otos, joka ei vastaa väestön prevalenssia?

Kun halutaan tutkia testin hyvyyttä, täytyy tietenkin valita otos, jossa testattavaa asiaa esiintyy. Joidenkin sairauksien esiintyvyys voi olla vaikka 0,1 prosenttia, joten otoksen pitäisi olla 1000 ihmistä, jotta saataisiin mahdutettua yksi sairas mukaan. Eikä se antaisi kovin luotettavaa käsitystä sensitiivisyydestä. Paras arvio sensitiivisyydelle saadaan, kun otoksessa kaikki ovat sairaita ja paras arvio spesifisyydelle, kun kaikki ovat terveitä, joten tuollainen 50/50 testiryhmä testin tutkimiseen on lopulta paras.

Kun kysyttiin PPV:tä, tutkitaan tietenkin väestön yksilöä, eikä testin testaamiseen osallistunutta, koska testiin osallistuneiden lukihäiriödiagnoosi tunnetaan jo entuudestaan. Lisäksi kannattaa kiinnittää huomiota siihen, että a- ja b-kohdissa sanotaan erikseen "TESTIN sensitiivisyys/spesifisyys" kun taas ppv:n ja npv:n yhteydessä ei.

Sokeista kuuntelijoista veikkaan, että kyseisen tehtävän on tehnyt ruotsinkielisen valintakokeen tekijät ja kääntäminen on mennyt päin helvettiä, koska tosiaankaan d tai e eivät ole totta. Tästä varmasti seuraa, että tehtävä hylätään. ROCin osalta on kiinnostava nähdä, miten ppv arvioidaan vai hylätäänkö sekin. Ei kannata unohtaa, että siinä on mahdollista hyväksyä sekä virheellisellä bayesin kaavalla että oikealla lasketut arvot. Suoraan testituloksista, ilman 10 prosentin prevalenssia laskettuja ei kuitenkaan tulla hyväksymään, siitä olen varma.

No kerropas sitten, millaisessa tilanteessa PPV lasketaan 2x2 taulukosta lukumääristä?

Selvitin asiaa ja sain nyt ihan sellaisen rautalankamallin avulla pähkäiltyä, miten PPV ja NPV voidaan laskea 2x2 taulukosta kaavalla TP / (TP + FP) ilman, että taudin esiintyvyyttä tarvitsee mahduttaa samaan kaavaan. Bayesia ei myöskään tarvitse.

Tehtävän 1 kohtien a) ja b) ratkaisemisen jälkeen tiedossa oli lukihäiriön esiintyvyys väestössä (10%), testin sensitiivisyys (0,84) ja testin spesifisyys (0,76). Tämän jälkeen PPV voidaan laskea muodostamalla uusi 2x2 taulukko uusien tietojemme perusteella. Koska kuitenkin tiedetään, että PPV:hen vaikuttaa taudin esiintyvyys väestössä, uudessa 2x2 taulukossa esiintyvyys täytyy myös huomioida.

Otetaan esimerkiksi 1000 henkilön otos väestöstä. Siitä tiedämme, että oikeasti lukihäiriöisten osuus on 100 henkilöä, ja oikeasti terveiden osuus on 900 henkilöä, sillä taudin esiintyvyys on 10%. Näin ollen:

Oikeiden positiivisten osuus (TP) on sensitiivisyys * 100 henkilöä = 0,84 * 100 = 84

Oikeiden negatiivisten osuus (TN) on spesifisyys * 900 henkilöä = 0,76 * 900 = 684

Väärien positiivisten osuus (FP) on (1 - spesifisyys) * 900 henkilöä = 0,24 * 900 = 216

Väärien negatiivisten osuus (FN) on (1 - sensitiivisyys) * 100 henkilöä = 0,16 * 100 = 16

Tästä voimmekin sitten laskea PPV:n kaavalla TP / (TP + FP) = 84 / (84 + 216) = 0,28

Samaan vastaukseen päästään myös aineiston 2x2 taulukosta, jos kaavaan otetaan mukaan esiintyvyys 10%, eli PPV = 0,1 * 105 / (0,1 * 105 + 0,9 * 30) = 0,28. Laskemiseen voi käyttää myös Bayesin oikeaa kaavaa, jossa ei lasketa 2x2 taulukon arvoilla, vaan suoraan sensitiivisyydellä ja spesifisyydellä.

Eli uskoisin oikean vastauksen tehtävään 1 d) olevan 0,28 tai 0,280.

Joo, sä ajattelet tämän liian monimutkaisesti. Minäkin menin hetkeksi tuohon lankaan, että populaatio pitäisi ottaa huomioon, mutta ei sitä tarvitse. Tuossa lasketaan vain sen testin PPV. Testin positiivista ennustearvoa voi sitten lähteä testaamaan erilaisissa populaatioissa, kuten tuolla 10% esiintyvyydellä. Mutta sitä ei tässä kysytty. Tässä varmaan hämää se, kun kyseessä on lukihäiriö, eikä sairaus. Korona on hyvä esimerkki. Koronan esiintyvyys viimeisen vuoden aikana on valtavasti vaihdellut Suomessa. Tämän takia PPV ja NPV ovat heikkoja mittareita testin tarkkuuden arvioimiseen, koska ne ovat niin sidoksissa esiintyvyyteen. Sehän oli sen artikkelinkin pointti, että ROC-käyrä on hyvä keino testin tarkkuuden arvioimiseen mm. juuri sen takia, että siinä ei tarvitse huomioida taudin esiintyvyyden vaikutusta testin tarkkuuteen. Eli PPV ja NPV ovat heikkoja mittareita, koska ne ovat niin riippuvaisia prevalenssista.

Voi olla, että ajattelenkin :)

Wikipedia kuitenkin sanoo esimerkiksi, että "In case-control studies the PPV has to be computed from sensitivity, specificity, but also including the prevalence"

https://en.wikipedia.org/wiki/Positive_and_negative_predictive_values

Eikö aineiston tilanne ollut juuri case-control-study, jossa oli 250 tutkittavaa, jotka oli jaettu terveiden ja lukihäiriöisten ryhmiin? Näin ollen esiintyvyys täytyy ottaa huomioon PPV:tä laskiessa.

Vierailija
4199/8033 |
29.05.2021 |
Näytä aiemmat lainaukset

Joo, mutta se prevalenssi on ikään kuin "leivottu sisään" jos lasketaan 2x2 taulukosta. PPV on edelleen oikeiden positiivisten osuus kaikista positiivisista, kuten kaavakin kertoo (TP/TP÷FP). Tämä kaavahab oiisi täysin turha ja vajaa, jos p pitäisi lisätäberikseen.

Vierailija
4200/8033 |
29.05.2021 |
Näytä aiemmat lainaukset

" In the above example, if the group of people tested had included a higher proportion of people with bowel cancer, then the PPV would probably come out higher and the NPV lower. If everybody in the group had bowel cancer, the PPV would be 100% and the NPV 0%.

To overcome this problem, NPV and PPV should only be used if the ratio of the number of patients in the disease group and the number of patients in the healthy control group used to establish the NPV and PPV is equivalent to the prevalence of the diseases in the studied population, or, in case two disease groups are compared, if the ratio of the number of patients in disease group 1 and the number of patients in disease group 2 is equivalent to the ratio of the prevalences of the two diseases studied"

Mä ymmärrän nyt tuosta, ettei tuolla meidän aineistolla edes ole mielekästä laskea PPV:tä ja NPV:tä. Luin siis jonkun linkkaamaa wikiä. Mitä uhnettä. Oon silti sen kannalla, eträ 0,10 prevalenssia täs haettiin.

Kirjoita seuraavat numerot peräkkäin: kahdeksan kaksi seitsemän