Tapahtumat

Kun kirjaudut sisään näet tässä ilmoitukset sinua kiinnostavista asioista.

Kirjaudu sisään

Psykologia 2021

Vierailija
10.07.2020 |

Tervetuloa traditionaaliseen, legendaan jo syntyessään, Vauvan Psykologia 2021 -ketjuun!
Täällä puhutaan hakemisesta opiskelemaan psykologiaa yliopistoon, ei vauvoista eikä kehityspsykologiasta.

Psykologiaa voi opiskella Helsingissä, Turussa, Tampereella, Jyäskylässä ja Joensuussa sekä ruotsiksi Åbo Akademissa.
Helsingissä on lisäksi psykologiksi valmistava maisterihaku, johon on hakukelpoinen alemmalla korkeakoulututkinnolla ja psykologian perus- ja aineopinnoilla.
Jyväskylässä on lisäksi avoimen väylä filosofian maisteriksi pääaineena psykologia. Siitä ei pätevöidy psykologiksi, mutta pääsee tutkijaksi, opettajaksi, HR:ään tai konsultiksi.
Tutustu avoimien yliopistojen tarjontaan! Joensuun avoimesta löytyy työ- ja organisaatiopsykologia sekä oikeuspsykologia.

Psykologia on lääkiksen jälkeen yksi vaikeimmista aloista päästä sisään, vaikeampi kuin oikis tai kauppis. Todistusvalinnassa saa pisteitä 5 aineesta: psykologia, äidinkieli, matematiikka, kieli, muu reaali. Eniten pisteitä reaalissa antaa fysiikka, vähiten terveystieto. Vanhanmallisesta yleisreaalista ei saa yhtään pistettä.

Vuoden 2020 todistusvalinna pisterajat toukokuussa (70 % kiintiö, ei sisällä lisäpaikkoja, ensikertalaiset, max 157,9 p):

Helsinki: 140,9
Turku: 135,6
Tampere: 135,6
Jyväskylä: 131,9
Joensuu: 129,1

130 pistettä saa E-rivillä, jossa pitkä matikka. Helsinkiin tarvittiin 2-3 L.

Pääsykokeessa on tyypillisesti (ei kevät 2020, vaikka tarkoitus oli) vaadittu vahvaa tilastomenetelmien osaamista.

Vanhoja pääsykoekirjoja:
- Nummenmaa, L. Holopainen, M. & Pulkkinen, P., Tilastollisten menetelmien perusteet.
- Nummenmaa, L., Käyttäytymistieteiden tilastolliset menetelmät
- Karjalainen, L., Tilastotieteen perusteet

Vanhoja valintakokeita (loogista päättelyä myös logopediassa ja tietojenkäsittelytieteessä)
https://www.helsinki.fi/fi/opiskelijaksi/yhteishaku/tietoa-valintakokei…

Tärkeitä / usein esiintyviä linkkejä

Yhteisvalinnan tiedotussivu
https://www.helsinki.fi/fi/verkostot/psykologian-yhteisvalinta/

Lisäpaikkoja vuodelle 2021
https://www.psykologilehti.fi/psykologi/tyo/kymmenia_lisaaloituspaikkoj…

Todistuksen pisteytys
https://opintopolku.fi/wp/opo/korkeakoulujen-haku/mika-korkeakoulujen-o…

VIPUNEN (hakijamäärät ja valitut)
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…

Kaikki pisterajat valintatavoittain
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/H…

Hakijoiden ja sisäänpäässeiden ylioppilastutkintomenestys
graafinen
https://app.powerbi.com/view?r=eyJrIjoiYzYwOWYyOWMtNTllZC00MzU1LTk2OWIt…

taulukko
https://vipunen.fi/fi-fi/_layouts/15/xlviewer.aspx?id=/fi-fi/Raportit/K…

valmiiksi analysoituna tekstinä
https://tilastoneuvos.vipunen.fi/2020/01/20/korkeakoulutukseen-paasseid…

Aikaisempien vuosien ketjuja:

2020 koronakevät ja AMK-valintakoe
https://www.vauva.fi/keskustelu/3496665/psykologia-2020

2019 valintakoeyhteistyövuosi
https://www.vauva.fi/keskustelu/3217889/psykologia-2019

2018 erilaiset kokeet HTT ja J ja J
https://www.vauva.fi/keskustelu/3067511/psykologia-2018

2017 ensimmäinen löytynyt ketju
https://www.vauva.fi/keskustelu/2753394/psykologia-2017-muita-hakijoita

Kommentit (8033)

Vierailija
5661/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

Miksi hullua? Nimenomaanhan ”hän halusi testin, jolla…” Silloinhan todellakin kyse on siitä toimiiko testi oikeasti diagnostisena arviona.

Ajattele sitä perus todennäköisyyslaskuna:

- Tiedetään, että lastentarhassa 10% palloista on mustia ja 90% valkoisia

- Otat laatikosta, jossa pallot ovat jakautuneet 50%-50% mustiin ja valkoisiin, yhden pallon.

- Voitko tuolloin soveltaa 10% esiintyvyyttä, vaikka se olisikin koko lastentarhassa vallitseva tilanne?

Jos testin diagnostista pätevyyttä sovelletaan koko väestöön, niin tottakai 10% pitää kutinsa. 

Jos testiä testataan otosporukkaan, niin siinä on eri esiintyvyys. Rajatusta otoksesta poimitulle henkilölle on siis hullua soveltaa 10% todennäköisyyttä, koska se ei pidä paikkaansa. 

Vierailija
5662/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

0,1xTP/(0,1×Tp) + (0,9×Fp) antaa samam tuloksen kuin Bayes. Ajattelen näin, mutta voin olla väärässäkin:

Kaikista positiivisista tuloksista halutaan selvittää ne, joilla sairaus/häiriö on. Keitä nämä sitten ovat? Se 10% (0,1), joilla häiriö on ja jotka saavat pos tuloksen (105).

Entä ketkä kaikki saavat pos tuloksen? Edellä mainittujen lisäksi se 90% (0,9), joka ei todellisuudessa kärsi häiriöstä, mutta jotka saavat väärän positiivisen tuloksen (30).

Bayesilla: 0,1x0,84(sen)/0,1x0,84 + 0,9x0,24 (1-spes) = 0,28

Prevalenssi liitettynä taulukon lukuihin:

0,1x105/0,1×105+0,9×30=0,28

En ole tarpeeksi hyvä matematiikassa sanoakseni varmuudella, ettei kyseessä ole sattuma, mutta epätodennäköiseltä se minusta tuntuu.

Tämä logiikka pohjautuu todennäköisyyslaskentaan. Ja PPV ja NPV voitaisiin hyvin laskea puhtaasti todennäköisyyslaskennan perusteella (Bayes-kaavahan on johdettu todennäköisyydestä), kun tiedetään, että ennustearvot ovat todennäköisyyksiä (tämä kerrotaan artikkelissa). Mutta tässä ns. kaavassa, joka ei oikeastaan ole kaava, vaan on lähdetty rakentamaan todennäköisyyslaskua, on sellainen virhe, että TP:n ja FP:n tilalla pitäisi olla TPF ja FPF, silloin se menisi todennäköisyyslaskun periaatteella. Nyt kun otokset ovat saman kokoiset, sieltä supistuu nimittäjät pois ja se tulee tuohon muotoon, niin kuin kirjoitit. Periaatteessa kokeessa voi vaatia todennäköisyyslaskennan perusteiden ymmärtämistä ja myös periaatteessa artikkelin tekstin perusteella voisi myös olettaa hakijan ymmärtävän, että ennustearvot voi laskea todennäköisyytenä. (Mikä taas pitäisi osata lukiotietojen perusteella ihan yhtä lailla kuin tuo logiikkaosuuskin, joka ei mitenkään sisälly ennakkomateriaaleihin.)

MUTTA: en ole vakuuttunut, että kokeen tekijä hakee tässä sitä, että lähdetään tekemään todennäköisyyslaskua.

Uskon, että jos tuo väestön esiintyvyys piti ottaa huomioon, se pitäisi tehdä Bayesilla. Josta taas oli artikkelissa virheellinen kaava.

Minusta ei tällä tehtävänannolla ole kovin viisasta olla kovin varma kumpaankaan suuntaan. Voi olettaa ja toivoa, että tehtävässä on haettu sitä tapaa, jota itse on sattunut käyttämään, mutta varma ei voi olla.

Odotan kyllä mielenkiinnolla oikeita vastauksia!

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla
Vierailija
5663/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Mun mielestä tossa tehtävänannossa merkittävää on tuo sana "todellisuudessa", koska todellisuudessa 10% väestössä on lukihäiriö, ja siksi itse huomioin sen ja laskin bayesillä.

Vierailija
5664/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

Miksi hullua? Nimenomaanhan ”hän halusi testin, jolla…” Silloinhan todellakin kyse on siitä toimiiko testi oikeasti diagnostisena arviona.

Ajattele sitä perus todennäköisyyslaskuna:

- Tiedetään, että lastentarhassa 10% palloista on mustia ja 90% valkoisia

- Otat laatikosta, jossa pallot ovat jakautuneet 50%-50% mustiin ja valkoisiin, yhden pallon.

- Voitko tuolloin soveltaa 10% esiintyvyyttä, vaikka se olisikin koko lastentarhassa vallitseva tilanne?

Jos testin diagnostista pätevyyttä sovelletaan koko väestöön, niin tottakai 10% pitää kutinsa. 

Jos testiä testataan otosporukkaan, niin siinä on eri esiintyvyys. Rajatusta otoksesta poimitulle henkilölle on siis hullua soveltaa 10% todennäköisyyttä, koska se ei pidä paikkaansa. 

Aivan, toi 10 % on turhaa tietoa.

Jos kaikki tarhan pallot olisivat samassa laatikossa, ei vieläkään tarvittaisi Bayesia, että voitaisiin laskea todennäköisyys kumpi pallo sieltä tulee, mutta tarvittaisiin kyllä tuota 10 %.

Vierailija
5665/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Mun mielestä tossa tehtävänannossa merkittävää on tuo sana "todellisuudessa", koska todellisuudessa 10% väestössä on lukihäiriö, ja siksi itse huomioin sen ja laskin bayesillä.

Ei tarkoita sitä, vaan true positivea,

Vierailija
5666/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

No tottakai noudattaa! Myös testiin osallistunut henkilö on osa populaatiota.

Sisältö jatkuu mainoksen alla
Vierailija
5667/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

No tottakai noudattaa! Myös testiin osallistunut henkilö on osa populaatiota.

Eli sun mielestä voidaan todeta, että vankilassa oleva henkilö on yhtä todennäköisesti murhaaja kuin mitä väestöstä satunnaisesti poimittu henkilö, koska koko väestössä murhaajia on arviolta x % ja vankilassa olevat ihmisetkin kuuluvat koko väestöön? 

Vierailija
5668/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Populaatio on kohderyhmä, johon liittyviä päätelmiä tutkimuksessa pyritään tekemään. Sitä varten kerätään otos, joka voi olla mahdollisimman samanlainen kuin populaatio, mutta myös erilainen, tilanteesta riippuen. Populaatio riippuu myös tutkimuksesta, mutta lukivaikeuden arvioimisen kohdalla on minusta ihan loogista, että ollaan kiinnostuneita koko väestöstä. Varsinkin kun lukivaikeuden esiintyvyys väestössä on erikseen mainittu tehtävän lähtöoletuksena. Esimerkiksi, jos tutkittaisiin sairautta, jota esiintyy vain naisilla, olisi taas mielekkäämpää ottaa pelkästään naiset tutkimuskohteeksi.

Pointtina on, että tutkimuksiin kerätään otos, jonka avulla pyritään tekemään kohderyhmään liittyviä päätelmiä. Kokeen tehtävässä sensitiivisyys ja spesifisyys saadaan laskettua hyvin tuolla otoksella. Koska esiintyvyys ei vaikuta niihin, niitä voidaan myös soveltaa kohderyhmään eli tässä tilanteessa väestöön. Ennustearvojen laskeminen suoraan tuosta otoksesta on taas minusta ristiriidassa kohderyhmään liittyvien päätelmien tekemisen kanssa, varsinkin kun populaation esiintyvyys oli selvästi tiedossa.

Lukiko tätä kukaan :D miettikää mikä sen otoksen idea on

Sisältö jatkuu mainoksen alla
Vierailija
5669/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

No tottakai noudattaa! Myös testiin osallistunut henkilö on osa populaatiota.

Eli sun mielestä voidaan todeta, että vankilassa oleva henkilö on yhtä todennäköisesti murhaaja kuin mitä väestöstä satunnaisesti poimittu henkilö, koska koko väestössä murhaajia on arviolta x % ja vankilassa olevat ihmisetkin kuuluvat koko väestöön? 

Wau, hyvä sinä! Nyt tuli selkeä rautalankaesimerkki! :)

Vierailija
5670/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Sisältö jatkuu mainoksen alla
Vierailija
5671/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Otos itsessään ei ole kiinnostava, vaan otosta käytetään apuna päätelmien tekemiseen populaatiosta, koska harvoin on mahdollista tutkia koko populaatiota.

Vierailija
5672/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Sisältö jatkuu mainoksen alla
Vierailija
5673/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Otokset harvoin demonstroivat koko väestöä. Ei ole erityisen hedelmällistä tutkita yhdeksäänkymmentä tervettä jokaista kymmentä sairasta kohti, koska valtaosa tutkimusresurssista menee silloin hukkaan, terveiden tutkimiseen.

Siksi muodostetaan sairaiden koeryhmä ja otetaan siihen verrokkiryhmäksi terveiden ryhmä.

Vierailija
5674/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

"PPV can only be calculated from a 2 × 2 table if the prevalence [P(Disease present) = number of people with disease/number of people in population (or sample)] in the table is the same as that in the population. Typically the reason the prevalence in a 2 × 2 table does not reflect the population prevalence is because the table is based on case-control data in which a specified number of cases (patients with disease) and controls (patients without disease) are studied for the purpose of finding associations."

(https://academic.oup.com/nop/article/2/4/162/2460002)

Sisältö jatkuu mainoksen alla
Vierailija
5675/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Juuri tämän takia kysyin tämän kysymyksen, koska arvelin että bayesilaiset eivät ole ymmärtäneet koko asiaa. Ei tietenkään tutkimusryhmän otoskokoa valita sen mukaan, mikä on esiintyvyys väestössä! Miten tutkit sairautta, jonka esiintyvyys väestössä on 0,1%? Valitsemalla otoksen, jossa on 1 sairas ja 999 tervettä? Niinkö?

Vierailija
5676/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Otokset harvoin demonstroivat koko väestöä. Ei ole erityisen hedelmällistä tutkita yhdeksäänkymmentä tervettä jokaista kymmentä sairasta kohti, koska valtaosa tutkimusresurssista menee silloin hukkaan, terveiden tutkimiseen.

Siksi muodostetaan sairaiden koeryhmä ja otetaan siihen verrokkiryhmäksi terveiden ryhmä.

Pitää paikkansa silloin, kun on kyse sairauksista tms. tilanteista, joissa esiintyvyys on pieni. Kuitenkin ROC-artikkelin asia liittyy testien arvioimiseen ja testi voi olla mikä tahansa testi. Voidaan arvioida esim. testiä, jonka perusteella selvitellään jotain ihmisen ominaisuutta, jonka esiintyvyys ei olekaan pieni. Vaikka introvertti vs. ekstrovertti.

Vierailija
5677/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

"PPV can only be calculated from a 2 × 2 table if the prevalence [P(Disease present) = number of people with disease/number of people in population (or sample)] in the table is the same as that in the population. Typically the reason the prevalence in a 2 × 2 table does not reflect the population prevalence is because the table is based on case-control data in which a specified number of cases (patients with disease) and controls (patients without disease) are studied for the purpose of finding associations."

(https://academic.oup.com/nop/article/2/4/162/2460002)

Tuosta linkistä pitäisi ymmärtää, että siinä puhutaan oikeista potilastilanteista, kun random potilas on saanut neg/pos testituloksen. Silloin ei voi tietenkään katsoa testin PPV:tä/NPV:tä.

Vierailija
5678/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Juuri tämän takia kysyin tämän kysymyksen, koska arvelin että bayesilaiset eivät ole ymmärtäneet koko asiaa. Ei tietenkään tutkimusryhmän otoskokoa valita sen mukaan, mikä on esiintyvyys väestössä! Miten tutkit sairautta, jonka esiintyvyys väestössä on 0,1%? Valitsemalla otoksen, jossa on 1 sairas ja 999 tervettä? Niinkö?

Ei, vaan tällöin otetaan otos, jossa esiintyvyys on isompi ja josta saadaan testin Sen ja Spe. Ja sitten se sovelletaan koko väestöön väestön prevalenssi huomioon ottaen. Sehän on juuri idea tässä Bayesissa.

Vierailija
5679/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Te arvoiset bayesilaiset. Voisitteko kertoa, minkälaisissa tilanteissa teidän mielestä PPV ja NPV lasketaan 2x2 taulukosta?

Kun 2x2 taulukossa kuvatun otoksen esiintyvyys on sama kuin esiintyvyys väestössä eli otos demonstroi koko väestöä tai kun väestön esiintyvyyttä ei ole kerrottu, jolloin voidaan olettaa, että se on sama.

Näin olen asian ymmärtänyt ja sillä periaatteella olen kokeessa käyttänyt Bayesia.

Nyt en ole enää varma, koska tehtävänanto on tosiaan epäselvä. Odotan tuloksia enkä ole puolesta enkä vastaan.

Juuri tämän takia kysyin tämän kysymyksen, koska arvelin että bayesilaiset eivät ole ymmärtäneet koko asiaa. Ei tietenkään tutkimusryhmän otoskokoa valita sen mukaan, mikä on esiintyvyys väestössä! Miten tutkit sairautta, jonka esiintyvyys väestössä on 0,1%? Valitsemalla otoksen, jossa on 1 sairas ja 999 tervettä? Niinkö?

Ei, vaan tällöin otetaan otos, jossa esiintyvyys on isompi ja josta saadaan testin Sen ja Spe. Ja sitten se sovelletaan koko väestöön väestön prevalenssi huomioon ottaen. Sehän on juuri idea tässä Bayesissa.

Et vastannut kysymykseen. Alkuperäinen kysymys oli, että missä tilanteissa te arvoisat bayesilaiset laskette PPV:n ja NPV:n 2x2 taulukosta?

Vierailija
5680/8033 |
12.06.2021 |
Näytä aiemmat lainaukset

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Vierailija kirjoitti:

Tehtävänannoissa voidaan antaa turhia tietoja. Eli vaikka kysymykseen olisi sisällytetty kaikenmoista tietoa, ei sitä välttämättä tarvitse itse laskusuorituksesa käyttää.

Siitä sentään kaikki ovat yhtä mieltä. :) Oliko turha tieto sitten 10 % vai 2x2-taulukko, on kiistan kohteena.

Siitä ei ole mitään epäselvyyttä, ettäkö 2x2 taulukko olisi turhaa tietoa. Sitä tarvittiin tottakai testin sensitiivisyyden ja spesifisyyden arvioimiseen. Kysymys on vain ja ainoastaan siitä, pitikö ennustearvot laskea tämän 2x2 taulukon mukaisen tutkimuksen henkilölle vai 2x2 taulukon mukaisen tutkimuksen jälkeen satunnaisesti koko populaatiosta valitulle henkilölle.

Aika monella on vielä hahmottumatta tämä asetelma...

Ja vielä lisään tähän, että 2x2 taulukon mukainen testiasetelma/tutkimusasetelma tms. mitä nimeä siitä sitten haluaakaan käyttää, tarvittiin, jotta PPV ja NPV voidaan laskea - riippumatta siitä kumpi henkilö on kyseessä, otoksen henkilö vai koko väestöstä satunnaisesti valittu. 2x2 taulukon tiedoista saadaan Sen ja Spe, jotka tarvitaan joka tapauksessa.

Juuri näin. Oleellista on siis tuo, että ”henkilöllä todellisuudessa on lukihäiriö, kun uuden lukitestin perusteella hänelle se luokitellaan.” Ja tällöinhän, jos sä pyörität vain tuon testin tietoja, sä saat tiedon, joka sulla jo oli (sä tiedät paljonko n määrä molemmissa ryhmissä). Eli tässä minä kyllä olisin käyttänyt tuota 10% tietoa, se kun kertoo sen, että jos se tällä luokitellaan, kuinka todennäköistä se sit koko populaatiossa on. Se kun on se ”todellisuudessa”.

Just näin :) se todellisuus kiinnostaa. Ehdottomasti tulee laskea esiintyvyydellä, muutoin ei tuota mitään lisäarvoa. Tieteessä pyritään aina yleistämään otosta isompaan joukkoon / populaatioon. Se on koko tutkimuksen pointti. Toinen pointti on, että taulukossa on annettu vain yksi valittu cut-off arvo, josta jo tiedetään miten paljon tunnistaa oikeita positiivisia & oikeita negatiivisia & millä kustannuksella. En vain itse näe sitä tietoarvoa, jos laskisin tästä pienestä otoksesta PPV & NPV. Se ei anna kuvaa todellisuudesta, joka meitä loppupeleissä nimenomaan kiinnostaa.

Eikö "henkilö todellisuudessa" voi tarkoittaa myös henkilöä joka osallistuu testiin? 

Voi toki, mutta kysymyksen asettelussa sanotaan ”todellisuudessa, kun tällä testillä se hänelle luokitellaan”, jolloin aika vahvasti kyllä viitataan testin luotettavuuteen koko populaatiossa. Tai näin mä sen näen.

Se vaan se todellisuus riippuu nyt siitä, oliko henkilö osa sitä otosporukkaa vai ei. 

Jos oli, niin hänen kohdallaan todennäköisyys ei noudata lukihäiriön esiintyvyyttä väestössä.

Itse olen siis sitä mieltä, että sitä 10% tässä haettiin. Luulen, ettei kokeen tekijät edes arvanneet, kuinka moniselitteinen kysymysasettelu olisi. Koe tuntui muutenkin hieman "hutaistulta", niin en ihmettele. Totta on myös se, ettei testiporukalle PPV:n ja NPV:n laskeminen ole oikein mielekästä (=vähän lisäarvoa), mutta totta on myös sekin, että sitäkin näkee tehtävän. Mutta niin ei voida tehdä, että ajatellaan, että valitsemme 50-50 porukasta henkilön ja sitten alamme pohtimaan hänen kohdallaan väestön prevalenssia. Se olisi ihan hullua. 

Miksi hullua? Nimenomaanhan ”hän halusi testin, jolla…” Silloinhan todellakin kyse on siitä toimiiko testi oikeasti diagnostisena arviona.

Ajattele sitä perus todennäköisyyslaskuna:

- Tiedetään, että lastentarhassa 10% palloista on mustia ja 90% valkoisia

- Otat laatikosta, jossa pallot ovat jakautuneet 50%-50% mustiin ja valkoisiin, yhden pallon.

- Voitko tuolloin soveltaa 10% esiintyvyyttä, vaikka se olisikin koko lastentarhassa vallitseva tilanne?

Jos testin diagnostista pätevyyttä sovelletaan koko väestöön, niin tottakai 10% pitää kutinsa. 

Jos testiä testataan otosporukkaan, niin siinä on eri esiintyvyys. Rajatusta otoksesta poimitulle henkilölle on siis hullua soveltaa 10% todennäköisyyttä, koska se ei pidä paikkaansa. 

Aivan, toi 10 % on turhaa tietoa.

Jos kaikki tarhan pallot olisivat samassa laatikossa, ei vieläkään tarvittaisi Bayesia, että voitaisiin laskea todennäköisyys kumpi pallo sieltä tulee, mutta tarvittaisiin kyllä tuota 10 %.

Jos kysyttäisiin onko nuo päiväkodin pallot edustava otos palloista, puhuttaisiin samasta asiasta.

Kirjoita seuraavat numerot peräkkäin: viisi seitsemän yhdeksän