osaako joku TILASTOLLISIA testejä?
Kopioin tämän kysymykseni tännekin suomi24:sta:
Jos haluan vertailla, kuinka usein käytetään vaikka minä-sanan muotoja minä, mä, mie, mää & aineistona on korpus a) nuorisokirjallisuudesta vuodelta 2000 ja b) korpus nuorisokirjallisuudesta vuonna 1970. (Korpukset ovat selvästi eri kokoisia, mille ei voi nyt mitään, ja esiintymien lukuarvot on normitettu.) Jaan sanamuodon mukaan neljään kategoriaan ja lasken frekvenssit joka kategoriaan. Voiko korpusten vertailuun käyttää khiin neliötä, riippumattomuustestiä kahdelle populaatiolle, vai pitääkö olla t-testi (ja lasketaan prosenteista)? Hämää mm., että korpukset ovat erisuuruisia, joten onko mielekästä laskea absoluuttisista frekvensseistä. Tuon mukaan voisi silti olla khiin neliö:
"Biber et al. (1998: 43–45) tarkastelevat tekstilajien välisiä eroja. Erityisenä
esimerkkinä on sanojen big, large ja great esiintyminen englanninkielisessä fiktiossa
ja akateemisessa proosassa. Esiintymät on poimittu korpuksesta, jonka koko on
yhteensä 5,7 miljoonaa sanaa (näistä fiktiota 3 miljoonaa ja akateemista proosaa 2,7
miljoonaa sanaa). Tarjolla on sekä alkuperäiset lukuarvot että normitetut lukuarvot.
khi2 -testissä on käytettävä alkuperäisiä, normittamattomia lukuja." (Luojola 2006, 151)
Kommentit (4)
Oliko sinulla joku vastaus kysymykseeni?
ap
Jos asian voi esittää ristiintaulukointina, ja näytteessä riittää kokos, khiin neliö käy. T- testi edellyttäisi normaalikakaumia muuttujissa, mikä ei taida nyt päteä.
Kiitos, otan varteen. Kokos taitaa riittää eikä kakauma liene normaali...
SPSS-tilastoanalyysiohjelmisto käytössä työssä päivittäin, peruskauraa.
En vaan ymmärrä miksi copypastaat tuollaisen suolipalstalta tänne yhtä viihteelliselle AV:lle...