Osaisko joku auttaa mua logistisen regressioanalyysin kanssa ?:)
Kommentit (11)
Logistisessa jakauma on binomi, yleisessä se voi olla mikä vaan, vaikka normaali.
Mikä ongelma aloittajalla?
ennustaa todennäköisyyden eli se saa arvon välillä 0-1 eli mitä suurempi arvo, sitä suurempi todennäköisyys.
Käytän siis menetelmää, jota en oikein hallitse. Osaisin kyllä tehdä ja tulkita (jotenkin) normaalin log.reg.analyysin, mutta sitten kun se pitäisi olla askeltava, en ymmärrä :O!!
Mun siis pitää lisätä niitä selittäviä muuttujia sinne jotenkin yksi (?) kerrallaan, vai kuinka? Ja mistä näkee sen, että minkä muuttujan voi tiputtaa pois (koska se ei ole merkitsevä)?
Vaikutan varmasti ihan urpolta, ja olenkin :( . Näissä asioissa ainakin.
sulla on toivottavasti kaksitasoinen ennustettava muuttuja (esim. on joku sairaus vs. ei ole). Laitat sen riippuvaksi muuttujaksi. Sitten haluat ennustaa sitä erilaisilla muilla muuttujilla = riippumattomat muuttujat. Todennäköisesti 2-5 kpl. Ne laitat ennustajiksi. Jos sulla on kategorisia ennustajia, esim. sukupuoli, muista täsmentää se analyysissa (miten -> riippuu käyttämästäsi tilasto-ohjelmasta).
Tilasto-ohjelman output sitten kertoo, mitkä ennustajista ennustavat merkitsevästi riippuvaa muuttujaa. Merkitsevyyden näkee p-arvosta- jos se on alle 0.05, yhteys on merkitsevä. Kuinka voimakas se sitten on, niin esim. SPSS antaa nk. exp(B) -luvun, joka kertoo kuinka paljon 1 yksikön muutos riippumattomassa muuttujassa lisää/vähentää riippuvaa muuttujaa. Esim. jos riippuva on Y ja riippumaton X, ja X:n exp(B) on 1.5 niin 1 yksikön lisäys X:ssä lisää todennäköisyyttä kuulua Y:n korkeampaan kategoriaan 1.5:llä. (korkeampi kategoria = isompi luku niistä kahdesta, joilla merkkaat riippuvan muuttujan tasoja, esim 1, 2 -> 2 on korkeampi).
eli askeltavassa laitat niitä riippumattomia muuttujia 1 kerrallaan niihin Step:eihin, ja katsot miten tulokset muuttuvat eri steppien välillä. Sun kannattaa kyllä käydä jonkun tilasto-ohjaajan pakeilla.
Päätä vaan, että kumpaan suuntaan etenet. Ehkä on helpompi laittaa ensin kaikki muuttujat malliin ja tiputtaa yksi kerrallasn pois, kunnes jäljellä on enää tiastollisesti mekitsevät muuttujat. Ja sitten tulkitset sen mallin kuten olet opetellut.
Toinen vaihtoehto on lisätä muuttujia yksitellen.
sulla on toivottavasti kaksitasoinen ennustettava muuttuja (esim. on joku sairaus vs. ei ole). Laitat sen riippuvaksi muuttujaksi. Sitten haluat ennustaa sitä erilaisilla muilla muuttujilla = riippumattomat muuttujat. Todennäköisesti 2-5 kpl. Ne laitat ennustajiksi. Jos sulla on kategorisia ennustajia, esim. sukupuoli, muista täsmentää se analyysissa (miten -> riippuu käyttämästäsi tilasto-ohjelmasta).
Tilasto-ohjelman output sitten kertoo, mitkä ennustajista ennustavat merkitsevästi riippuvaa muuttujaa. Merkitsevyyden näkee p-arvosta- jos se on alle 0.05, yhteys on merkitsevä. Kuinka voimakas se sitten on, niin esim. SPSS antaa nk. exp(B) -luvun, joka kertoo kuinka paljon 1 yksikön muutos riippumattomassa muuttujassa lisää/vähentää riippuvaa muuttujaa. Esim. jos riippuva on Y ja riippumaton X, ja X:n exp(B) on 1.5 niin 1 yksikön lisäys X:ssä lisää todennäköisyyttä kuulua Y:n korkeampaan kategoriaan 1.5:llä. (korkeampi kategoria = isompi luku niistä kahdesta, joilla merkkaat riippuvan muuttujan tasoja, esim 1, 2 -> 2 on korkeampi).
Näistä ohjeista. Mulla käytössä spss myös. Vastasuksesi ensimmäisen kappaleen asiat on hallinnassa :).
Tulkitseminen onnistuu jotenkuten oppaan avulla, mutta sekin on ongelma, etten tiedä mitä arvoja merkitsen graduun tulevaan taulukoon. p-arvon? Ja varsinkin kun teen asketavana, ja jos lisäilen niitä muuttujia sinne, en tiedä millaisen taulukon teen :(. Kai mun täytyy mennä jonku viisaamman pakeille!
Ja tosiaan, voi siis tehdä niinpäin että laittaa kaikki selittävät muuttujat kerralla, ja katsoo sitten mitkä ovat merkitseviä. Selvinnee spss:ssä siitä "variables in the equation"-taulukosta ?
Kiitos myös muille vastanneille:)
HUOH!
ap
tulokset eivät yleensä hirveästi eroa askeltavan ja "samanaikaisen" analyysin välillä. Yleensä jos tehdään askeltava niin raportoidaan askel kerrallaan eli tunnusluvut jokaisesta askeleesta niille, jotka ovat mukana siinä askeleessa (näin nähdään, miten niiden tunnusluvut muuttuvat, jotka ovat mukana joka askeleessa).
Log. regression kanssa ei olla käsittääkseni ihan yksimielisiä siitä, mitä pitäisi raportoida, riippuu myös tutkimuskysymyksestä. Yleensä Ward statistic (raportoi näin Ward = 2.12), p-arvo, ja Odds ratio (
tulokset eivät yleensä hirveästi eroa askeltavan ja "samanaikaisen" analyysin välillä. Yleensä jos tehdään askeltava niin raportoidaan askel kerrallaan eli tunnusluvut jokaisesta askeleesta niille, jotka ovat mukana siinä askeleessa (näin nähdään, miten niiden tunnusluvut muuttuvat, jotka ovat mukana joka askeleessa).
Log. regression kanssa ei olla käsittääkseni ihan yksimielisiä siitä, mitä pitäisi raportoida, riippuu myös tutkimuskysymyksestä. Yleensä Ward statistic (raportoi näin Ward = 2.12), p-arvo, ja Odds ratio (
Tästä oli apua! :)
ap
piti vielä jatkaa (viesti katkesi), että kysy apua tuon Odds ration raportoimiseen, se on yleensä tärkeä (en ole ihan varma onko se suoraan se exp(B), vai pitääkö se laskea sen perusteella jotenkin).
tulokset eivät yleensä hirveästi eroa askeltavan ja "samanaikaisen" analyysin välillä. Yleensä jos tehdään askeltava niin raportoidaan askel kerrallaan eli tunnusluvut jokaisesta askeleesta niille, jotka ovat mukana siinä askeleessa (näin nähdään, miten niiden tunnusluvut muuttuvat, jotka ovat mukana joka askeleessa).
Log. regression kanssa ei olla käsittääkseni ihan yksimielisiä siitä, mitä pitäisi raportoida, riippuu myös tutkimuskysymyksestä. Yleensä Ward statistic (raportoi näin Ward = 2.12), p-arvo, ja Odds ratio (
Tästä oli apua! :)
ap
Mitä eroa on logistisella regressioanalyysillä ja regressioanalyysillä?