Miksi lukujonot alkavat useiten ykkösellä (30%) ja harviten yhdeksällä (4,6%)
Kommentit (32)
Hassu sääntö... minä kun luulin että jos otetaan satunaisluku niin kaikki numerot ovat yhtä todennäköisiä, eli jokaisen numeron (paitsi nollan) todennäköisyys olisi siis 1/9...
Kiva kaava, mutta tuskin pitää paikkansa yleisesti. Benford lienee englantilainen (tai amerikklainen). Siellä käytetään edelleenkin omia mittayksiköitä, jotka SI-yksiköihin verrattuna ovat "ihmisen mittaisia". Siksi on ymmärrettävää, että Benford on törmännyt tilastoihin, joissa useammat luvut osuvat välille 1.0-1.9 kui 5.0-5.99.
Joka tapauksessa kaava on helppo todistaa vääräksi ottamalla esimerkiksi vaikka WIKIssä mainittu sähkölasku. Jos se puntina noudattaisikin lakia, niin markkoina 1 tilalla olisi ollut 8. Siis mittayksikkö määrää tilaston yleisimmän ensimmäisen numeron.
Kyseessä on ns. fenomenologinen laki ja pitäähän se paikkansa tietyin edellytyksin. Itse muistan kuin aikoinaan lukiossa opettaja todisteli lakia näyttämällä miten paljon käytetyn logaritmitaulukon ensimmäiset sivut olivat muita kuluneempia ja koirankorvilla.
Taas yksi joka on valinnut teknisen linjan sillä oletuksella että pärjää? Olisiko sittenkin kannattanut valita hoitoala, tai esim. kiinteistöhuolto? Ei se järki siellä päässä lisäänny tyhmiä kyselemällä, vaan ratkaisemalla tehtävät ihan itse.
Kumma juttu kun tuosta Benfordista on viime aikoina huudeltu. Tänään hesarissa ja pari viikkoa sitten muuan teollisuusmatemaatikko jossain nettisivulla.
Äkkiseltään kuvittelisi että tuommoisesta jutusta ei kannattaisi vasikoida. Nimittäin nyt kaikki vihjeelliset talousrikolliset rupeaa säveltämään uskottavampia lukuja kirjanpitoon.
Tai ehkä siinä talousrikosten tutkinnassa on muitakin kikkoja ja niistä ei sitten huudella sillä katujen laki on kova laki.
Tarkoittaa lyhyesti sanottuna sitä, että "luonnostaan" esiintyvissä numerosarjoissa ensimmäinen numero on kaikkein suurimmalla todennäköisyydellä ykkönen, pienemmällä todennäköisyydellä kakkonen, jne. siitä eteenpäin laskevalla käyrällä.
Vierailija kirjoitti:
Tarkoittaa lyhyesti sanottuna sitä, että "luonnostaan" esiintyvissä numerosarjoissa ensimmäinen numero on kaikkein suurimmalla todennäköisyydellä ykkönen, pienemmällä todennäköisyydellä kakkonen, jne. siitä eteenpäin laskevalla käyrällä.
Mielenkiintoista. Ja mihin tämmöstä edes käytetään?
Vierailija kirjoitti:
Vierailija kirjoitti:
Tarkoittaa lyhyesti sanottuna sitä, että "luonnostaan" esiintyvissä numerosarjoissa ensimmäinen numero on kaikkein suurimmalla todennäköisyydellä ykkönen, pienemmällä todennäköisyydellä kakkonen, jne. siitä eteenpäin laskevalla käyrällä.
Mielenkiintoista. Ja mihin tämmöstä edes käytetään?
Tunnistamaan keinotekoisesti luodut numerosarjat aidoista.
Sen avulla pystyy esim tunnistamaan onko joku muokattu. Jos on, pikseleiden taustalla olevien numeroiden sarjat ei noudata tätä lakia. Myös verovilpistä tunnistamiseen on käytetty jne. Mielenkiintoinen ”luonnonvakio”.
Vierailija kirjoitti:
Sen avulla pystyy esim tunnistamaan onko joku muokattu. Jos on, pikseleiden taustalla olevien numeroiden sarjat ei noudata tätä lakia. Myös verovilpistä tunnistamiseen on käytetty jne. Mielenkiintoinen ”luonnonvakio”.
Voisiko tätä sitten käyttää myös vaalivilpin huomaamiseen?
Vierailija kirjoitti:
Vierailija kirjoitti:
Sen avulla pystyy esim tunnistamaan onko joku muokattu. Jos on, pikseleiden taustalla olevien numeroiden sarjat ei noudata tätä lakia. Myös verovilpistä tunnistamiseen on käytetty jne. Mielenkiintoinen ”luonnonvakio”.
Voisiko tätä sitten käyttää myös vaalivilpin huomaamiseen?
https://www.cambridge.org/core/journals/political-analysis/article/comm…
Vierailija kirjoitti:
Koska standardihajonta.
Kerro tarkemmin
Jos mietitään vaikka sähkölaskua niin pienet sähkölaskut on ymmärrettävästi yleisempiä kuin isot. Pienessä asunnossa joku 10-40€/kk on paljon yleisempi kuin 80-90€/kk tai jos mennään isompaan niin satasella tai kahdella alkava on paljon yleisempi kuin 500-900 ja numeroita lisätessä tonni on yleisempi kuin vaikkapa 9000 alkava sähkölasku.
Palkatkin noudattaa vastaavaa todennäköisyyttä eli bruttopalkoissa ensimmäinen numero on todennäköisemmin pieni kuin iso, samoin nettopalkoissa.
Toki yksittäisissä erikoisalueissa tuo ei välttämättä pidä paikkaansa mutta kun ottaa huomioon mahdollisimman monia erilaisia lukusarjoja ja riittävän suuren määrän näytteitä niin tarkkuus paranee ja tulos yleistyy.
Tästä on dokumentti jossain suoratoistopalvelussa, oli mielenkiintoinen. Sen takia kai on sitten muuallakin esillä.
En tiedä. Tätä on mahdotonta selittää.
Vierailija kirjoitti:
Jos mietitään vaikka sähkölaskua niin pienet sähkölaskut on ymmärrettävästi yleisempiä kuin isot. Pienessä asunnossa joku 10-40€/kk on paljon yleisempi kuin 80-90€/kk tai jos mennään isompaan niin satasella tai kahdella alkava on paljon yleisempi kuin 500-900 ja numeroita lisätessä tonni on yleisempi kuin vaikkapa 9000 alkava sähkölasku.
Palkatkin noudattaa vastaavaa todennäköisyyttä eli bruttopalkoissa ensimmäinen numero on todennäköisemmin pieni kuin iso, samoin nettopalkoissa.
Toki yksittäisissä erikoisalueissa tuo ei välttämättä pidä paikkaansa mutta kun ottaa huomioon mahdollisimman monia erilaisia lukusarjoja ja riittävän suuren määrän näytteitä niin tarkkuus paranee ja tulos yleistyy.
Kerroit juuri, mitä Benfordin laki ennustaa, muttet, miksi.
Muistaakseni tuo on ratkaisematon ongelma.