Tekoälytesti
Nappasin Oulun kaupungin nettisivuilta live-kuvan torista, rajasin pois yläosan tekstin (kuvan lähde: . Sitten pistin kuvan Geminille, MIstralille (Vibe) ja ChatGPT:lle. Eväänä teksti: Ystäväni lähetti kuvan, tule tänne, sade loppui. Mutta tämä kuva ei ole Torniosta. Mistä tämä kuva on?
Kukaan kolmesta ei tunnistanut paikkaa: Gemini ehdotti että kyseessä on Kuopion tori, Vide sanoi kyseessä olevan Turun kauppatorin ja ChatGPT kertoi että kyseessä on Islannin Reykjavikin keskusaukio.
Syötin sitten lisätekstin: Ystäväni asuu Raahessa, suomessa, eli jossain pohjoissuomessa tämä on... Siihen tuli jo osumaa, Gemini tosin vastasi selkeästi "Ystäväsi voi hyvinkin asua Raahessa tai olla sieltä kotoisin, mutta kuva mikapaikka.jpg on siitä huolimatta otettu Kuopion torilta (Kuopion kauppatorilta)" Vibe-tekoäly puolestaan lähti myötäilemään kovasti, vastaus oli " Kuvasi näyttää Raahen Härkätorilta". Eli Vibe unohti saman tien taustan kaupunki-miljöön. No, Chat GPT sitten vastasi laveasti ja ehdotti että olisiko kyseessä Joensuun tai Oulun kauppatori.
Eli tekoälyt kyllä tunnistavat yksittäsiä elementtejä kuvasta, mutta kokonaisuuden hahmotus ei vielä kaikilla ole huipussaan. Jännää oli että Gemini ei tunnistanut paikkaa, vaikka selvästi avasi myös Mapsin ja places-palvelut taustalle.
Kerroin tekoälylle että "Soitin ystävälle, hän on Oulun kauppatorilla, kuva on oulun kaupungin live-kamerasta.". Tässä tulee hauska juttu, eli
- Gemini vastasti "Kuva ei valitettavasti ole Oulun kauppatorilta, vaikka ystäväsi niin luulisi tai olisi tällä hetkellä Oulussa".
- Vibe vastasi: "Kiitos selvityksestä! Kuva on siis Oulun kauppatorilta, ja se on otettu kaupungin live-kamerasta".
- Ja ChatGPT: "Aivan — nyt kun ystäväsi kertoi, että kuva on Oulun kauppatorilta ja että se tulee Oulun kaupungin live‑kamerasta, niin se vastaa täysin tätä näkymää".
Eli olen kyllä kuullut juttuja Geminin itsepäisyydestä, myös väärien tulkintojen puolustamisessa, joten Google Gemini ei tosiaan ole luotettava tekoäly pelkissä peruskysymyksissä. Jos menee pieleen, se pitää kiinni pieleen menneestä mielipiteestään.
Kommentit (6)
AP moi,
Jatkoin sitten tekstiä ja kerroin oikean vastauksen, myös linkin Oulun kaupungin nettikameraan. Sain kaikilta kolmelta pitkät vastaukset siiten, miten tekoäly tunnistaa kuvan. Koska kuvassa ei ole vihjeitä paikasta (GPS-koordinaatit, nimiä tms), tehtävä vaikeutui huomattavasti.
Mielenkiintoista vastauksissa oli Geminin selkeys kertoessaan miten kuvan tunnistus tapahtuu. Ja Gemini myös puolusti itseään nimittelemällä Videä ja ChatGPT;tä myötäilijöiksi. No, se on normaalia, mutta se mitä opin, on se, että kun syötät tarkennusta esittämääsi ongelmaan, tekoälyn tapa suhtauitua tarkennukseen on erilainen. Mistral (Vibe) ottaa uuden tiedon totuutena, ChatGPT ottaa sen osaksi kriteerejä, mutta muitakin vaihtoehtoja vielä oli mukana (joensuu). Gemini kertoi, että käyttäjän uusi tieto joutuu "totuuspuntariin" ja jos uusi tieto on ristiriidassa useamman vanhan tiedon kanssa (vanha tieto voi olla Geminin päättelemä), uusi tieto hylätään...
Tää oli todella mielenkiintoinen juttu siitä, miten tekoälyt toimivat. Jätin Deepseekin ym kiinalaiset ja samaan tekoälyrunkoon pohjautuvat pois, siksi joitain maineikkaitakin jäi pois.
Vierailija kirjoitti:
Kannattaa muistaa se, että käytät kyseisistä malleista vanhinta. Pro-mallit ovat uusimpia ja kykenevät parempaan. Gemini on kuitenkin maksullisenakin ihan rupuluokkaa ja konfabuloi se minkä kerkää. Jos kuitenkin haluat oikean testin ja ihan ilmaiseksi, kokeile Qwen3.7: se osaa myös tehdä viedoita, kuvia ym. ihan ilmaiseksi. Taustalla on Alibaba group.
Gemini on todella hyvä monessa.
Se ei ole tarkoitettu paikkojen tunnistamiseen muutenkaan.
Vierailija kirjoitti:
Vierailija kirjoitti:
Kannattaa muistaa se, että käytät kyseisistä malleista vanhinta. Pro-mallit ovat uusimpia ja kykenevät parempaan. Gemini on kuitenkin maksullisenakin ihan rupuluokkaa ja konfabuloi se minkä kerkää. Jos kuitenkin haluat oikean testin ja ihan ilmaiseksi, kokeile Qwen3.7: se osaa myös tehdä viedoita, kuvia ym. ihan ilmaiseksi. Taustalla on Alibaba group.
Gemini on todella hyvä monessa.
Se ei ole tarkoitettu paikkojen tunnistamiseen muutenkaan.
Pentagon käyttää Geminiä ja koska Google Maps + Google Gemini -> paras tietous paikoista. Todellisuudessa sopivalla promptaamisella Geminikin pystyy tunnistamaan rakennuksen, huoneen ja paikan yhdestä kuvasta. Tämä johtuu siitä, että kaikilla joilla on Androidin puhelin, ihmisten ottamat kuvat opetetaan tekoälylle ja siinä samalla menee paikkatietokin. Tätä ei vain kerrota ihmisille, etenkin kun Pentagon käyttää tätäkin tietoa "hieman" eri tarkoitukseen.
"koitan KIELIMALLILLA tehdä KUVAN PAIKAN TUNNISTUSTA ja se ei toimi. Olen yllättynyt..."
Ihan yhtä typerää kuin sanoisit.
Minulla on ruuvi jota koitan laittaa seinään. Vasaroin sitä aikani ja yllätyin kuinka huonosti ruuvi menee seinään, ei vielä ole ruuvit oikein hyviä seinään laitettaviksi.
Kiva kokeilu, mutta näitä pitäisi tehdä sarjana, useita erilaisia. Nämä huutelijat perusversioista jne voi jättää omaan arvoonsa "kyllä minäkin varmasti voittaisin formulakisat, jos ladassani olisi ferrarin mottori". Eli juuri se, että käyttää sitä perusversiota kaikista, joka avautuu nettisivulle ilman kirjautumista.
Geminin sinulle antama vastaus oli hyvä, vaikka se piti kiinni kuopiosta loppuun asti. Olen huomannut saman että lisäys alkuperäiseen ei välttämättä sillä anna parempaa tulosta, kannattaa ottaa uusi keskustelu ja tehdä parempi kysymys, näin sillä ei ole vanhaa rasitetta omista johtopäätöksistään.
Kannattaa muistaa se, että käytät kyseisistä malleista vanhinta. Pro-mallit ovat uusimpia ja kykenevät parempaan. Gemini on kuitenkin maksullisenakin ihan rupuluokkaa ja konfabuloi se minkä kerkää. Jos kuitenkin haluat oikean testin ja ihan ilmaiseksi, kokeile Qwen3.7: se osaa myös tehdä viedoita, kuvia ym. ihan ilmaiseksi. Taustalla on Alibaba group.