SK
Seuratut keskustelut
Kommentit
Vierailija kirjoitti:
Ei oo LLM vaan pikemmin SLM.
Varsin rajoittunut, ei osaa kuvien käsittelyä ja paljon muuta. Hidas ja kapasiteetti ei riitä.
On siinäkin käytetty 400 miljoonan edestä NVidian rautaa.
Eikä kiinalaisten juttuihin pidä uskoa sokeasti. Informaatiosta käynnissä.
Strong avoid!
Jos viittaat esimerkiksi parametrien määrään, niin mallien ei ole tarkoitus olla isoja vain isouden itsensä takia, vaan koska useamman parametrin ajatellaan johtavan parempaan suorituskykyyn. Jos DeepSeekin suorituskyky on yhtä hyvä tai parempi kuin isompien mallien, niin sitä voisi pitää vain taloudellisena etuna, eikä haittana käytön kannalta.
Serverikapasiteetin vähyys suhteessa kysyntään on palveluntarjoajien servereiden ongelma, eikä niinkään mallin itsensä ongelma.
Malli on oletettavasti tarkoitettu tekstin tuottoon tekstimuotoisen syötteen perusteella. Koska kuluttaja voi valita käytettävän mallin tarkoituksen mukaan, kannattaa mallien erikoistua, eikä pyrkiä tekemään vähän kaikkea kerralla. Esimerkiksi astiakaapissasi on todennäköisesti erillisiä veitsiä, lusikoita ja haarukoita, joista valitset sopivimman riippuen siitä, haluatko leikata leipää vai syödä keittoa. Teräväreunainen ja piikeillä varustettu lusikka ei useinkaan ole parempi, vaikka sillä voisikin tehdä vähän kaikkea.
Se, millä laitteistolla malli on koulutettu, ei varsinaisesti ole myöskään mallin itsensä ominaisuus. Asia voi ehkä kiinnostaa Nvidian sijoittajia tai Yhdysvaltojen pakoteohjelmista vastaavia, mutta se ei ole varsinaisesti kuluttajan kannalta relevantti asia.
DeepSeekin suorituskyvyn suhteen ei tarvitse mitenkään erityisesti "uskoa kiinalaisten juttuja", sillä mallia voi kokeilla myös muut riippumattomat tahot, tai vaikka itse.
Vierailija kirjoitti:
Vierailija kirjoitti:
Varmaan tosi laadukas. Kannattaa ihan ehdottomasti ladata työkoneelle :DDD
Ei kai kukaan sitä tyäkoneelleen asenna. Kun kaapi perukoilla on ylimääräinen tehokas kone, niin siinä voisi kokeilla turvallisin mielin.
En ole kyberturvallisuusasiantuntija, mutta omalle koneelle asennettuna malli ei liene mitenkään erityisen vaarallinen. En tiedä, onko teoriassa mahdollista, että lähdekoodiin on ujutettu joku piilotettu takaportti tai muuta vastaavaa, mutta tämä kuulostaa melko vainoharhaiselta.
Suurin tietoturvariski mallin käytön suhteen on varmaankin sen käyttäminen DeepSeekin tarjoamien servereiden kautta, jolloin lähetetty data päätyy kyseisen kiinalaislafkan haltuun. Ei ehkä tarvitse olla ihan totaalinen foliohattu uskoakseen, että tästä voi potentiaalisesti olla jotakin haittaa.
Vierailija kirjoitti:
Vierailija kirjoitti:
Vierailija kirjoitti:
Varmaan tosi laadukas. Kannattaa ihan ehdottomasti ladata työkoneelle :DDD
Kannattaa edes hiukan ottaa asiasta selvää ennen kuin alkaa öyhöttämään. Kaikki asiantuntijat on ylistäneet kyseistä tuotetta ja Piilaakson porukka on aivan kauhuissaan, he kun on hakanneet omiin luomuksiinsa kymmeniä miljardeja ja kiinalaiset matemaatikot väsäsivät oman vastineensa sivuprojektinaan muiden töiden ohessa ja silti se pärjää näille jenkkien ylikalliille tuotoksille ja joiltain osin jopa päihittää ne.
Se onkin mielenkiintoista että toi on mennyt kaikille läpi tosta vaan. Ilman kritiikkiä. Se on halpa ja huono kopio.
Kaikki asioita ymmärtävät vanhan viisauden ohjelmistoista. 90% toiminnoista voi toteuttaa 10%: n kuluilla. Ja jos/kun homma tehdään vielä kopioimalla suurinosa niin hinta tippuu lähelle nolla
Millä perusteella on halpa ja huono kopio? Kyseisen mallin hehkutus perustunee suurilta osin siihen, että se pärjää monissa tekoälyjen arviointiin tarkoitetuissa testipattereissa erittäin hyvin, ja on monien testien kohdalla markkinoiden paras. Se on myös käyttäjien kesken suosittu.
Voidaan tietty sanoa, että nuo testit tai käyttäjien suosion eivät pätevästi mittaa mallin kykyjä, mutta silloin herännee kysymys, että miten sitten eri malleja voisi vertailla.
Vierailija kirjoitti:
Vierailija kirjoitti:
Minä en käytä deepseekiä vaikka mikä tulisi. Kyseessä on takuuvarmasti vakoiluohjelma joka ei täytä gdpr vasteita ja tuossa on klassiset pehmeän vaikuttamisen keinot käytössä - monella tapaa hyödylliseen softaan on upotettu propagandaa joille käyttäjä tuotteen eduista nauttiessaan altistuu.
No se vallankumouksellisuus tässä tapauksessa liittyykin mahdollisuuteen ajaa mallia lokaalisti. Siinä ei datasi tallennu mihinkään kiinalaisten palveluun. Lisäksi tällöin puuttuu sensuuri ja voit kysellä mallilta aivan mitä haluat. Ei se malli sitä sensurointia itse tee.
Kielimalleja voinee sensuroida monellakin tasolla, mutta kyllä itse malli teoriassa voi hyvinkin olla "sensuroitu". Eli tietty tiliäsi ei voida jäädyttää tai vastausprosessia keskeyttää jonkun ylemmän tason moderaatiojärjestelmän tutkittua lähettämäsi kehotteen jos ajat mallia kotonasi.
Mallia voidaan kuitenkin sensuroida jo koulutusvaiheessa, esimerkiksi peukaloimalla harjoitusdataa tai arvostelemalla vastauksia tietystä poliittisesta näkökulmasta. Näiden vaikutukset eivät poistu, vaikka mallia pyöritettäisiin omalla koneella.
Lapsilisään saa yksinhuoltajana korotusta, eli sukupuolesta riippuen äippä- tai isilisää.