Kiinalainen startup DeepSeek julkaisi tammikuussa uuden avoimen lähdekoodin suuren kielimallin, DeepSeek-R1: n, joka saattaa mullistaa tekoälymarkkinat. Malli hyödyntää loogista päättelyä ja pystyy tarkistamaan omia vastauksiaan, minkä ansiosta sen suorituskyky on monilta osin verrattavissa esimerkiksi OpenAI:n o1-malliin. Testituloksissa R1 erottuu erityisesti matematiikassa ja koodauksessa.
Malli sisältää vajaat 700 miljardia parametria ja on koulutettu tiivistämistekniikalla. Tämä tarkoittaa, että suuremman ”opettajamallin” osaaminen siirretään kevyempään ”oppilasmalliin”, joka on tehokkaampi ja toimii esimerkiksi mobiililaitteissa. Tekoälymallin koulutuksen kerrotaan maksaneen vain noin 5–6 miljoonaa dollaria – murto-osan siitä, mitä OpenAI:n tai Googlen DeepMindin kehittämät huippumallit vaativat. Koska DeepSeekillä ei ole ollut käytössään mittavia taloudellisia resursseja tai viimeisimpiä teknologioita, kustannustehokkuus on ollut ainoa etenemistapa.
DeepSeek-R1: n julkaisu tammikuussa 2025 herätti laajaa huomiota, joka ei ole vieläkään laantunut. Tekoälymarkkinat reagoivat nopeasti syntyneeseen hypeen, ja pörssissä teknologiajättien osakkeet notkahtivat ainakin tilapäisesti. Esimerkiksi tekoälykehityksessä käytettävien raskaiden prosessorien valmistajan, Nvidian, osakekurssi laski. Samalla keskustelu kiihtyi: voiko kiinalaisyhtiön kehittämä edullinen ja avoin tekoäly jopa horjuttaa vakiintuneiden suuryritysten valta-asemaa? Myös spekulaatiot mahdollisesta kierosta pelistä ovat nousseet esiin.
Viime viikkoina on nähty muitakin tekoälyjulkaisuja, joskin pienemmällä kohulla. Esimerkiksi Alibaba Cloud esitteli tehokkaaksi mainostetun QWen-mallinsa. OpenAI puolestaan vastasi julkistamalla Deep Research -ominaisuuden, joka on suunniteltu suorittamaan syvällistä, monivaiheista tutkimusta hyödyntämällä julkisen verkon tietoja. Tämä ominaisuus tullaan integroimaan tulevaan OpenAI o3 -malliin.
DeepSeek-R1:n ympärillä noussut kohu osoittaa, että tehokasta tekoälyä voidaan kehittää ilman massiivisia investointeja. Tekoälyteknologian kehityksen kärkipaikoista käydään edelleen kovaa kilpailua, mutta samalla uudet julkaisut monipuolistavat alaa. DeepSeek-kohun vaikutukset voivatkin olla mullistavia koko tekoälyalalle, ja edessä saattaa olla suuri murroskausi – toivottavasti positiivinen sellainen.