Kiinalaisen startupin DeepSeekin tekoälymalli on herättänyt innostusta ympäri maailman. DeepSeek julkaisi 20. tammikuuta uuden tekoälymallinsa, DeepSeek-R1:n. Malli on lisensoitu avoimen lähdekoodin lisenssillä, mikä mahdollistaa sen vapaan käytön.
DeepSeek-R1:n suorituskyky on verrattavissa yhdysvaltalaisen OpenAI:n uusimpiin malleihin.
Mistä DeepSeekin läpimurto kertoo? Kokosimme viisi näkökulmaa, joihin kannattaa kiinnittää huomiota.
1. Tekoälyvallankumous on vasta alussa
Usein tekoälykeskustelussa kuulee väitettävän, että Euroopassa peli on jo menetetty ja että emme enää ehtisi mukaan tekoälykilpaan. Tämä ei pidä paikkaansa. Olemme vasta aivan alussa. Peliä ei ole menetetty EU:ssa.
2. Niukkuus ruokkii innovatiivisuutta
DeepSeekin resurssit olivat rajalliset. Yrityksellä ei ollut käytössään loputtomasti prosessoriytimiä, joita tarvitaan kielimallin kehitystyössä. Tämä pakotti sen innovoimaan ja johti läpimurtoon.
3. Resurssitehokkuus on mahdollista
DeepSeek osoitti, että kilpailukykyinen tekoälymalli on mahdollista rakentaa murto-osalla perinteisten teknologiajättien kehitystyön kustannuksista.
DeepSeekin tekoälyn koulutuksen kustannusten on kerrottu olleen noin 5 miljoonaa dollaria (n. 4,8 miljoonaa euroa), kun perinteisten mallien kustannukset voivat olla jopa 100 miljoonaa dollaria. Samoin kouluttamisessa tarvittujen prosessoriytimien määrän on kerrottu olleen huomattavasti pienempi teknologiajätteihin verrattuna.
4. Erikoistuminen on tulevaisuutta
DeepSeek rakensi tekoälysovelluksestaan niin sanotun asiantuntijajärjestelmän (engl. Mixture-of-Experts), jossa vain tarvittavat “asiantuntijat” eli osamallit aktivoituivat automaattisesti. Tämä tarkoittaa sitä, että malli on vastakohta “kaiken osaaville” tekoälymalleille, jotka pyrkivät kattamaan kaikki aihealueet. Nämä muut mallit perustuvat toimintatavalle, jossa tekoälymalli on ikään kuin yksi asiantuntijahenkilö, kuten lääkäri, asianajaja tai insinööri.
DeepSeekin sovellus sen sijaan tarjoaa erikoistuneita asiantuntijoita, jotka aktivoituvat tarvittaessa. Käytännössä tämä tarkoittaa, että tekoälymalli toimii resurssitehokkaammin ja energiaystävällisemmin.
5. Avoimuus vauhdittaa alan kehitystä
Yhdysvaltalainen tekoälyjätti OpenAI perustettiin alun perin avoimeksi ja voittoa tavoittelemattomaksi sekä torjumaan riippuvuutta Googlen palveluista. Nyt OpenAI on kuitenkin muuttanut toimintansa suljetuksi ja tavoittelee voittoa. (OpenAI:ta pitäisi oikeastaan kutsua uudella nimellä ’ClosedAndGreedyAI’.)
DeepSeek on avannut mallinsa ja voi näyttää suuntaa koko alalle. Avoimuus tekee tekoälyn kehittämisestä ja päätöksenteosta läpinäkyvää ja sitä kautta eettisempää, kiihdyttää innovaatioita ja mahdollistaa tekoälyteknologian hyödyntämisen laajasti. Tämä vähentää riippuvuutta harvoista teknologiajäteistä.
Mitä EU:n pitäisi tehdä?
EU:n on tärkeää varmistaa strateginen autonomia luovassa tekoälyssä eli se, että EU:ssa pystytään kehittämään eurooppalaisia arvoja vastaavaa teknologiaa ilman liiallista riippuvuutta ulkoisista toimijoista. Jotta tähän päästään, on työskenneltävä neljällä osa-alueella:
- Tarvitaan edullinen pääsy suurteholaskentaan. Suomessa tilanne on hyvällä mallilla: meillä on onneksi Euroopan tehokkain Lumi-supertietokone.
- Avoimen lähdekoodin kielimalleja tulee olla saatavilla kaikilla EU:n virallisilla kielillä. Suomi on liian pieni kielialue, jotta se olisi houkutteleva teknologiajäteille markkinaehtoisesti. Suomessa kehitetty FinnishGPT-kielimalli on ollut keskeinen SiloAI:n menestykselle. Avoimet kielimallit ovat elintärkeitä pienille kielialueille, jotta myös pienempiä kieliä käyttävillä yrityksillä ja yhteiskunnilla on mahdollisuus kehittää tekoälyä omalla äidinkielellään. Wittgensteinin sanoin: ”Kieleni rajat merkitsevät maailmani rajoja.”.
- Tarvitaan toimialakohtaisia kielimalleja eri sektoreille (esim. terveys, lainsäädäntö).
Tarvitsemme tulevaisuudessa toimialakohtaisia malleja. Tällaisia voivat olla esimerkiksi terveysalan ja lainsäädännön kielimallit. Suomessa tarvitaan esimerkiksi “SoteGPT”-malli sosiaali- ja terveydenhuollon tarpeisiin tai “LexGPT” lainvalmisteluprosessin tukemiseen. Sitra on kokeiluissaan edistänyt muun muassa lainsäädännön ja soten tekoälyn käyttöä. - Yhteistyötä laadukkaan datan keräämiseksi.
Pienillä kielialueilla, kuten Suomessa, datan kerääminen on suurin haaste tekoälyn kehittämiselle. Tarvitsemme laadukasta tekstidataa, puhedataa ja myös murteiden huomioimista kielimallien koulutuksessa. Julkisen ja yksityisen sektorin yhteistyö on tässä avainasemassa.
Neljä yllä kuvattua osa-aluetta mahdollistavat tekoälyagenttien ja muiden tekoälysovellusten rakentamisen. Näissä piilee suurin työn tuottavuuden parantamisen potentiaali ja osa-alueet muodostavat perustuksen Suomen menestykselle tekoälyn saralla.
Sata vuotta sitten Suomi sähköistyi, nyt yhteiskuntamme tekoälyistyy. Tämä työ on vasta alussa.
On selvää, että kukaan muu ei aja suomen kielen asemaa kuin suomalaiset itse. On aika kääriä hihat ja ryhtyä töihin.