Soomes asub Euroopa üks võimsaimaid superarvuteid LUMI, mille ülikiires sisemuses on sündinud meie oma regiooni tehnoloogiline saavutus – keelemudel TildeOpen, mis on valmis rinda pistma maailma suurimate tehisaru-hiiglastega.

Keeletehnoloogia ettevõte Tilde on valmis saanud tehisaru baasmudeli, mis on optimeeritud just nimelt kvaliteetseks tõlkimiseks. Kuigi oleme harjunud vaatama imetlusega ookeani taha, suudab see Euroopa Komisjoni tellimusel valminud mudel konkureerida kvaliteedilt ka kõigi tehisintellekti gigantidega nagu ChatGPT ja Gemini.

Huvitav on siinkohal mastaapide võrdlus. TildeOpen on oma parameetrite arvult ligi 60 korda väiksem kui ChatGPT, kuid tulemus on sageli täpsem ja loomulikum. Kui ChatGPT on nagu massiivne entsüklopeedia, mis teab kõigest midagi, siis TildeOpen on kui spetsialiseerunud filoloog, mis on treenitud sadade miljardite sõnade peal just Euroopa keelte ilu ja valu silmas pidades.

Kokku valdab see digitaalne polüglott 34 keelt, ulatudes eesti keelest kuni ukraina ja teiste EL-i kandidaatriikide keelteni.

Turvalisus: sinu andmed ei rända "pilve taha"

Tehisaru ajastul on andmete privaatsus muutunud väärtuseks omaette. Paljud meist pelgavad sisestada tundlikku infot platvormidele, mis asuvad teisel pool maakera ja mille andmekasutusreeglid on hägusad nagu sügisene udu.

TildeOpen lahendab selle mure rohujuuretasandil.

„Erinevalt paljudest ülemaailmsetest tehisintellekti teenustest, mis tegutsevad väljaspool Euroopat ja kasutavad jagatud pilveressursse, saab TildeOpenit juurutada kohapealsetes serverites või Euroopa pilvetaristus. Andmete säilitamise ja töötlemise üle on täielik kontroll,“ sõnas Tilde Eesti tegevjuht Kalle Kuusik.

See tähendab, et olgu tegu riigiasutuse või andmetundliku ettevõttega, info jääb kindlalt "oma õuele".

Superarvuti jõud sinu arvutis

TildeOpen ei sündinud üleöö. See on võidutöö konkursil Large AI Grand Challenge, mis avas arendajatele uksed superarvuti LUMI juurde. See on masin, mille arvutusvõimsus on tavainimesele hoomamatu.

Seni oli mudel pigem teadusmaailma kroonijuveel, kuid nüüd on Tilde teinud ära arenduse, et kohandada see võimekus igapäevaseks kasutamiseks. See on nüüd "kodustatud" ja valmis teenima igaüht, kes vajab kiiret ja täpset tõlget ilma kvaliteedis järeleandmisi tegemata.

Ülevaade: mida TildeOpeni masintõlge endast kujutab?

TildeOpen on suunatud kasutajale, kes väärtustab täpsust, Euroopa keelte spetsiifikat ja turvalisust. See on hea alternatiiv neile, kes on väsinud suurte mudelite "hallutsinatsioonidest" või ebatäpsetest terminite kasutustest meie emakeeles.

PLUSSID

+ Keeleline täpsus: eriti tugev eesti keele ja teiste Euroopa väikekeelte nüansside tabamisel.

+ Andmete suveräänsus: vastab EL-i standarditele, tagades, et info ei leki väljapoole Euroopat.

+ Tasuta testimine: võimalus mudelit proovida ja selle võimekuses ise veenduda.

+ LUMI tugi: teaduslikult tõestatud ja testitud baasmudel.

MIINUSED

- Fookus: suunatud peamiselt tõlkimisele, mitte loovkirjutamisele või koodi genereerimisele (erinevalt laiematest LLM-idest).

- Kasutajaliides: praeguses faasis on rõhk lihtsal funktsionaalsusel, mitte niivõrd mängulisusel ja võimalusterohkemal kasutamisel.

TildeOpen Mudeli nimi: TildeOpen LLM Parameetrite arv: 30 miljardit Treeningandmete maht: Sajad miljardid sõnad Toetatud keeled: 34 Euroopa keelt (sh ukraina keel) Arenduskeskkond: Superarvuti LUMI (Soome) Vastavus: EL-i tehisintellekti määrus (AI Act), GDPR Kättesaadavus: Avatud lähtekoodiga baasmudel + praktiline veebiliides

Kui soovid näha, kuidas tõlgib tehisaru, mis on treenitud meie oma regiooni väärtusi ja keelelisi peensusi silmas pidades, siis on aeg see proovile panna. TildeOpeni tõlkevõimekust saab testida aadressil: https://tilde.ai/et/machine-translation/.