Daudzvalodības servisi Eiropas mākoņdatošanas infrastruktūrā

Projekta statuss:

Aktīvs

Projekta nosaukums:

Daudzvalodības servisi Eiropas mākoņdatošanas infrastruktūrā

Projekta numurs:

5.1.1.2.i.0/4/24/A/CFLA/002

Finansējuma saņēmējs:

Sabiedrība ar ierobežotu atbildību "TILDE"

Reģ. Nr.: 40003027238

Jur. adrese: Vienības gatve 75A, Rīga, LV-1004

Projekta sadarbības partneri:
Projekta īstenošanas vieta:

Vienības gatve 75A, Rīga, LV-1004 Reģions: Rīga

Komponentes / Investīcijas nosaukums un numurs:

5.1.1.2.i - 4. kārta Atbalsta instruments pētniecībai un internacionalizācijai

Projekta kopējais finansējums:

4 867 312.00 EUR

Projektam piešķirtais ES fondu līdzfinansējums:

AF: 3 406 373.25 EUR

Nacionālais publiskais finansējums*:
Nacionālais privātais finansējums**:

1 460 938.75 EUR

Kopējie atbilstīgie izdevumi:
Atbildīgā iestāde:

Ekonomikas ministrija

Projekta mērķa grupa:

Projekta kopsavilkums:

IPCEI-CIS projekts stiprina Eiropas digitālo suverenitāti, attīstot jaunas paaudzes mākoņskaitļošanas infrastruktūru un pakalpojumus. Projekts veido visaptverošu, no pakalpojumu sniedzējiem neatkarīgu pilna tvēruma digitālu vidi no mākoņskaitļošanas līdz robežiekārtām. Būtiska topošās Eiropas mākoņskaitļošanas infrastruktūras sastāvdaļa ir valodas tehnoloģiju (VT) pakalpojumi, kas tiek lietoti gan dažādos datu apstrādes procesos, gan...

IPCEI-CIS projekts stiprina Eiropas digitālo suverenitāti, attīstot jaunas paaudzes mākoņskaitļošanas infrastruktūru un pakalpojumus. Projekts veido visaptverošu, no pakalpojumu sniedzējiem neatkarīgu pilna tvēruma digitālu vidi no mākoņskaitļošanas līdz robežiekārtām. Būtiska topošās Eiropas mākoņskaitļošanas infrastruktūras sastāvdaļa ir valodas tehnoloģiju (VT) pakalpojumi, kas tiek lietoti gan dažādos datu apstrādes procesos, gan lietotnēs. Projekta iesniedzējs SIA Tilde ir IPCEI-CIS dalībnieks, kas IPCEI-CIS projektā ir apņēmies attīstīt šos VT pakalpojumus. Valodas tehnoloģiju pakalpojumi ļauj veidot dažādus risinājumus, kas apstrādā nestrukturētus datus gan rakstītā, gan runātā formā, nodrošina dabiskā valodā balstītas saskarnes, nodrošina pakalpojumu daudzvalodību gan ar mašīntulkošanu, gan citiem daudzvalodīgiem rīkiem. Tādējādi IPCEI-CIS infrastruktūras valodas tehnoloģiju pakalpojumi stiprinās Eiropas Savienības valodu digitālo līdztiesību. IPCEI-CIS veidotā Eiropas mākoņskaitļošanas infrastruktūras konkurētspējas nodrošināšanai nepieciešams ietvert nepieciešamākos valodas tehnoloģiju pakalpojumus - mašīntulkošanu, runas atpazīšanas un runas sintēzes rīkus, valodas identifikācijas un apstrādes rīkus un pēdējā laikā arī mākslīgā intelekta (MI) pakalpojumus, piemēram, semantisko meklēšanu, teksta ģenerēšanu, sarunbotus un citus informācijas izguves un analīzes rīkus. Valodu tehnoloģiju joma šobrīd mainās, iepriekšējās paaudzes tehnoloģijas, kas izmantoja statistiskās metodes un vienkāršākus mākslīgos neironu tīklus, jāaizvieto ar būtiski jaudīgākiem risinājumiem, kas izmanto ģenerējošo MI (Generative AI) un lielos valodas modeļus (LVM). Šī projekta primārais mērķis ir izpētīt un izveidot jaunus ģeneratīvajā mākslīgajā intelektā balstītus VT pakalpojumus un infrastruktūras programmatūru, kuru izvietot un nodrošināt IPCEI-CIS veidotajā Eiropas mākoņskaitļošanas infrastruktūrā. Tas ietver arī efektīvu izvietošanas un darbināšanas risinājumu izstrādi, kas pielāgoti LVM specifiskām prasībām. LVM rīku darbināšanai nepieciešama liela skaitļošanas jauda un grafiskie procesori (GPU), tiem ir augsts latentums, to startēšanai nepieciešams ilgs laiks, un to uzdevumi tiek grupēti un izpildīti paketēs. Projektā tiks izpētītas un nodrošinātas efektīvas metodes VT pakalpojumu pielāgošanai konkrētām jomām, lietojumiem un valodām, radot nepieciešamību pēc stabilas modeļu apmācības un pielāgošanas. Lai atbalstītu modeļu apmācību un pielāgošanu, projekts nodrošinās efektīvu liela apjoma apmācības datu uzglabāšanu, apmaiņu un koplietošanu. Šie dati ir jāpārvalda, stingri ievērojot drošības, datu privātuma un juridiskās prasības. Kopumā projekta mērķis ir izveidot stabilu pamatu mūsdienīgiem VT pakalpojumiem ES mākoņinfrastruktūrā, veicinot inovāciju un nodrošinot efektīvu daudzvalodu datu apstrādi un lietojumprogrammu izstrādi. Lai to panāktu, plānots sadarboties ar IPCEI CIS 3. darba plūsmas projektiem, kas koncentrējas uz IPCEI-CIS pakalpojumiem, un 4. darba plūsmas projektiem, kas koncentrējas uz lietojumprogrammām. Projekts sekmēs 3. darba plūsmas mērķus – 1) datu apmaiņa, 2) mākslīgais intelekts un 3) ekosistēmas platformas un komponenti. Papildus projekts veicinās 4. darba plūsmas projektus, integrējot VT pakalpojumus dažādās lietojumprogrammās. Projektu ir plānots īstenot no 2024. gada 4. ceturkšņa (precīzs datums atkarīgs no projekta apstiprināšanas) līdz 2027. gada 31. decembrim. Projekts praktiski risina Eiropas digitālajai nākotnei kritiskus uzdevumus, kas izvirzīti Eiropas Parlamenta 2018. gada 11. septembra rezolūcijā par valodu līdztiesību digitālajā laikmetā: - jāizmanto jaunās tehnoloģiskās pieejas, kuru pamatā ir palielināta skaitļošanas jauda un vieglāka piekļuve lieliem datu apjomiem, lai palīdzētu attīstīt dziļās mācīšanās neironu tīklus, kuri padara cilvēka valodas tehnoloģijas par reālu risinājumu valodas barjeru problēmai; - īpašām programmām, kas būtu īstenojamas pastāvošo finansēšanas shēmu, kā arī turpmāku finansēšanas programmu ietvaros, būtu jāstiprina ilgtermiņa fundamentālie pētījumi, kā arī zināšanu un tehnoloģijas nodošana starp valstīm un reģioniem; - iesaka izveidot Eiropas valodu tehnoloģiju platformu, kurā būtu pārstāvētas visas Eiropas valodas un kura dotu iespēju jo īpaši universitātēm un pētniecības centriem dalīties ar resursiem, pakalpojumiem un atvērtā pirmkoda pakotnēm, kas saistītas ar valodu tehnoloģijām, - mudina izstrādāt pasākumus ar pienācīgu finansējumu, kuru mērķis būtu Eiropas MVU un jaunuzņēmumiem dot iespējas viegli piekļūt valodas tehnoloģijām un tās izmantot, lai attīstītu savu uzņēmējdarbību tiešsaistē, ieejot jaunos tirgos un apgūstot jaunas attīstības iespējas, tādējādi palielinot savu inovācijas līmeni un radot jaunas darbvietas; - atbalsta daudzvalodu publisko e-pakalpojumu izveidi Eiropas, valstu, reģionu un attiecīgos gadījumos vietējo pašvaldību līmenī ar inovatīvām, iekļaujošām un palīdzīgām valodas tehnoloģijām, jo tādējādi Eiropā tiks samazināta valodu un valodu kopienu nevienlīdzība, sekmēta vienlīdzīga piekļuve pakalpojumiem, veicināta uzņēmumu, iedzīvotāju un darba ņēmēju mobilitāte un nodrošināts, ka daudzvalodu digitālais vienotais tirgus ir iekļaujošs. Vienlīdzīgu iespēju radīšana tehnoloģiju lietojumā atbilst arī Eiropas Savienības politikai mākslīgā intelekta un datu jomā, kas balstās uz iekļaujošu un vērtībās balstītu pieeju. Projektā izvirzītie mērķi ir saskaņā ar programmas mērķiem, palielināt privāto pētniecības un attīstības izdevumu apjomu, izmantojot mērķtiecīgus valsts ieguldījumus, kas veicina jaunu produktu un tehnoloģiju attīstību, iesaistoties Eiropai svarīgo kopīgo interešu projektos, atbilstoši MK noteikumu 3. punktā minētajam.

Līguma noslēgšanas datums***:

20.12.2024.

Projekta sākuma datums:

20.12.2024.

Projekta beigu datums****:

31.12.2027.

Nozare:

Datorprogrammēšana

Kods: 62.10

% -

ES līdzfinansējuma likme par katru prioritāro virzienu:

Darbību saraksta pēdējās atjaunināšanas datums:

20.12.2024.

* - Projekta nacionālā publiskā finansējuma apmērs

** - Projekta nacionālā privātā finansējuma apmērs

*** - Civiltiesiskā līguma vai vienošanās noslēgšanas datums

**** - Paredzamais darbības fiziskās pabeigšanas vai pilnīgas īstenošanas datums

***** - Projekta intervences kategorijas nosaukums saskaņā ar Regulas Nr. 1303/2013 96. panta 2. punkta pirmās daļas b) apakšpunkta vi) punktu