}

Neironu tīkli fleksīvo dabisko valodu apstrādei

Projekta nosaukums :Neironu tīkli fleksīvo dabisko valodu apstrādei
Projekta numurs :1.1.1.1/16/A/215
Finansējuma saņēmējs :Sabiedrība ar ierobežotu atbildību "TILDE"
Reģ.Nr.:40003027238
Jur. adrese: Vienības gatve 75A, Rīga, LV-1004
Projekta sadarbības partneri :
Npk. Nosaukums Reg. Nr. Adrese
1. LATVIJAS UNIVERSITĀTE 90000076669 Raiņa bulvāris 19, Rīga, LV-1050
Projekta īstenošanas vieta :
Npk. Vieta (adrese) Reģions
1. Vienības gatve 75, Rīga, LV-1004 Rīga
2. Raiņa bulvāris 19, Rīga, LV-1050 Rīga
Specifiskā atbalsta mērķa (SAM) nosaukums un numurs :1.1.1. Palielināt Latvijas zinātnisko institūciju pētniecisko un inovatīvo kapacitāti un spēju piesaistīt ārējo finansējumu, ieguldot cilvēkresursos un infrastruktūrā
Projekta kopējais finansējums :690 654.47
Projektam piešķirtais ES fondu līdzfinansējums : ERAF: 484 355.98
Nacionālais publiskais finansējums* :-
Nacionālais privātais finansējums** :206 298.49
Kopējie atbilstīgie izdevumi :690 654.47
Atbildīgā iestāde :Izglītības un zinātnes ministrija
Projekta mērķa grupa :Projektam ir ieguldījums RIS3 izaugsmes 4. prioritātē un tiek īstenots IKT jomā efektīvas sadarbības ietvarā starp komersantu Tildi un zinātnisko institūciju LU. Starp projektā iesaistītajiem darbiniekiem būs 6 jaunie zinātnieki un 2 doktoranti, tādējādi nodrošinot ietekmi uz visām SAM pasākuma mērķgrupām. Tilde: •iegūtās zināšanas izmantos konkurētspējīgu valodu tehnoloģiju risinājumu izveidē, trīs gadu laikā pēc projekta beigām paaugstinās konkurētspēju esošajiem risinājumiem (mašīntulkošanas sistēmām, virtuālajiem aģentiem un pareizrakstības rīkiem), panāks, ka jaunie produkti nodrošina vismaz 5% apgrozījuma pieaugumu pēc produkta laišanas tirgū un ka peļņa no tiem ir vismaz 10% no kopējās peļņas, tādējādi sekmējot RIS 3 mērķi palielināt inovatīvo uzņēmumu īpatsvaru •palīdzēs sasniegt kopējo mērķi, palielinot P&A ieguldījumus uzņēmumā par 18% •attīstīs savu kompetenci un ekselenci neironu tīklu un valodu tehnoloģiju jomā, nostiprinot vadošās pozīcijas Latvijā IKT jomā un stiprinot savu Eiropas vadošā valodu tehnoloģiju uzņēmuma lomu •atbilstoši RIS 3 stratēģijai veicinās zinātnisko darbinieku iesaisti P&A privātajā sektorā, nodarbinot 6 zinātņu doktorus, tostarp 5 jaunos zinātniekus, un 2 doktorantus Latvijas Universitāte: •attīstīs kompetenci un ekselenci NT un VT, nostiprinot vadošās pozīcijas Latvijā un Eiropā datorzinātņu, kognitīvo zinātņu un lingvistikas jomā •stiprinās un attīstīs sadarbību un tehnoloģisko pārnesi ar komersantiem •attīstīs starpdisciplinārus pētījumus IT, kognitīvo zinātņu un valodniecības jomā, iesaistoties starptautiskos projektos. Projekta netiešās mērķgrupas: •jebkurš pētnieks vai izstrādātājs pētījuma rezultātus varēs izmantot citām valodām nepieciešamo tehnoloģiju attīstīšanā un starpsektoru vajadzībām atbilstošu risinājumu izveidē •lietotāji globālajā tirgū, kuriem IKT risinājumu nav pieejami dzimtajā valodā; •ikviens jauno tehnoloģiju lietotājs valstīs, kurās projekta rezultāti tiks komercializēti inovatīvos produktos
Projekta kopsavilkums :Modernu IKT risinājumu izveide nav iedomājama bez valodu tehnoloģijām, kuras nodrošina risinājumu pieejamību lietotāja dzimtajā valodā. META-NET veiktais pētījums (Rehm&Uszkoreit, 2013) norāda uz būtiskām atšķirībām valodas tehnoloģiju attīstības līmenī. Pasaules lielajām valodām tiek piešķirts vērtējums “no laba līdz izcilam”, bet valodām ar nelielu runātāju skaitu - “no vidēja līdz zemam”. Šīs plaisas mazināšana ir liels izaicinājums, mūsdienu valodu tehnoloģijās izmantotajām metodēm nepieciešami lieli datu apjumi, kuru īpaši trūkst mazajām fleksīvām valodām ar bagātu morfoloģiju. Viena no jaunākajām, daudzsološākajām tendencēm IKT risinājumu veidošanā ir neironu tīklu tehnoloģiju (NT) izmantošana. NT tiek veiksmīgi izmantoti tādām valodām kā angļu, franču, spāņu un ķīniešu valodām, taču dziļi pētījumi nelielām valodām ar nepietiekamiem valodas resursiem, piemēram, baltu, somu-ugru un slāvu valodām vēl nav veikti. Nepieciešamība mazināt plaisu valodu tehnoloģiju attīstībā un perspektīvā NT tehnoloģijas izmantošana paver lielu iespēju projekta komandai Rīgā, Latvijā. Šis projekts un tā sagaidāmie rezultāti Latvijai ļaus ieņemt vadošo pozīciju valodu tehnoloģiju izpētē un inovatīvu risinājumu radīšanā. Latvija jau šobrīd ir sasniegusi augstu līmeni šajā jomā, to nodrošinājusi cieša akadēmiskās vides un komerciālo struktūru sadarbība. Latvija līdzdarbojas pētniecībā ar citām Eiropas nācijām un ir piemērota valodu tehnoloģiju izpētes un inovāciju reģionālā centra izveidei. Projektā tiks pētīti, analizēti un novērtēti (gan ar automātiskām metodēm, gan manuāli) dažādi NT algoritmi, lai atrastu piemērotākos risinājumus vairākiem nozīmīgiem valodas tehnoloģiju uzdevumiem: - rakstītā teksta apstrādē – tekstu sintaktiskai analīzei, gramatiskuma novērtēšanai un gramatisko kļūdu labošanai (šos komponentus varēs izmantot arī automatizētas tulkošanas, runātās valodas un cilvēka-datora saziņas problēmu risināšanā); - runas tehnoloģijās – efektīvā runas atpazīšanā un runas sintēzē, jaunu datu ieguvē un sagatavošanā, ja pieejamais datu apjoms ir neliels; - automatizētā tulkošanā – labākā dažādu teksta vienību tulkojumu izveidē; automatizētā vārdnīcu izveidē; - cilvēka-datora saziņas modelēšanā – dabiskās valodas sapratnes, dialoga pārvaldības un dabiskās valodas ģenerēšanas uzdevumos. Tiks pētīti arī dialoga modelēšanas, zināšanu izguves un pārvaldības kognitīvie aspekti un to modelēšana neironu tīklos. Tiks pētītas dažādas NT arhitektūras, tostarp dziļie rekursīvie (angliski: deep recurrent), dziļie vienvirziena (angliski: feed-forward) NT, un efektīvi NT apmācības algoritmi, lai risinātu datu skrajuma, morfoloģiskās daudzveidības un resursu nepietiekamības problēmas. Tiks veikta kognitīvo procesu – valodas, vizuālās uztveres, semantiskās apstrādes – empīriska (korelatīva, eksperimentāla) izpēte. Iegūtās zināšanas tiks izmantotas inovatīvu fleksīvo valodu apstrādes metožu radīšanā. Pētījuma teorētiskie rezultāti tiks apkopoti vismaz 15 Web of Science vai SCOPUS datubāzēs iekļauto žurnālu vai konferenču rakstu krājumu publikācijās. Pētījuma teorētiskie rezultāti tiks pārbaudīti laboratoriskos prototipos (TRL 4), kā arī apvienoti prototipā cilvēka-datora saziņai (TRL 5). Veiksmīgākie risinājumi tiks publicēti kā atvērtā koda risinājumi. Plānoto pētījumu rezultātiem ir liels komercializācijas potenciāls, tāpēc pēc projekta beigām turpināsies to attīstīšana un stabilizēšana, lai izveidotu inovatīvus programmproduktus Latvijas un Eiropas tirgum. Projekts ir ar saimniecisko darbību saistīts projekts, tas tiks īstenots sadarbībā starp komersantu (Tilde) un pētniecības institūciju (Latvijas Universitāte) un ilgs no 2016. gada 1. novembra līdz 2019. gada 31. oktobrim. Projekta kopējas izmaksas ir 690 672,13 EUR, t.sk., ERAF atbalsts 484 384,04 EUR. Projekta pētniecības kategorija - eksperimentālā izstrāde un rūpnieciskie pētījumi. Projekts pēc Frascati rokasgrāmatas atbilst IKT zinātnes nozarei “1.2 Computer and information sciences”
Līguma noslēgšanas datums*** :31.01.2017
Projekta sākuma datums :31.01.2017
Projekta beigu datums**** :31.10.2019
Nozare***** :
Npk. Nosaukums Kods Procenti
1. Pētniecības un inovācijas darbības publiskos pētniecības centros un kompetences centros, kas ietver sadarbības tīklu veidošanu 060 -
ES līdzfinansējuma likme par katru prioritāro virzienu :85.00
Darbību saraksta pēdējās atjaunināšanas datums :01.03.2021
*     - Projekta nacionālā publiskā finansējuma apmērs
**    - Projekta nacionālā privātā finansējuma apmērs
***   - Civiltiesiskā līguma vai vienošanās noslēgšanas datums
****  - Paredzamais darbības fiziskās pabeigšanas vai pilnīgas īstenošanas datums
***** - Projekta intervences kategorijas nosaukums saskaņā ar Regulas Nr. 1303/2013 96. panta 2. punkta pirmās daļas b) apakšpunkta vi) punktu

Padalies ar informāciju: DrukātDrukāt
Uz augšu