Siekdami užtikrinti geriausią Jūsų naršymo patirtį, šioje svetainėje naudojame slapukus (angl. cookies). Paspaudę mygtuką „Sutinku“ arba naršydami toliau patvirtinsite savo sutikimą. Bet kada galėsite atšaukti savo sutikimą pakeisdami interneto naršyklės nustatymus ir ištrindami įrašytus slapukus. Jei pageidaujate, galite kontroliuoti ir/arba ištrinti slapukus. Išsamesnė informacija čia https://www.aboutcookies.org/ Jei ištrinsite slapukus, jums gali reikėti rankiniu būdu pakeisti kai kurias parinktis kaskart, kai lankysitės interneto svetainėje, o kai kurios paslaugos ir funkcijos gali neveikti.

Paieška
LIETUVAKOMENTARAIPASAULISEKONOMIKASPORTASĮDOMYBĖSGIMTASIS KRAŠTASISTORIJA
ŽMONĖSGAMTA IR AUGINTINIAIŠEIMA IR SVEIKATAMOKSLAS IR ITKULTŪRAŠVIETIMASGYNYBAPOPIEŽIAUS VIZITASMULTIMEDIJA
MOKSLAS IR IT

Dirbtinis intelektas mokosi lietuviškai

 
2018 07 11 12:00
Aktyvus lietuvių kalbos vartojimas elektroninėje erdvėje greitai taps vienu svarbiausių jos išlikimo veiksnių./digg-it.co.za nuotrauka
Aktyvus lietuvių kalbos vartojimas elektroninėje erdvėje greitai taps vienu svarbiausių jos išlikimo veiksnių./digg-it.co.za nuotrauka

Kalbos technologijų bendrovė „Tilde IT“ šį rudenį baigia dvejų metų projektą „Šnekos debesis“. Sukurta pirmoji šnekos atpažinimo programa Lietuvoje, ji paverčia lietuvių šneką į tekstą, pavyzdžiui, iš garso įrašo ar tiesiog diktuojamą žinutę išmaniajam telefonui.

Prie kuriamos platformos galės jungtis visi – privatūs vartotojai, valstybinės institucijos, verslas. Jau dabar galima atsisiųsti ir išbandyti pirmąją lietuvių šnekos atpažinimo programėlę „Tildės balsas“, jos testuojamąją versiją.

Pasitaiko atvejų, kad pradėjus skolos išieškojimą iš skolininko sąskaitos nurašomos visos lėšos. Tai reiškia, kad asmuo lieka be jokių lėšų.

„Technologijos sparčiai tobulėja, atsiranda vis naujų. Tarkime, balsu valdomi namai ar automobiliai. Mūsų tikslas – kad naujosios technologijos kalbėtų lietuviškai ir lietuviai galėtų patogiai jas naudoti. Dirbame Lietuvos rinkai ir mokome technologijas lietuvių kalbos“, – pabrėžė kalbos technologijų bendrovės „Tilde IT“ direktorė lituanistė Renata Špukienė.

Dėl tikslesnio atpažinimo

Per įgyvendinamą projektą „Šnekos debesis“ surinktas didelis garsynas. Jis verčiamas tekstu, ir dirbtinis intelektas išmokomas atpažinti tekstą pagal garsus. Kiekvienas žodis išskaidomas į garsus ir dirbtinis intelektas juos atpažįsta. Koks žodis reiškia kokius garsus. Tada technologija, pagrįsta giluminių neuroninių tinklų modeliu, naudojama naujai šnekai atpažinti.

„Šnekamosios kalbos atpažinimas bus juo tikslesnis, kuo švaresnis bus garso įrašas – be jokio triukšmo, pašalinių garsų. Jei žmogus kalba lėtai, raiškiai, ne per daug sudėtingais žodžiais, bendrine kalba, teksto atpažinimas bus gana tikslus. Pasiektas beveik 90 proc. tikslumas. Bet jei žmogus velia, skuba, aplinka triukšminga arba šneka keli kalbėtojai vienu metu, tekstą atpažinti sudėtingiau“, – aiškino R. Špukienė.

Pavyzdžiui, jei dirbtinis intelektas mokomas raiškia diktoriaus Marijaus Žiedo kalba, tokia technologija visai netiks žemaičio, kalbančio savo tarme, šnekai atpažinti. Reikėtų surinkti didelį žemaičių tarmės garsyną, įvairių kalbėtojų – vyrų, moterų, vaikų, ir išmokyti dirbtinį intelektą atpažinti tekstą pagal garsus, tada ir žemaičių šnekos atpažinimas bus tikslus.

Kuo didesnis garsynas, tuo daugiau galima išmokyti dirbtinį intelektą ir tuo tikslesnis bus šnekos atpažinimas. Pasak „Tilde IT“ direktorės, jis labai priklauso nuo turimų išteklių. Todėl labai svarbus lietuvių šneka valdomų paslaugų plėtrai Vilniaus universiteto mokslininkų su partneriais įgyvendintas projektas LIEPA ir šiemet pradėtas projektas LIEPA-2.

„Projekto LIEPA rezultatus esame oficialiai panaudoję savo projektui „Šnekos debesis“, – pasakojo „Tilde IT“ verslo vystymo vadovas Giedrius Karauskas. – Jie yra surinkę 113 val. anotuotą lietuvių šnekos garsyną. Taip pat kūrėme savo garsyną, derinome, dėliojome. Dabar turime bendrą garsyną ir juo apmokytą technologiją.“

Išlaisvins nuo gausybės rašymo

Numatyta sukurti keletą „Šnekos debesies“ technologijos pagrindu veikiančių produktų ir paslaugų: mobiliąją programą, suteiksiančią vartotojams galimybę automatinio šnekos atpažinimo ir teksto sintezės funkcijomis naudotis mobiliuosiuose įrenginiuose; garso failų transkribavimo ir šnekos sintezės paslaugų tinklalapį, į kurį vartotojai galės nusiųsti bet kokį tekstą ir gauti jį ištartą; asmeniniam kompiuteriui skirtą diktavimo programinę įrangą, suteikiančią galimybę diktuoti tekstus naudojantis „Microsoft Windows“ operacine sistema, „MS Office“ programomis ir „Tilde IT“ sukurta programine įranga; paslaugas trečiųjų šalių sistemų kūrėjams ir šnekos technologijų pritaikytojams.

itvoir.com nuotrauka
itvoir.com nuotrauka

Pasak R. Špukienės, šnekos atpažinimo paslaugas bus galima pasiekti per taikomųjų programų kūrimo sąsają API, kad kitos programinės įrangos naudotojai galėtų įsidiegti tam tikrą įskiepį ir naudotis ja. Bus sukurta sąsaja ir paprastiems vartotojams, kad galėtų iš karto prisijungti prie platformos ir dirbti joje. Šnekos atpažinimo technologija padės ne tik garso failus paversti tekstu, bet ir rasti reikiamą tekstą pagal raktinį žodį.

Produktai, turintys šnekos įdiktavimo ir protokolavimo funkcijas, pavyzdžiui, elektroninio laiško ar tekstinio dokumento rašymas balsu, imamas interviu, susirinkimų protokolavimas, yra aktualūs tiek privačioms įmonėms, tiek valstybinėms institucijoms, tiek paprastiems vartotojams. Įsidiegus naująją technologiją, automatiškai bus verčiama į tekstą, kas šnekama per posėdžius, pavyzdžiui, teismuose ar Seime. Žmogui liks tik peržiūrėti, kas surinkta, papildyti, jei ko trūksta, pataisyti. Technologija padės dirbti produktyviau, našiau, sutrumpins patį darbo procesą. Taip pat gydytojus išlaisvins nuo gausybės rašymo per pacientų apžiūrą, pateikiant rentgeno nuotraukų ar operacijų aprašus. Medikai galės tiesiog diktuoti, ir tekstas automatiškai atsiras išmaniojo telefono ar kompiuterio ekrane. Šneka valdomo kompiuterio bei šnekos sintezės funkcijos bus taip pat labai naudingos neįgaliems vartotojams, turintiems regėjimo ar motorikos koordinacijos sutrikimų.

Robotų debesis

Tarptautinė įmonių grupė „Tilde“ yra įsikūrusi trijose Baltijos šalyse. Jos centrinė būstinė – Latvijoje. „Tilde IT“ Lietuvoje veikia nuo 2000 metų. Kaip pasakojo įmonės vadovė, pradėta nuo lokalizavimo paslaugų – vertimo ir programinės įrangos pritaikymo mūsų kalbinei ir kultūrinei terpei. Pamažu imta kurti ir kalbos technologijas. Jau gerai žinoma „Tilde IT“ veiklos kryptis – lietuvių kalbos palaikymo programinės įrangos „Tildės biuras“ kūrimas. Pirmiausia atsirado rašybos, vėliau – gramatikos tikrintuvas, mašininis vertimas. Kuriant šnekos atpažinimo technologiją patirties semtasi iš kolegų Latvijoje. Jie jau yra įdiegę latvių šnekos atpažinimo programą „Tildes balss“.

Kalbos technologijų bendrovės “Tilde IT” direktorė lituanistė Renata Špukienė: "Mūsų tikslas - kad naujosios technologijos kalbėtų lietuviškai ir lietuviai galėtų patogiai jas naudoti." Alinos Ožič nuotrauka
Kalbos technologijų bendrovės “Tilde IT” direktorė lituanistė Renata Špukienė: "Mūsų tikslas - kad naujosios technologijos kalbėtų lietuviškai ir lietuviai galėtų patogiai jas naudoti." Alinos Ožič nuotrauka

„Lietuvių kalbos sudėtingumas labiausiai kliuvo mašininiam vertimui, nes mūsų kalba yra fleksinė ir ją sunku išversti, sudėlioti logiškai, pataikyti linksnius pagal tą logiką, išrinkti statistiškai teisingiausią variantą. Dirbtinis intelektas šiuo atveju padeda siekti tikslumo. Jis mąsto kaip ir žmogaus smegenys. Žmogus vieną ar kitą žodį parenka pagal kontekstą, aplinką, laikotarpį. Lygiai taip pat veikia ir dirbtinis intelektas, – lygino R. Špukienė. – Neuroniniai tinklai perleidžia žodį per daugybę sluoksnių – išanalizuoja kalbos formą, struktūrą, linksnį, emocijas. Tada gautą rezultatą tikslina su kitais gautais rezultatais. Tų sluoksnių mažėja, kol galiausiai gaunamas vienas, dirbtinio intelekto manymu, teisingiausias variantas.“

Pradžioje mašininiam vertimui taikytas gramatinis taisyklinis metodas. Vėliau atsirado statistinis mašininis vertimas. Abu metodus bandyta sujungti. Dabar mašininis vertimas grindžiamas neuroniniais tinklais ir toliau tobulėja, nes tobulėja technologijos, atsiranda naujų metodų, koncepcijų.

Neuroniniais tinklais grindžiamas mašininis vertimas, lietuvių šnekos užrašymas tekstu ir, atvirkščiai, teksto pateikimas balsu, – visos šios technologijos kartu, pasak „Tilde IT“ vadovės, leidžia jau galvoti apie kitą žingsnį – kompleksiškesnį taikymą. Per naują projektą „Robotų debesis“ kalbos technologijų bendrovė kurs virtualių asistentų, padedančių žmonėms įvairiais klausimais, platformą. Lietuviškai bendrauti su robotais bus galima ir balsu.

DALINTIS:
 
SPAUSDINTI
MOKSLAS IR IT
Rubrikos: Informacija:
EkonomikaGamta ir augintiniaiGimtasis kraštasGynybaKontaktai
ĮdomybėsIstorijaJurgos virtuvėKomentaraiReklama
KonkursaiKultūraLietuvaMokslas ir ITReklaminiai priedai
PasaulisPopiežiaus vizitasSportasŠeima ir sveikataPrenumerata
ŠvietimasTrasaŽmonės#ATEITIESLYDERIAIPrivatumo politika
#AUGULIETUVOJE#LEGENDOS#SIGNATARŲDNR#ŠIMTMEČIOINOVACIJOSKarjera
Visos teisės saugomos © 2013-2018 UAB "Lietuvos žinios"