aA
„Mašina ‒ protingas daiktas, ar ne? Ar mašina taps žmogaus pašnekovu? Šie vyrai pasiryžę sukurti mašiną, kuri suprastų žmogaus kalbą“, ‒ skelbia nuotraukos prierašas žurnale „Jaunimo gretos“. Šiai žemiau skelbiamai nuotraukai šiemet sukanka 50 metų, o jos centre esantis prof. habil. dr. Laimutis Telksnys džiaugiasi, kad kartu su kitais lietuvių mokslininkais, tarp jų – lietuvių šnekos sintezatoriaus kūrėju dr. Pijumi Kasparaičiu ir Gediminu Navicku - išties įgyvendino šią svajonę.
Gediminas Navickas, Laimutis Telksnys, Pijus Kasparaitis
Gediminas Navickas, Laimutis Telksnys, Pijus Kasparaitis
© DELFI / Domantas Pipas

Siekė palengvinti duomenų įvedimą

Daugeliui yra tekę matyti istorinių nuotraukų, kuriuose užfiksuoti pirmieji kompiuteriai, atliekantys dabartiniu supratimu labai primityvius veiksmus, bet dydžiu lenkiantys solidžią spintą. O norint į juos suvesti informaciją, buvo daromos specialios kortelės, kuriomis perforatoriumi būdavo tam tikrose vietose išbadomos skylutės, taip užkoduojant raidę ar skaičių. Vienoje kortelėje tilpdavo 80 baitų informacijos, tai yra maždaug tiek ženklų. „Tų kortelių būdavo krūva, didžiausi lagaminai“, ‒ šypsosi prof. L. Telksnys.

Be to, kad duomenų suvedimas kortelėmis buvo labai nepatogus, būdavo ir kita problema: didelė klaidų tikimybė. „Viskas veikdavo taip: programuotojas užrašydavo ant popieriaus, ką jis nori įvesti į mašiną, o tuomet susėsdavo dvi mergaitės ir tose kortelėse perforuodavo vienodą tekstą. Dviejų reikėjo todėl, kad atlikdamos šimtą veiksmų jos padarydavo bent vieną klaidą, o tai yra baisiai daug. Todėl įdėjus abi korteles mašina patikrindavo, ar jos sutampa, ir, jei taip, tada įvesdavo. Tada iš 10 tūkstančių ženklų vis tiek likdavo viena klaida, toks „skersas“ buvo tas duomenų įvedimas“, ‒ pasakoja prof. L. Telksnys.

Pusę amžiaus puoselėta svajonė prakalbinti mašiną tapo tikrove
© Žurnalo "Jaunimo gretos" nuotr.

Stebėdamas tokį procesą prof. L. Telksnys vis galvodavo, kad jį turi būti įmanoma patobulinti. Juk žmonės bendrauja kur kas sklandžiau, tad gal taip galėtų ir mašinos? „Kai mes bendraujame, mūsų galvose atsiranda mintys, smegenys tas mintis paverčia komandomis, kurių klausydami mes kalbame. O kai mes kalbame, mūsų kalbos padargai žaidžia mikrobaletą. Kalbėdami ženklus mes paverčiame garsais, jie, pasiekę ausį, suvirpina atitinkamus neuronus – tuomet jūs suprantate, ką išgirdote. Galvojant apie tai, iškilo klausimas, ką turime daryti, kad galėtume į mašinas greičiau įvesti duomenis. O dar geriau būtų, jei galėtume tiesiog kažką pasakyti mašinai“, – apie idėjos užuomazgas pasakoja profesorius.

Sutelkė skirtingų sričių mokslininkus

Pusę amžiaus trukusiai istorijai aprašyti prireiktų knygos, bet, trumpai sakant, per visą tą laiko buvo kuriami teoriniai pagrindai būsimam išradimui. „Projektas LIEPA, kurio metu buvo sukurtas lietuvių šnekos sintezatorius, buvo skirtas pačių galutinių produktų sukūrimui. Bet kad jie galėtų atsirasti, reikėjo kelių dešimtmečių įdirbio“, – sako G. Navickas.

Įgyvendinti technologiniam sprendimui reikėjo įvairių sričių žinių: jėgas dėl šio tikslo suvienijo filologai, fonetikai, fizinių mokslų ir informacinių technologijų specialistai. Sintezatoriaus kūrėjas P. Kasparaitis, fizinių mokslų daktaras, pats kalba lyg fonetikas ar filologas. Rengdamas savo disertaciją jis kruopščiai išsinagrinėjo visą lietuvių kalbos gramatiką, viską, kas parašyta apie linksniavimą, asmenavimą, kirčiavimą ir kitas taisykles, kad visa tai galėtų perkelti į kompiuterines programas. „Tik kirčiavimas lietuvių kalba labai sudėtingas“, – atsidūsta jis. Tačiau be jo – nė iš vietos. Juk neteisingas kirtis gali visiškai pakeisti žodžio prasmę.

Mokslininkai įsitikinę – tokie fundamentiniai tyrimai būtini, ir niekas kitas jų už lietuvius nepadarys. „Būna, kiti sako, kad „Google“ jau padarė. Bet tokioms kompanijoms kaip „Google“ Lietuva ir jos 3 milijonai gyventojų visai neįdomūs, o kas padaryta anglų kalbai, mums netinka“, – sako G. Navickas.

Sėkmė slypi detalėse

Kalbant apie pačią sukurtą technologiją, iš pirmo žvilgsnio ji gali atrodyti gana paprasta. Į kompiuterį yra įrašomi diktorių balsai, skaitantys daug įvairaus teksto. Vėliau, kai gaunamas naujas tekstas, kompiuteris ieško pažįstamų žodžių junginių, atskirų žodžių, skiemenų, blogiausiu atveju – garsų.

Tačiau čia paprastumas ir baigiasi. Jei lietuvišką abėcėlę sudaro 32 raidės, garsų turime kur kas daugiau, šiame įrankyje jų skaičiuojama 92. Be to, nepakanka atrasti tokio paties skiemens ar raidės, jis dar turi būti ir tokiame pačiame kontekste, tai yra, žodžio pradžioje ar pabaigoje, po balsės ar priebalsės ir pan. Jei tai atitinka – galima klijuoti lyg galvosūkį. „Tačiau jei iš laikraščio iškirptumėte raides ir suklijuotumėte, mūsų akys tai lengvai perskaitytų. Suklijavus garsus gaunamas didelis traškėjimas – dr. P. Kasparaitis atliko didžiulį darbą, kad jo neliktų“, – kolegą giria prof. L. Telksnys.

Be to, reikia sugalvoti, kaip kompiuteris turi suprasti, kaip skaityti skaičius, pavyzdžiui, vietoj šimto nesakydamas vienas nulis nulis, taip pat trumpinius ar ženklus. O išsprendus begalę tokių niuansų, tenka pagalvoti ir apie tokius dalykus, koks balsas kokiam klausytojui bus malonesnis. „Šį įrankį jau išbandė ir moksleiviai. Jų pastaba buvo, kad norėtų klausytis jaunesnio balso, matyt, mokytojų balsai jiems jau įkyrėję, o mes apie tai net nepagalvojome“, – juokiasi prof. L. Telksnys.

Pridėti naują balsą taip pat nėra lengvas uždavinys. Juk kiekvieną jį kompiuteris turi atpažinti. „Kad gautume apie 4 valandų įrašą, su profesionaliu diktoriumi įrašinėjame 3-4 dienas. O juk net to paties žmogaus balsas vienoks ryte, kitoks popiet, dar kitoks kai jis pavargęs, laimingas ar liūdnas. Tačiau mums reikia tuos įrašus kažkaip suvienodinti“, – pasakoja dr. P. Kasparaitis.

Tobulėjančios technologijos, leidžiančios klausytis užuot skaičius kompiuteryje esančią informaciją ar jį valdant balsu, itin reikalingos silpnaregiams ir neregiams. Mokslininkai neslepia iš jų sulaukę didelio susidomėjimo ir noro įsijungti į procesą. Sprendžiant šį klausimą vėl teko išsiaiškinti jų poreikių subtilybes. „Silpnaregiai ar neregiai nemato ekrano, jie jį girdi. Ar pastebite, kad mes tekstą ekrane kartais tiesiog perbėgame akimis? Pasirodo, jie taip pat greitai perbėga garsą, tad jiems pritaikytus įrašus mes pagreitinome: neįgudusiai ausiai net sunku suprasti. Jei įgarsinamos, pavyzdžiui, knygos, jos skaitomos lėtai, bet greitai vartojamai informacijai to nereikia“, – pasakoja G. Navickas.

Planuose – lietuviškai kalbinamos mašinos

Šiuo metu mokslininkai jau ruošiasi naujam projekto etapui, kuriame daugiau dėmesio skirs ne tik jau sukurto šnekos sintezatoriaus tobulinimui, bet ir balso atpažinimo technologijoms. Pasaulyje jau veikia panašios sistemos anglų ar kitomis užsienio kalbomis, bet lietuviškai iki šiol su mašinomis kalbėti negalėjome.

„Jūs pareinate namo, gaminate valgį, ruošiatės ir tiesiog pasakote kompiuteriui „Paskaityk man DELFI naujienas. Tokių dalykų nereikės ilgai laukti, dešimtmečio neužtruks“, – įsitikinęs prof. L. Telksnys, matantis ir tokių technologijų pritaikymo vystant tarpkalbinius ryšius galimybes. Jau eksperimentuojama su tokiais įrenginiais, kai technologijos bendraujant iškart verčia žmogaus kalbą ir leidžia paprasčiau komunikuoti su kitakalbiais.

Mokslininkai sako, kad ši technologija prisidės ir prie lietuvių kalbos puoselėjimo. „Jei žmonės norės, kad jų tekstas būtų taisyklingai perskaitytas kompiuterio, jie turės jį teisingai ir užrašyti. Jei reikalingos, pavyzdžiui, užsienietiškos pavardės, jas reikia rašyti lietuviškai, skliausteliuose įrašant originalo kalba, jei norime, kad paieškos sistemos jas paprasčiau rastų duomenų bazėse. Taigi lietuviško teksto nereikėtų užteršti jei ne dėl kažkokių kitokių, tai grynai dėl praktinių priežasčių“, – sako prof. L. Telksnys.

www.DELFI.lt
Griežtai draudžiama DELFI paskelbtą informaciją panaudoti kitose interneto svetainėse, žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo, o jei sutikimas gautas, būtina nurodyti DELFI kaip šaltinį.
|Populiariausi straipsniai ir video
Įvertink šį straipsnį
Norėdami tobulėti, suteikiame jums galimybę įvertinti skaitomą DELFI turinį.
(1 žmogus įvertino)
5.0000

Populiarią COVID-19 skirtą svetainę administruojantis 17-metis atmetė kelių milijonų vertės pasiūlymą: mintis apie reklamą jam nepriimtina (9)

Avi Schiffmannas nuolatos vėluoja atlikti namų darbus, tačiau jo pasiteisinimas – daugiau nei...

Astronomai rado žvaigždę, išgyvenusią artimą kontaktą su juodąja skyle (42)

Kai juodosios skylės didžiuliais kiekiais ryja aplink jas esančią materiją, vaizdelis nėra labai...

Naujo tyrimo išvada: nuo COVID-19 per savaitę miršta 20 kartų daugiau žmonių nei nuo gripo (85)

Naujojo koronaviruso sukeliama liga tikrai nėra tiesiog dar vienas gripas, teigia neseniai atlikto...

Sėkmingo svorio metimo sportuojant paslaptis gali būti sportui tinkamo dienos meto pasirinkimas (3)

Surasti laiko pasimankštinti gali būti tikras iššūkis: daugelis mūsų, atradę laisvą minutę,...

NASA uždegė žalią šviesą pirmajam pilotuojamam skrydžiui „SpaceX“ erdvėlaiviu (21)

NASA penktadienį pranešė uždegusi žalią šviesą kitą savaitę planuojamam pilotuojamam...

Top naujienos

Karantino pragaras baigėsi: daugiausiai gyventojų dėl pandemijos netekusios Lombardijos sostinė šokiruoja pareigūnus (39)

Jau nebe vaiduoklių miestas! Toks pojūtis, tokia mintis neapleidžia pasižvalgius po barokinį...

Visą Lietuvą sukrėtusių Kauno žudynių byla – vėl teisėsaugos akiratyje (616)

Daugiau kaip prieš 10 metų visą Lietuvą sukrėtusių Kauno žudynių byla vėl atsidūrė ant...

Kardiologė išvardijo padidėjusio kraujospūdžio 7 simptomus: jei juos pastebite, turite imtis veiksmų (53)

Lietuvoje padidintą kraujo spaudimą turi netgi 60 procentų gyventojų. Apie hipertenziją laidoje...

Kinija imasi milžiniško 4,2 mlrd. dolerių vertės projekto Afrikoje (41)

Daugiau nei du dešimtmečius Zimbabvė bandė išjudinti milžiniško anglies energijos komplekso...

Orai lietuvių nelepins – paskutinę gegužės savaitę laukia nemažai lietaus (1)

Pirmadienio dieną aplink mūsų šalį suksis keli nykstantys žemo slėgio sūkuriai, todėl debesų...

Kipras birželį leis skrydžius iš Lietuvos: reikės pateikti koronaviruso tyrimo pažymą (16)

Kipro valdžia patvirtino veiksmų planą dėl Larnakos ir Pafoso oro uostų atidarymo, rašo KNEWS...

PSO: pasaulyje užsikrėtusiųjų naujuoju koronavirusu per parą padaugėjo 101 tūkst. (63)

Per pastarąją parą pasaulyje užfiksuota daugiau kaip 101 tūkst. naujų užsikrėtimo koronavirusu...

Delfi kino seansas: filmas „Liza, namo”

Vaiko siela nenori taikstytis su supančia aplinka. Filme mėginta užfiksuoti tai, kas atspindi vaiko...

Pilkoji zona: kas iš tiesų liko nepastebėta kontroversiškoje Švedijos kovoje su koronavirusu (132)

Švedija atsidūrė viso pasaulio dėmesio centre, kai priėmė sprendimą atsisakyti karantino kaip...

ESPN prisiminė gėdingą žalgiriečio Bowie poelgį – nesuprato nei savi, nei svetimi vaizdo įrašas (15)

Krepšininkai dažnai kartoja, kad žaidžia ne dėl asmeninės statistikos ir individualių...

|Maža didelių žinių kaina