aA
„Mašina ‒ protingas daiktas, ar ne? Ar mašina taps žmogaus pašnekovu? Šie vyrai pasiryžę sukurti mašiną, kuri suprastų žmogaus kalbą“, ‒ skelbia nuotraukos prierašas žurnale „Jaunimo gretos“. Šiai žemiau skelbiamai nuotraukai šiemet sukanka 50 metų, o jos centre esantis prof. habil. dr. Laimutis Telksnys džiaugiasi, kad kartu su kitais lietuvių mokslininkais, tarp jų – lietuvių šnekos sintezatoriaus kūrėju dr. Pijumi Kasparaičiu ir Gediminu Navicku - išties įgyvendino šią svajonę.
Gediminas Navickas, Laimutis Telksnys, Pijus Kasparaitis
Gediminas Navickas, Laimutis Telksnys, Pijus Kasparaitis
© DELFI / Domantas Pipas

Siekė palengvinti duomenų įvedimą

Daugeliui yra tekę matyti istorinių nuotraukų, kuriuose užfiksuoti pirmieji kompiuteriai, atliekantys dabartiniu supratimu labai primityvius veiksmus, bet dydžiu lenkiantys solidžią spintą. O norint į juos suvesti informaciją, buvo daromos specialios kortelės, kuriomis perforatoriumi būdavo tam tikrose vietose išbadomos skylutės, taip užkoduojant raidę ar skaičių. Vienoje kortelėje tilpdavo 80 baitų informacijos, tai yra maždaug tiek ženklų. „Tų kortelių būdavo krūva, didžiausi lagaminai“, ‒ šypsosi prof. L. Telksnys.

Be to, kad duomenų suvedimas kortelėmis buvo labai nepatogus, būdavo ir kita problema: didelė klaidų tikimybė. „Viskas veikdavo taip: programuotojas užrašydavo ant popieriaus, ką jis nori įvesti į mašiną, o tuomet susėsdavo dvi mergaitės ir tose kortelėse perforuodavo vienodą tekstą. Dviejų reikėjo todėl, kad atlikdamos šimtą veiksmų jos padarydavo bent vieną klaidą, o tai yra baisiai daug. Todėl įdėjus abi korteles mašina patikrindavo, ar jos sutampa, ir, jei taip, tada įvesdavo. Tada iš 10 tūkstančių ženklų vis tiek likdavo viena klaida, toks „skersas“ buvo tas duomenų įvedimas“, ‒ pasakoja prof. L. Telksnys.

Pusę amžiaus puoselėta svajonė prakalbinti mašiną tapo tikrove
© Žurnalo "Jaunimo gretos" nuotr.

Stebėdamas tokį procesą prof. L. Telksnys vis galvodavo, kad jį turi būti įmanoma patobulinti. Juk žmonės bendrauja kur kas sklandžiau, tad gal taip galėtų ir mašinos? „Kai mes bendraujame, mūsų galvose atsiranda mintys, smegenys tas mintis paverčia komandomis, kurių klausydami mes kalbame. O kai mes kalbame, mūsų kalbos padargai žaidžia mikrobaletą. Kalbėdami ženklus mes paverčiame garsais, jie, pasiekę ausį, suvirpina atitinkamus neuronus – tuomet jūs suprantate, ką išgirdote. Galvojant apie tai, iškilo klausimas, ką turime daryti, kad galėtume į mašinas greičiau įvesti duomenis. O dar geriau būtų, jei galėtume tiesiog kažką pasakyti mašinai“, – apie idėjos užuomazgas pasakoja profesorius.

Sutelkė skirtingų sričių mokslininkus

Pusę amžiaus trukusiai istorijai aprašyti prireiktų knygos, bet, trumpai sakant, per visą tą laiko buvo kuriami teoriniai pagrindai būsimam išradimui. „Projektas LIEPA, kurio metu buvo sukurtas lietuvių šnekos sintezatorius, buvo skirtas pačių galutinių produktų sukūrimui. Bet kad jie galėtų atsirasti, reikėjo kelių dešimtmečių įdirbio“, – sako G. Navickas.

Įgyvendinti technologiniam sprendimui reikėjo įvairių sričių žinių: jėgas dėl šio tikslo suvienijo filologai, fonetikai, fizinių mokslų ir informacinių technologijų specialistai. Sintezatoriaus kūrėjas P. Kasparaitis, fizinių mokslų daktaras, pats kalba lyg fonetikas ar filologas. Rengdamas savo disertaciją jis kruopščiai išsinagrinėjo visą lietuvių kalbos gramatiką, viską, kas parašyta apie linksniavimą, asmenavimą, kirčiavimą ir kitas taisykles, kad visa tai galėtų perkelti į kompiuterines programas. „Tik kirčiavimas lietuvių kalba labai sudėtingas“, – atsidūsta jis. Tačiau be jo – nė iš vietos. Juk neteisingas kirtis gali visiškai pakeisti žodžio prasmę.

Mokslininkai įsitikinę – tokie fundamentiniai tyrimai būtini, ir niekas kitas jų už lietuvius nepadarys. „Būna, kiti sako, kad „Google“ jau padarė. Bet tokioms kompanijoms kaip „Google“ Lietuva ir jos 3 milijonai gyventojų visai neįdomūs, o kas padaryta anglų kalbai, mums netinka“, – sako G. Navickas.

Sėkmė slypi detalėse

Kalbant apie pačią sukurtą technologiją, iš pirmo žvilgsnio ji gali atrodyti gana paprasta. Į kompiuterį yra įrašomi diktorių balsai, skaitantys daug įvairaus teksto. Vėliau, kai gaunamas naujas tekstas, kompiuteris ieško pažįstamų žodžių junginių, atskirų žodžių, skiemenų, blogiausiu atveju – garsų.

Tačiau čia paprastumas ir baigiasi. Jei lietuvišką abėcėlę sudaro 32 raidės, garsų turime kur kas daugiau, šiame įrankyje jų skaičiuojama 92. Be to, nepakanka atrasti tokio paties skiemens ar raidės, jis dar turi būti ir tokiame pačiame kontekste, tai yra, žodžio pradžioje ar pabaigoje, po balsės ar priebalsės ir pan. Jei tai atitinka – galima klijuoti lyg galvosūkį. „Tačiau jei iš laikraščio iškirptumėte raides ir suklijuotumėte, mūsų akys tai lengvai perskaitytų. Suklijavus garsus gaunamas didelis traškėjimas – dr. P. Kasparaitis atliko didžiulį darbą, kad jo neliktų“, – kolegą giria prof. L. Telksnys.

Be to, reikia sugalvoti, kaip kompiuteris turi suprasti, kaip skaityti skaičius, pavyzdžiui, vietoj šimto nesakydamas vienas nulis nulis, taip pat trumpinius ar ženklus. O išsprendus begalę tokių niuansų, tenka pagalvoti ir apie tokius dalykus, koks balsas kokiam klausytojui bus malonesnis. „Šį įrankį jau išbandė ir moksleiviai. Jų pastaba buvo, kad norėtų klausytis jaunesnio balso, matyt, mokytojų balsai jiems jau įkyrėję, o mes apie tai net nepagalvojome“, – juokiasi prof. L. Telksnys.

Pridėti naują balsą taip pat nėra lengvas uždavinys. Juk kiekvieną jį kompiuteris turi atpažinti. „Kad gautume apie 4 valandų įrašą, su profesionaliu diktoriumi įrašinėjame 3-4 dienas. O juk net to paties žmogaus balsas vienoks ryte, kitoks popiet, dar kitoks kai jis pavargęs, laimingas ar liūdnas. Tačiau mums reikia tuos įrašus kažkaip suvienodinti“, – pasakoja dr. P. Kasparaitis.

Tobulėjančios technologijos, leidžiančios klausytis užuot skaičius kompiuteryje esančią informaciją ar jį valdant balsu, itin reikalingos silpnaregiams ir neregiams. Mokslininkai neslepia iš jų sulaukę didelio susidomėjimo ir noro įsijungti į procesą. Sprendžiant šį klausimą vėl teko išsiaiškinti jų poreikių subtilybes. „Silpnaregiai ar neregiai nemato ekrano, jie jį girdi. Ar pastebite, kad mes tekstą ekrane kartais tiesiog perbėgame akimis? Pasirodo, jie taip pat greitai perbėga garsą, tad jiems pritaikytus įrašus mes pagreitinome: neįgudusiai ausiai net sunku suprasti. Jei įgarsinamos, pavyzdžiui, knygos, jos skaitomos lėtai, bet greitai vartojamai informacijai to nereikia“, – pasakoja G. Navickas.

Planuose – lietuviškai kalbinamos mašinos

Šiuo metu mokslininkai jau ruošiasi naujam projekto etapui, kuriame daugiau dėmesio skirs ne tik jau sukurto šnekos sintezatoriaus tobulinimui, bet ir balso atpažinimo technologijoms. Pasaulyje jau veikia panašios sistemos anglų ar kitomis užsienio kalbomis, bet lietuviškai iki šiol su mašinomis kalbėti negalėjome.

„Jūs pareinate namo, gaminate valgį, ruošiatės ir tiesiog pasakote kompiuteriui „Paskaityk man DELFI naujienas. Tokių dalykų nereikės ilgai laukti, dešimtmečio neužtruks“, – įsitikinęs prof. L. Telksnys, matantis ir tokių technologijų pritaikymo vystant tarpkalbinius ryšius galimybes. Jau eksperimentuojama su tokiais įrenginiais, kai technologijos bendraujant iškart verčia žmogaus kalbą ir leidžia paprasčiau komunikuoti su kitakalbiais.

Mokslininkai sako, kad ši technologija prisidės ir prie lietuvių kalbos puoselėjimo. „Jei žmonės norės, kad jų tekstas būtų taisyklingai perskaitytas kompiuterio, jie turės jį teisingai ir užrašyti. Jei reikalingos, pavyzdžiui, užsienietiškos pavardės, jas reikia rašyti lietuviškai, skliausteliuose įrašant originalo kalba, jei norime, kad paieškos sistemos jas paprasčiau rastų duomenų bazėse. Taigi lietuviško teksto nereikėtų užteršti jei ne dėl kažkokių kitokių, tai grynai dėl praktinių priežasčių“, – sako prof. L. Telksnys.

www.DELFI.lt
Griežtai draudžiama DELFI paskelbtą informaciją panaudoti kitose interneto svetainėse, žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo, o jei sutikimas gautas, būtina nurodyti DELFI kaip šaltinį.
Įvertink šį straipsnį
Norėdami tobulėti, suteikiame jums galimybę įvertinti skaitomą DELFI turinį.
(1 žmogus įvertino)
5.0000

Astrofizikai išsprendė beveik 900 metų senumo astronominę paslaptį: 6 mėnesius spindėjęs itin retas šviesulys dingo (23)

1181 metais Kinijos ir Japonijos žvaigždžių stebėtojai danguje pastebėjo šį tą neįprasto...

Žemę pasiekė du iš Visatos gelmių atkeliavę signalai: astrofizikai mano, kad tai iš laiko pradžios (38)

Du intriguojantys signalai, pasirodę mažame gravitacinių bangų detektoriuje, gali reprezentuoti...

Kavos mėgėjams – žinia iš laboratorijos Suomijoje: šio gėrimo laukia kardinalios permainos (16)

Vėsioji Suomija tikrai negarsėja kaip kavą auginanti šalis. Tačiau šioje Šiaurės Europos...

NASA Mėnulyje ruošiasi ieškoti vandens, kurį ateityje žada naudoti kaip kurą skrydžiams į tolimąjį kosmosą (30)

NASA paskelbė 2023 metais nutupdysianti vandens ledo paieškoms skirtą mėnuleigį Nobilės...

Saulės sistemoje pastebėti neatpažinti, neįprastai skriejantys objektai (35)

Keturi iš naujųjų objektų skrieja daugiau nei už 230 astronominių vienetų nuo Žemės...

Top naujienos

Provokacijos iš Baltarusijos darosi vis įžūlesnės: tai buvo pirmas kartais, kai neteisėtas migrantas taip elgėsi (10)

Neteisėtai į Lietuvą mėginančių patekti migrantų skaičius pastaruoju metu sumažėjęs,...

Šalies reanimacijose dėl COVID-19 gydomi keli mažamečiai: grėsminga komplikacija gali atsirasti net po 4–5 savaičių (198)

Sveikatos apsaugos ministras Arūnas Dulkys ketvirtadienį pranešė, kad Vilniuje, ligoninės...

Praeityje skandalingo veikėjo karjeroje – neįtikėtinas šuolis: be medicininio išsilavinimo gavo aukščiausias pareigas ligoninėje Malinauskas: tai visiškas absurdas (411)

Paaiškėjus apie kontroversiškai vertinamo Juliaus Pankos naujas pareigas Kupiškio ligoninėje,...

Medikai kovoja dėl sunkia COVID- 19 forma sergančio vaiko gyvybės: aiškėja, kad tėvai nebuvo pasiskiepiję (375)

Sveikatos apsaugos ministras Arūnas Dulkys feisbuke pasidalijo trumpa informacija apie reanimacijoje...

Lietuvos darbo rinkos neišgelbėtų net didžiuliai gimstamumo rodikliai: Krėpšta kalba apie imigraciją (262)

Vienas didžiausių iššūkių Lietuvos ekonomikai yra demografija , sako Lietuvos banko valdybos...

Policija įminė atokioje vietovėje rastos ir nieko nepamenančios moters mįslę jos kurtus papuošalus pirko Holivudo žvaigždės (5)

Nustatyta Kroatijai priklausančioje saloje rastos moters tapatybė. Išgelbėtoji nesugebėjo...

Alytuje prireikė pratęsimo: „Dzūkijai“ – „Žalgirio“ testas nuolat atnaujinama, pratęsimas – 84:84 (17)

„Betsafe- LKL “ pirmenybėse Alytaus „Dzūkija“ meta rimtą iššūkį šalies čempionų...

Pasidalino svarbiais patarimais keliaujantiems: kur nuomojamuose apartamentuose dažniausiai slepiama svečių sekimo įranga?

„AirBnB“ apartamentų nuomos populiarumas per pastarąjį dešimtmetį kardinaliai pakeitė mūsų...

Fausta Marija Leščiauskaitė. Ar egzistuoja baisesnė vieta nei viešieji moterų tualetai? (48)

Gerai jau – egzistuoja Rusija, Baltarusija, Šiaurės Korėja, Irakas, Somalis. Ten pasilikti,...

Metas burokėlių patiekalams: išbandykite socialinius tinklus užkariaujantį Kotrynos receptą (4)

Maisto tinklaraštininkė Kotryna Remeikaitė socialiniuose tinkluose dalijasi įvairiais receptais :...