Prieš 8 tūkstantmečius atsiradęs raštas yra vienas nuostabiausių žmonijos išradimų, kuris mokslininkus domina ne tik dėl išlikusių rašytinių šaltinių turinio. Kartais rašysena apie autorių gali pasakyti gerokai daugiau nei pats turinys: todėl teismo ekspertai geba nustatyti rankraščių autorystę; o grafologai sudaryti psichologinį žmogaus portretą, atskleisdami tokias asmenines savybes kaip socialumas, temperamentas, savivertė ar trūkumai.
© Shutterstock nuotr.

Tačiau ar įmanoma ką nors pasakyti apie žmogų, kurio pagrindine rašymo priemone tapo klaviatūra? Laimei, taip. Technologinis šuolis paskatino progresą ir kitose mokslo srityse, taip pat kompiuterinės lingvistikos.

Mokslininkai jau seniai sutaria, jog kiekvieno mūsų rašymo stilius (t.y. šablonai, kuriuos naudojame sakinių formavimui; žodyno turtingumas; frazeologizmai; netgi gramatinės ar sintaksinės klaidos) yra savotiškas mūsų „piršto antspaudas“. O rašymo stilių tyrinėjantis mokslas stilometrija, kurio užuomazgos siekia 1439 metus, padarė milžinišką šuolį būtent pastaraisiais dešimtmečiais. Visų pirma šį progresą paskatino pats tokių tyrimų poreikis.

Teismo lingvistai nuolatos susiduria su panašiomis problemomis: internetiniame forume atskleidžiama konfidenciali įmonės informacija; asmuo gauna grasinančio turinio elektroninį laišką, kurio adresas visiškai neinformatyvus; kompiuteryje randamas atsisveikinimo laiškas, tačiau neaišku ar tikrai tą laišką rašė pats savižudis; paauglių socialiniame tinkle susitikti siūlo skirtingais vardais prisistatantis pedofilas.

Tačiau uždavinys nėra toks paprastas. Įsivaizduokite... turite 150 skirtingų autorių ir po 200 kiekvieno iš jų rašytų trumpų tekstų. Gaunate naują anoniminį tekstą, žinodami tik tiek, jog jis vieno iš šių autorių, o dabar belieka nustatyti turimo teksto autorystę. Net jei kantrybė ir geležinė, žmogui išspręsti šį uždavinį – misija neįmanoma: jis tiesiog nesugeba tuo pačiu metu atsižvelgti ir savo atmintyje išlaikyti tiek daug įvairiausių detalių.

Nors elektroninių tekstų naudojimas ir pridarė daugybę problemų, tačiau naujos technologijos padeda tas problemas išspręsti. Kompiuteriui, priklausomai nuo jo galingumo bei pasirinkto metodo, tereikia kelių minučių ar valandų susidoroti su mūsų uždaviniu bei pasiekti 67 proc. tikslumą lietuvių kalbai, kuomet atsitiktinis spėjimas viršijamas daugiau nei 66 procentus. Rezultatai vis tiek nėra idealūs, tačiau pasiekti 100 proc. dirbant su kalba neverta tikėtis: koją kiša labai trumpi tekstai (na, ką ten galima pasakyti apie autorystę iš vieno ar keleto žodžių!), nusistovėję posakiai (pvz. „nekask duobės kitam, nes pats įkrisi“ visi mes sakome vienodai), mėgdžiojimas ar plagijavimas (rezultatai prastėja, kadangi tampa sunkiau surasti skiriančiuosius požymius tarp mėgdžiojamo ir mėgdžiojančio autorių).

Kai kurie uždaviniai (pavyzdžiui, rinkodaros specialistai siekia išsiaiškinti kokie vartotojai domisi jų produkcija) visiškai nereikalauja nustatyti konkrečių autorių, o tik suformuoti detalesnį autoriaus profilį, išsiaiškinant amžių, lytį, socialinį statusą, psichologinę būseną ir kt. Žinomas psichologas Jamesas Pennebakeris kartu su kompiuterinės lingvistikos specialistais daugybę metų užsiima šiais tyrimais anglų kalbai. Jo pasiekti rezultatai priverčia aiktelėti iš nuostabos, todėl tiesiog privalau pateikti keletą įdomesnių.

Ar žinote, kad kalbėtojo lytį galima efektyviai nustatyti iš jo tekste naudojamų asmeninių įvardžių (aš, tu, mes, ir t.t.)? Jų kalbėdamos moterys pasako 1,5 proc. daugiau negu vyrai. Neatrodo reikšmingas skirtumas, tačiau per metus jos pasako jų 85 tūkstančiais daugiau. Be to moterys gerokai dažniau naudoja žodelį „aš“. Vyrai vartoja daugiau daiktavardžių, moterys – veiksmažodžių. Vyrai ir moterys naudoja vienodai teigiamų jausmus nusakančių žodžių, tačiau neigiamų moterys naudoja gerokai daugiau.

Beje, kalbėjimą veikia hormonai (vyriškas testosteronas ir moteriškas estrogenas), todėl pradėjus vartoti priešingos lyties hormonus, keičiasi ir kalbėjimo stilius. Lyties nustatymo iš teksto uždavinys gerokai paprastesnis (tik dvi grupės), tačiau atsitiktinį spėjimą t.y. 50 proc. žmogus geba aplenkti vos 5 procentais, kai tuo tarpu statistiniai metodai anglų kalbai jį viršija 30 proc. ir leidžia pasiekti 80 procentų. Palyginimui: lietuvių kalbai – viršija 24 proc. ir leidžia pasiekti 74 proc. tikslumą.

Taigi... Stilometrijos metodai pasiekė tokį lygį, kad priverstų bijoti tuos, kurie ketina „slapta“ nusikalsti, bet, deja, ne tiek, kad Jūs, mielas skaitytojau, ir aš elektroninėje erdvėje galėtume jaustis visiškai saugūs.

Autorystės nustatymo tyrimus lietuvių kalbai finansuoja Lietuvos mokslo taryba (projekto Nr. LIT-8-69).

Griežtai draudžiama DELFI paskelbtą informaciją panaudoti kitose interneto svetainėse, žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo, o jei sutikimas gautas, būtina nurodyti DELFI kaip šaltinį.
Populiariausios nuomonės
Parašykite savo nuomonę
arba diskutuokite anonimiškai čia
Skelbdami savo nuomonę, Jūs sutinkate su taisyklėmis
Rodyti diskusiją Rodyti diskusiją

Iš Naujosios Zelandijos į orbitą iškelta firmos „Rocket Lab“ raketa (1)

Naujojoje Zelandijoje sekmadienį aerokosminių technologių firma „Rocket Lab“ sėkmingai į...

Ar „Facebook“ pokyčiai padės atsikratyti priklausomybės nuo socialinių tinklų (11)

Markas Zuckerbergas tvirtina sieksiąs, kad „Facebook“ padėtų kurti žmonių gerovę. Deja, jo...

„Instagram“ ir „Google+“ jungiasi prie kovos su neapykantos kurstymu internete (7)

Penktadienį paskelbtas trečiasis Kovos su neapykantos kurstymu internete elgesio kodekso...

Top 5 telefonai jaunimui (43)

Studentams ar jaunuoliams, dar tik pradedantiems gyventi savarankiškai, prabangūs flagmanai – nors...

Lietuvių fenomenas: kylančios išmaniųjų telefonų kainos – nė motais (202)

Nepaisant to, kad 2017-aisiais visame pasaulyje augo išmaniųjų kainos, jų pardavimai taip pat...

Top naujienos

Dėl dvylikamečio susikibo JAV ir Sovietų Sąjunga: berniukas atsisakė grįžti namo  „tėvas tik prieš mirtį pripažino, kad padarė klaidą“

Devintajame praėjusio amžiaus dešimtmetyje apie Vladimirą Polovčaką skelbė beveik visos...

Švedijos pakilimo istorija: kodėl jiems sekasi (61)

Švedijoje susiformavusiai ekonominei ir socialinei politikai didelės įtakos turėjo šalyje...

Rokiruotė Seime: Pūką keis tikrai spalvinga asmenybė į jo vietą sėstis nenorėtų (732)

Seimui panaikinus seksualiniu priekabiavimu apkaltinto Kęstučio Pūko mandatą į Parlamentą...

Iš kelto Ryga-Stokholmas iškrito lietuvis, jo paieškos bevaisės (33)

Šeštadienį vakare iš „Tallink“ kelto „Isabelle“ iškrito lietuvis. Jo gelbėjimo...

Valančiūnas ar Sabonis: kurio lietuvio savo komandoje labiau norėtų NBA žaidėjai? specialiai DELFI iš Londono (32)

Tik antrąjį sezoną Nacionalinėje krepšinio asociacijoje ( NBA ) rungtyniaujantis Domantas...

Krepšininkas Simas Jasaitis įtariamas smurtu šeimoje, vyras atsidūrė policijoje (599)

Krepšininkas Simas Jasaitis atsidūrė policijoje dėl smurto artimoje aplinkoje. Garsus...

Gyvenimas pasienyje – jautukai lenkams, mėsa į namus iš lenkiškų parduotuvių (55)

Lietuvos kaime, ypač nederlingose Dzūkijos žemėse, sparčiai populiarėja mėsinių galvijų...

Gyvai / Eurolygos jaunimo atrankos turnyro finalas: „Lietuvos rytas“ - „Stellazzurra“ (3)

Eurolygos jaunimo atrankos turnyro finalas: „Lietuvos rytas“ - „Stellazzurra“. Tiesiogiai iš...

Užkalnis: jei susapnavote, kad galite kurti restoraną, nieko nedarykite (63)

Būna tokių sapnų, kurie kankina savo beviltiškumu: pavyzdžiui, eini ilgu ilgu koridoriumi, ir...

Žmonės moka pinigus, kad pamatytu keisčiausius dalykus: nuo dešrelių iki mirties ekspozicijų (1)

Yra daugybė muziejų, kurie yra visiškai įprasti. Dažniausiai juose eksponuojami meno kūriniai,...