Prieš 8 tūkstantmečius atsiradęs raštas yra vienas nuostabiausių žmonijos išradimų, kuris mokslininkus domina ne tik dėl išlikusių rašytinių šaltinių turinio. Kartais rašysena apie autorių gali pasakyti gerokai daugiau nei pats turinys: todėl teismo ekspertai geba nustatyti rankraščių autorystę; o grafologai sudaryti psichologinį žmogaus portretą, atskleisdami tokias asmenines savybes kaip socialumas, temperamentas, savivertė ar trūkumai.
© Shutterstock nuotr.

Tačiau ar įmanoma ką nors pasakyti apie žmogų, kurio pagrindine rašymo priemone tapo klaviatūra? Laimei, taip. Technologinis šuolis paskatino progresą ir kitose mokslo srityse, taip pat kompiuterinės lingvistikos.

Mokslininkai jau seniai sutaria, jog kiekvieno mūsų rašymo stilius (t.y. šablonai, kuriuos naudojame sakinių formavimui; žodyno turtingumas; frazeologizmai; netgi gramatinės ar sintaksinės klaidos) yra savotiškas mūsų „piršto antspaudas“. O rašymo stilių tyrinėjantis mokslas stilometrija, kurio užuomazgos siekia 1439 metus, padarė milžinišką šuolį būtent pastaraisiais dešimtmečiais. Visų pirma šį progresą paskatino pats tokių tyrimų poreikis.

Teismo lingvistai nuolatos susiduria su panašiomis problemomis: internetiniame forume atskleidžiama konfidenciali įmonės informacija; asmuo gauna grasinančio turinio elektroninį laišką, kurio adresas visiškai neinformatyvus; kompiuteryje randamas atsisveikinimo laiškas, tačiau neaišku ar tikrai tą laišką rašė pats savižudis; paauglių socialiniame tinkle susitikti siūlo skirtingais vardais prisistatantis pedofilas.

Tačiau uždavinys nėra toks paprastas. Įsivaizduokite... turite 150 skirtingų autorių ir po 200 kiekvieno iš jų rašytų trumpų tekstų. Gaunate naują anoniminį tekstą, žinodami tik tiek, jog jis vieno iš šių autorių, o dabar belieka nustatyti turimo teksto autorystę. Net jei kantrybė ir geležinė, žmogui išspręsti šį uždavinį – misija neįmanoma: jis tiesiog nesugeba tuo pačiu metu atsižvelgti ir savo atmintyje išlaikyti tiek daug įvairiausių detalių.

Nors elektroninių tekstų naudojimas ir pridarė daugybę problemų, tačiau naujos technologijos padeda tas problemas išspręsti. Kompiuteriui, priklausomai nuo jo galingumo bei pasirinkto metodo, tereikia kelių minučių ar valandų susidoroti su mūsų uždaviniu bei pasiekti 67 proc. tikslumą lietuvių kalbai, kuomet atsitiktinis spėjimas viršijamas daugiau nei 66 procentus. Rezultatai vis tiek nėra idealūs, tačiau pasiekti 100 proc. dirbant su kalba neverta tikėtis: koją kiša labai trumpi tekstai (na, ką ten galima pasakyti apie autorystę iš vieno ar keleto žodžių!), nusistovėję posakiai (pvz. „nekask duobės kitam, nes pats įkrisi“ visi mes sakome vienodai), mėgdžiojimas ar plagijavimas (rezultatai prastėja, kadangi tampa sunkiau surasti skiriančiuosius požymius tarp mėgdžiojamo ir mėgdžiojančio autorių).

Kai kurie uždaviniai (pavyzdžiui, rinkodaros specialistai siekia išsiaiškinti kokie vartotojai domisi jų produkcija) visiškai nereikalauja nustatyti konkrečių autorių, o tik suformuoti detalesnį autoriaus profilį, išsiaiškinant amžių, lytį, socialinį statusą, psichologinę būseną ir kt. Žinomas psichologas Jamesas Pennebakeris kartu su kompiuterinės lingvistikos specialistais daugybę metų užsiima šiais tyrimais anglų kalbai. Jo pasiekti rezultatai priverčia aiktelėti iš nuostabos, todėl tiesiog privalau pateikti keletą įdomesnių.

Ar žinote, kad kalbėtojo lytį galima efektyviai nustatyti iš jo tekste naudojamų asmeninių įvardžių (aš, tu, mes, ir t.t.)? Jų kalbėdamos moterys pasako 1,5 proc. daugiau negu vyrai. Neatrodo reikšmingas skirtumas, tačiau per metus jos pasako jų 85 tūkstančiais daugiau. Be to moterys gerokai dažniau naudoja žodelį „aš“. Vyrai vartoja daugiau daiktavardžių, moterys – veiksmažodžių. Vyrai ir moterys naudoja vienodai teigiamų jausmus nusakančių žodžių, tačiau neigiamų moterys naudoja gerokai daugiau.

Beje, kalbėjimą veikia hormonai (vyriškas testosteronas ir moteriškas estrogenas), todėl pradėjus vartoti priešingos lyties hormonus, keičiasi ir kalbėjimo stilius. Lyties nustatymo iš teksto uždavinys gerokai paprastesnis (tik dvi grupės), tačiau atsitiktinį spėjimą t.y. 50 proc. žmogus geba aplenkti vos 5 procentais, kai tuo tarpu statistiniai metodai anglų kalbai jį viršija 30 proc. ir leidžia pasiekti 80 procentų. Palyginimui: lietuvių kalbai – viršija 24 proc. ir leidžia pasiekti 74 proc. tikslumą.

Taigi... Stilometrijos metodai pasiekė tokį lygį, kad priverstų bijoti tuos, kurie ketina „slapta“ nusikalsti, bet, deja, ne tiek, kad Jūs, mielas skaitytojau, ir aš elektroninėje erdvėje galėtume jaustis visiškai saugūs.

Autorystės nustatymo tyrimus lietuvių kalbai finansuoja Lietuvos mokslo taryba (projekto Nr. LIT-8-69).

Griežtai draudžiama DELFI paskelbtą informaciją panaudoti kitose interneto svetainėse, žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo, o jei sutikimas gautas, būtina nurodyti DELFI kaip šaltinį.
Parašykite savo nuomonę
arba diskutuokite anonimiškai čia
Skelbdami savo nuomonę, Jūs sutinkate su taisyklėmis
Rodyti diskusiją Rodyti diskusiją
Naujienų prenumerata

Prognozuoja, kad pinigines netrukus pakeis telefonai (9)

Skaitmeninės technologijos keičia gyventojų finansinius įpročius: jaunesnio amžiaus gyventojai,...

Konkurse Kinijoje publiką sužavėjo robotų pademonstruoti įgūdžiai

Daugiau nei tūkstantis robotų puikiai įvaldytą kung fu techniką pademonstravo per šeštojo...

Rusijos vandenynų tyrimų laivas gali turėti slaptą tikslą (65)

„Yantar“ - vandenynų tyrimų laivas, Rusijos kariniame jūrų laivyne pristatytas 2015 metais....

Kaina skiriasi dvigubai: suskaičiavo „iPhone X" detalių savikainą (34)

„ Apple " pristatė jubiliejinį flagmaną „ iPhone X ", kainuojantį nuo 999 JAV dol. Interneto...

Kenkėjai sugrįžo: virtualią valiutą „gamino" tūkstančiai užkrėstų kompiuterių (3)

Aptikti du botnetai, sudaryti iš kenkėjiškomis programomis užkrėstų kompiuterių, kurie slapta...

Top naujienos

Įsimintina lietuvių kelionė „Ryanair“ lėktuvu: mums gėda dėl tokio tautiečio (45)

iš Rygos į Kelną skridusį „ Ryanair “ lėktuvą dėl, įtariama, girto įsisiautėjusio...

Lietuvos krepšinio lygos čempionato rungtynės: „Dzūkija“ - „Žalgiris“ (12)

Lietuvos krepšinio lygos čempionato rungtynės: „Dzūkija“ - „Žalgiris“. Tiesiogiai iš...

Lietuvos krepšinio lygos čempionato rungtynės: „Lietuvos rytas“ - „Pieno žvaigždės“ (14)

Lietuvos krepšinio lygos čempionato rungtynės: „Lietuvos rytas“ - „Pieno žvaigždės“....

Didelę problemą pastebėjo net „Google“: tai neturi tęstis (3)

Ar dažnai skaitote, kokios mobiliosios programėlės atsiuntimo ir įdiegimo sąlygos? Kiek...

Veikli moteris kūrybingai žvelgia net į daržovių auginimą (1)

Verslininkės Ingos Malinauskienės šeimos darže viskas auginama natūraliai, nenaudojant jokių...

G. Schroederis: JAV nesuinteresuotos Rusijos sustiprėjimu, bet Europos interesai – kitokie (96)

Buvęs Vokietijos kancleris Gerhardas Schroederis įsitikinęs, kad nė vienas būsimas Rusijos...

Garsus psichologas iš Amerikos Lietuvai turi gerų žinių (33)

Amerikietis psichologijos profesorius James Maddux – ne tik žinomas specialistas savo šalyje, bet...

Kinija paskelbė: misija į Marsą „gerokai įsibėgėjo“ (15)

Kinijos vykdoma 2020 metų savaeigio zondo misijos į Marsą programa „gerokai įsibėgėjo“,...

Luksnėniškis pamėgino naujai išrasti kepsninę (15)

Pietų Lietuvoje esančio Luksnėnų kaimo gyventojas Stasys Guzevičius sukūrė kiek kitokią nei...

Naujas požiūris ar gudrus planas: milžiniškas butas prabangiame name už nerealią kainą (87)

Sostinės savivaldybės planai Vilniaus Gedvydžių gatvėje esančiame name pirkti prabangų butą,...