Ar elektroninėje erdvėje vis dar įmanoma likti inkognito?

 (28)
Prieš 8 tūkstantmečius atsiradęs raštas yra vienas nuostabiausių žmonijos išradimų, kuris mokslininkus domina ne tik dėl išlikusių rašytinių šaltinių turinio. Kartais rašysena apie autorių gali pasakyti gerokai daugiau nei pats turinys: todėl teismo ekspertai geba nustatyti rankraščių autorystę; o grafologai sudaryti psichologinį žmogaus portretą, atskleisdami tokias asmenines savybes kaip socialumas, temperamentas, savivertė ar trūkumai.
© Shutterstock nuotr.

Tačiau ar įmanoma ką nors pasakyti apie žmogų, kurio pagrindine rašymo priemone tapo klaviatūra? Laimei, taip. Technologinis šuolis paskatino progresą ir kitose mokslo srityse, taip pat kompiuterinės lingvistikos.

Mokslininkai jau seniai sutaria, jog kiekvieno mūsų rašymo stilius (t.y. šablonai, kuriuos naudojame sakinių formavimui; žodyno turtingumas; frazeologizmai; netgi gramatinės ar sintaksinės klaidos) yra savotiškas mūsų „piršto antspaudas“. O rašymo stilių tyrinėjantis mokslas stilometrija, kurio užuomazgos siekia 1439 metus, padarė milžinišką šuolį būtent pastaraisiais dešimtmečiais. Visų pirma šį progresą paskatino pats tokių tyrimų poreikis.

Teismo lingvistai nuolatos susiduria su panašiomis problemomis: internetiniame forume atskleidžiama konfidenciali įmonės informacija; asmuo gauna grasinančio turinio elektroninį laišką, kurio adresas visiškai neinformatyvus; kompiuteryje randamas atsisveikinimo laiškas, tačiau neaišku ar tikrai tą laišką rašė pats savižudis; paauglių socialiniame tinkle susitikti siūlo skirtingais vardais prisistatantis pedofilas.

Tačiau uždavinys nėra toks paprastas. Įsivaizduokite... turite 150 skirtingų autorių ir po 200 kiekvieno iš jų rašytų trumpų tekstų. Gaunate naują anoniminį tekstą, žinodami tik tiek, jog jis vieno iš šių autorių, o dabar belieka nustatyti turimo teksto autorystę. Net jei kantrybė ir geležinė, žmogui išspręsti šį uždavinį – misija neįmanoma: jis tiesiog nesugeba tuo pačiu metu atsižvelgti ir savo atmintyje išlaikyti tiek daug įvairiausių detalių.

Nors elektroninių tekstų naudojimas ir pridarė daugybę problemų, tačiau naujos technologijos padeda tas problemas išspręsti. Kompiuteriui, priklausomai nuo jo galingumo bei pasirinkto metodo, tereikia kelių minučių ar valandų susidoroti su mūsų uždaviniu bei pasiekti 67 proc. tikslumą lietuvių kalbai, kuomet atsitiktinis spėjimas viršijamas daugiau nei 66 procentus. Rezultatai vis tiek nėra idealūs, tačiau pasiekti 100 proc. dirbant su kalba neverta tikėtis: koją kiša labai trumpi tekstai (na, ką ten galima pasakyti apie autorystę iš vieno ar keleto žodžių!), nusistovėję posakiai (pvz. „nekask duobės kitam, nes pats įkrisi“ visi mes sakome vienodai), mėgdžiojimas ar plagijavimas (rezultatai prastėja, kadangi tampa sunkiau surasti skiriančiuosius požymius tarp mėgdžiojamo ir mėgdžiojančio autorių).

Kai kurie uždaviniai (pavyzdžiui, rinkodaros specialistai siekia išsiaiškinti kokie vartotojai domisi jų produkcija) visiškai nereikalauja nustatyti konkrečių autorių, o tik suformuoti detalesnį autoriaus profilį, išsiaiškinant amžių, lytį, socialinį statusą, psichologinę būseną ir kt. Žinomas psichologas Jamesas Pennebakeris kartu su kompiuterinės lingvistikos specialistais daugybę metų užsiima šiais tyrimais anglų kalbai. Jo pasiekti rezultatai priverčia aiktelėti iš nuostabos, todėl tiesiog privalau pateikti keletą įdomesnių.

Ar žinote, kad kalbėtojo lytį galima efektyviai nustatyti iš jo tekste naudojamų asmeninių įvardžių (aš, tu, mes, ir t.t.)? Jų kalbėdamos moterys pasako 1,5 proc. daugiau negu vyrai. Neatrodo reikšmingas skirtumas, tačiau per metus jos pasako jų 85 tūkstančiais daugiau. Be to moterys gerokai dažniau naudoja žodelį „aš“. Vyrai vartoja daugiau daiktavardžių, moterys – veiksmažodžių. Vyrai ir moterys naudoja vienodai teigiamų jausmus nusakančių žodžių, tačiau neigiamų moterys naudoja gerokai daugiau.

Beje, kalbėjimą veikia hormonai (vyriškas testosteronas ir moteriškas estrogenas), todėl pradėjus vartoti priešingos lyties hormonus, keičiasi ir kalbėjimo stilius. Lyties nustatymo iš teksto uždavinys gerokai paprastesnis (tik dvi grupės), tačiau atsitiktinį spėjimą t.y. 50 proc. žmogus geba aplenkti vos 5 procentais, kai tuo tarpu statistiniai metodai anglų kalbai jį viršija 30 proc. ir leidžia pasiekti 80 procentų. Palyginimui: lietuvių kalbai – viršija 24 proc. ir leidžia pasiekti 74 proc. tikslumą.

Taigi... Stilometrijos metodai pasiekė tokį lygį, kad priverstų bijoti tuos, kurie ketina „slapta“ nusikalsti, bet, deja, ne tiek, kad Jūs, mielas skaitytojau, ir aš elektroninėje erdvėje galėtume jaustis visiškai saugūs.

Autorystės nustatymo tyrimus lietuvių kalbai finansuoja Lietuvos mokslo taryba (projekto Nr. LIT-8-69).

Parašykite savo nuomonę
arba diskutuokite anonimiškai čia
Skelbdami savo nuomonę, Jūs sutinkate su taisyklėmis
Rodyti diskusiją Rodyti diskusiją
 
Naujienų prenumerata

Technologijos

Didžioji Britanija spaus interneto kompanijas kovoti su ekstremaliu turiniu (1)

Didžioji Britanija svarsto įvairias galimybes, siekiant priversti interneto kompanijas kovoti su jų puslapiuose talpinamu ekstremaliu turiniu, interviu BBC televizijai teigė saugumo ministras Benas Wallace'as.

IT saugumo ekspertas įspėja: netrukus Lietuva gali tapti taikiniu (138)

Vienas iš kibernetinės apsaugos bendrovės „CyberGym“ steigėjų ir vadovas Ofiras Hasonas viešėdamas Vilniuje kalbėjo apie kibernetines atakas ir ragino su grėsmėmis susipažinti iš anksto, kad su jomis susidūrus nekiltų panika.

Vaikai ir išmaniosios technologijos: kur yra aukso vidurys? (1)

Ne vienas esame girdėję istorijų apie tai, kaip vaikai patys įsijungia mėgstamą kompiuterinį žaidimą arba animacinį filmuką, nors dar net dorai kalbėti nemoka. O mokyklinio amžiaus vaikų turintiems tėvams tikrai teko girdėti maldavimų nupirkti naujausio modelio telefoną, nes tokius jau turi klasės draugai.

„Facebook“ įkūrėjas gavo Harvardo universiteto garbės diplomą (2)

Praėjus 13 metų po mestų studijų Harvardo universitete socialinio tinklo „Facebook“ įkūrėjas Markas Zuckerbergas ketvirtadienį pagaliau gavo šios mokslo įstaigos diplomą.

Šveicarai sukūrė droną, kurio valdymas yra kaip aitvaro (1)

Žiniasklaidoje vis dažniau galima pamatyti bepiločių skraidyklių filmuotos ir fotografuotos medžiagos. Nemažai šios technologijos kritikų teigia, kad dronų savininkai pažeidinėja žmonių privatumą ir sudaro palankias sąlygas saugumo grėsmėms.