Kauno technologijos universiteto Matematikos ir gamtos mokslų fakulteto (KTU MGMF) Taikomosios matematikos katedros docentas Tomas Ruzgas sako, kad šiandien duomenims saugoti ir apdoroti nepakanka anksčiau taikytų duomenų valdymo priemonių. Todėl specialistų, gebančių ne tik tokius duomenis kaupti, bet ir apdoroti, tinkamai panaudoti pateikiant juos visuomenei ar įmonių reikmėms, vis dar trūksta.

– Docente, 2017 m. KTU MGMF išleido pirmąją Didžiųjų verslo duomenų analitikos absolventų laidą. Ar šie darbuotojai laukiami Lietuvos įmonėse? Ar Lietuva pakankamai turi specialistų, gebančių analizuoti ir apdoroti didžiuosius duomenis?

– Prieš keletą metų akademinė bendruomenė pripažino, kad darbdaviams reikia žmonių, kurie būtų ir analitikai-programuotojai, ir veiklos komandų pilnaverčiai nariai. Belieka pasidžiaugti, kad KTU MGMF vienas pirmųjų Baltijos regione pasiūlė studijų programą, skirtą naujos kartos duomenų mokslininkų rengimui. Šiuo metu vien tik Europos ir Šiaurės Amerikos universitetuose yra daugiau nei 100 panašių programų.

Tačiau mūsų universiteto Didžiųjų verslo duomenų analitikos studijos išskirtinės tuo, kad čia sinergiškai suteikiamos matematikos, informacinių technologijų ir ekonomikos žinios. Kadangi šie specialistai aprėpia tiek verslo, tiek informacinių sistemų sritis, be abejo, jie yra labai paklausūs ir gerai apmokami.

Šie specialistai dirba ir valstybės finansus administruojančiose institucijose, ir rinkos tyrimų įmonėse, ir dar labai daug kur. Ypatingai didžiulis jų poreikis yra bankų bei telekomunikacijų įmonių sektoriuose. Didžiosios užsienio kapitalo įmonės nesibodi pervilioti viena iš kitos analitikų, gebančių dirbti įrankiais, skirtais didelių duomenų masyvų apdorojimui, saugojimui, naudingos informacijos, žinių išgavimui.

Darbuotojui su nedidele patirtimi siūlomas pusantro – dviejų tūkstančių eurų atlyginimas jau atskaičius mokesčius. Ir tai dar ne riba.

– Skamba viliojančiai, tad pasikalbėkime apie didžiuosius duomenis plačiau. Kokiose verslo srityse ar pramonės įmonėse gali būti kaupiami ir apdorojami didieji duomenys? Ar neiškyla pavojų dėl tam tikrų duomenų teisėto kaupimo, jų savininko nustatymo?

– Daug anksčiau nei atsirado terminas „didieji duomenys“ Europa jau turėjo šios srities pradininką – Alaną Tiuringą, britų matematiką, kuris sugebėjo nulaužti nacistinės Vokietijos Enigma kodą.

Daugelis duomenų mokslininkų savo karjerą pradėjo kaip statistikai ar duomenų analitikai. Tačiau, kai didieji duomenys, kartu ir didžiųjų duomenų saugojimo ir apdorojimo technologijos, pradėjo augti ir vystytis, tie darbų vaidmenys vystėsi taip pat.

Duomenys nebėra tik atiduodami informacinių technologijų tvarkymui bei priežiūrai. Tai pagrindinė informacija, reikalaujanti analizės, kūrybinio smalsumo ir įgūdžių, kaip aukštųjų technologijų idėjas paversti pelnu.

Beje, didieji duomenys tampriai susiję su dirbtiniu intelektu. Kalbu ne apie tą dirbtinį intelektą, kuris rodomas Holivudo filmuose. Kai kompiuteriai tampa protingi, tuomet jie geba suprasti užklausas, tarpusavyje susieti duomenis bei daryti išvadas.

Rengiant gimtadienio šventę, protingas kompiuteris padės parengti kvietimus, atliks rezervacijas, galiausiai, jei pamiršote, primins apie tortą. O viskas prasidėjo 1970 m., kai JAV Gynybos pažangių tyrimų projektų agentūra užbaigė gatvių žemėlapių kūrimo projektą. 2003 m. ta pati agentūra sukūrė programinės įrangos modulius, kurie gali atlikti užduotis remdamiesi vartotojo įvestimi, aplinkos suvokimu ir galimybe gauti informaciją iš įvairių interneto šaltinių – daug anksčiau nei „Google“, „Amazon“ ar „Microsoft“ įgyvendino panašius sprendimus.

Šie darbai paklojo pamatus automatizavimui ir formalizuotam mąstymui, kuriuos dabar kasdieną matome. Kaip tai veikia realiame gyvenime? Sveikatos priežiūros sektoriuje galima greičiau parinkti veiksmingą gydymą. Mažmeninėje prekyboje gali būti greičiau papildomai pasiūlytos susijusios prekės ar paslaugos. Finansų srityje gali būti užkirstas kelias sukčiavimui. Ir taip toliau.

Kiekviename iš šių pavyzdžių aktualiu išlieka duomenų kaupimo ir jų panaudojimo etiškumas. Ar taikomi modeliai yra skaidrūs bei aiškūs? Ar neegzistuoja šališkumas? Visada turi būti gairės, kuriomis būtina vadovautis. Tačiau, kai susiduriama su globaliomis problemomis, svarbu neleisti, kad tobulumo siekimas netaptų kliūtimi progresui.

– Niekam ne paslaptis, kad įmonėse prikaupta daug įvairiausių duomenų. Kas, Jūsų manymu, lemia nuolatinį duomenų kiekių augimą? Ar Lietuvos įmonės pajėgios optimaliai panaudoti tuos sukauptus duomenis, pvz., rengiant įvairias ataskaitas? Ar įmonėms naudinga investuoti į didžiųjų duomenų analizę, ar tai gali padidinti konkurencinį jų pranašumą?

– Prisiminkime prieš kelerius metus kilusį didžiųjų duomenų ažiotažą. Kas atsitiko? Duomenų apdorojimo ir jų saugojimo pažanga sudarė galimybes įkelti bei analizuoti daugiau duomenų nei kada nors anksčiau.

Maždaug tuo pačiu metu prijungiant prie interneto vis daugiau įrenginių ir iš jų siunčiant didelius duomenų kiekius, kartu imta generuoti vis daugiau ir daugiau duomenų. Su išaugusiu kalbos ir vaizdo įvesčių skaičiumi į mūsų naudojamus įrenginius pagerėjo kompiuterių kalbos ir vaizdo atpažinimo galimybės.

Be to, duomenų mokslininkai gavo daug daugiau informacijos, reikalingos įmonių konkurenciniam pranašumui įgyti, tad ar įmonėms naudinga investuoti į didžiųjų duomenų analizę – net neverta diskutuoti. Atsakymas čia vienintelis – ne tik verta, bet ir būtina, jeigu siekiama ne egzistavimo, bet konkurencinio pranašumo.

Visi pasiekimai, susiję su didžiųjų duomenų analize ir jų apdorojimu, verslui leidžia kurti protingus sprendimus, su kuriais kasdieniame gyvenime susiduriame vis dažniau ir dažniau – nuo nepastebimų rekomendacijų apsipirkimo vietose iki automatinių nuotraukų žymų socialinėje žiniasklaidoje. Daugelis mums įprastų patogumų yra sukurti naudojant per laiką sukauptus duomenis.

– Bet sukaupti dideli duomenų kiekiai sukuria ir tam tikrą riziką. Su kokiomis rizikomis susiduria įmonės, analizuojančios didžiuosius duomenis? Pavyzdžiui, ar neiškyla duomenų analizės rezultatų tikslumo problema? Kokie analizės metodai gali pateisinti lūkesčius?

– Kad neiškiltų duomenų analizės rezultatų tikslumo problemų, tam ir rengiami duomenų analitikos specialistai, tad didžiųjų duomenų vertė priklauso nuo pasamdyto duomenų mokslininko, ir vadovo uždavinys yra išmokti atpažinti šį talentą, pritraukti jį į įmonę ir padaryti jį produktyviu.

Nei viena iš šių užduočių nėra tokia paprasta kaip kiti įprastiniai organizaciniai darbai. Reikėtų pradėti nuo to, kad universitetuose nėra studijų programų, suteikiančių duomenų mokslininko laipsnį. Taip pat mažai sutariama, koks vaidmuo įmonėje tinkamiausias duomenų mokslininkui, kad būtų sukurta didžiausia pridėtinė vertė ir, kaip ji turėtų būti matuojama.

Tai, ką pasiekia analitikas, dažnai yra ne programinės įrangos, ne analitikos metodų optimalaus parinkimo automatizuotų priemonių rezultatas. Kiek bus geri rezultatai, ir ar išvis jie bent kiek pateisins lūkesčius, priklauso nuo žmogaus gebėjimų. Kam pavyksta rasti ypatingą, tačiau labai retą duomenų hakerio, analitiko, komunikatoriaus ir patarėjo hibridą, tai įmonei pusė sėkmės jau garantuota.

– Didžiųjų duomenų apdorojimo specialistas – tik uolus griežtų analizės taisyklių taikytojas ar kūrybiškas smalsuolis? Neseniai mano kalbintas profesorius M. K. Ragulskis teigė, kad „matematika – tai kūryba“. Kaip vyksta darbas su didžiaisiais duomenimis? Ar ir čia atsiveria galimybės matematinei kūrybai?

– Informacijos jūroje duomenų mokslininkas gali padaryti didesnius atradimus nei bet kas kitas. Tai supančio pasaulio pažinimo būdas. Skaitmeninėje erdvėje dideliems kiekiams beformių duomenų lengvai galima suteikti struktūrą ir atlikti įmanomą jų analizę, atpažinti vertingus duomenų šaltinius, susieti juos su kitais, galimai neišsamiais šaltiniais ir išgryninti gautą rinkinį.

Konkurencingoje aplinkoje, kur iššūkiai nuolat kinta, o duomenų tėkmė niekada nesustoja, duomenų mokslininkai padeda sprendimų priėmėjams pereiti nuo ad hoc analizės prie betarpiško bendravimo su duomenimis.

– Kas jums pačiam, kaip šios srities mokslininkui, įdomiausia analizuojant didžiuosius duomenis? Kokius mokslinius tyrimus atliekate šioje srityje?

– Tai iššūkiai, kai tenka susidurti su techniniais apribojimais, tačiau tai neturėtų tapti klampia priežastimi ieškant naujų sprendimų. Apie atliekamus pačius tyrimus, deja, negaliu nieko pasakoti.
– Ar moksliniuose tyrimuose dalyvauja ir jūsų studentai, ar jie domisi duomenų analizės pritaikomumu?

– Studentams stengiuosi pasiūlyti kiek įmanoma platesnį tyrimų tematikų lauką. Svarbiausia sužadinti jų smalsumą, o laikui bėgant jie patys atsirenka ir apsisprendžia, kas juos labiau traukia. Džiugina, kai patys gabiausieji save atranda ir mokslinėje veikloje. O nuostabiausia stebėti, kaip įkvėpti pasitikėjimo savo jėgomis, geba tobulėti kaip asmenybės.

– Gal jums yra žinoma, kokiose įmonėse ir ką dirba mūsų absolventai?

– Tiek valstybinio sektoriaus, tiek privataus kapitalo – ir Lietuvos, ir užsienio – įmonės, kuriose jau įsitvirtinę mūsų absolventai, valdo iššūkius, su kuriais žmonės susiduria kiekvieną mielą dieną. Per pastaruosius keturis mėnesius tų iššūkių skaičius labai išaugo ir panašu, kad jų dar daugės. Ypatingai džiugu dėl tų mūsų buvusių studentų, kurie kuria veiksmingas technologijas ir novatoriškus metodus, kad padėtų kitiems, kuriems jų darbo rezultatai labiausiai reikalingi.