Didieji duomenys išsiskiria savo kiekiu, generavimo greičiu ir įvairove. Duomenų mokslininkas iš terabaitų duomenų atranda tendencijas, parengia įžvalgas, kurios galėtų teikti naudą. Tačiau G. Jankauskas turi ir paprastesnį paaiškinimą.

„Didieji duomenys yra tokie, kurie užlaužia „Excel“. Iš esmės, jeigu duomenų apdoroti su „Excel“ yra neįmanoma, tai tikėtina, kad mes susiduriame su didžiaisiais duomenimis“, – LOGIN.LT laidoje juokauja G. Jankauskas.
Gediminas Jankauskas, „Tele2“ didžiųjų duomenų mokslininkas ir projektų vadovas

Parodo ir kiek yra „Nokia 3310“, ir kuris pliažas laisviausias

Ekspertas dalinosi, kad duomenų mokslininko tiesioginis darbas apima ne vien paprastas problemas.

„Aišku, analizuojami yra vartojimo duomenys, norime suprasti, kiek žmonės naudoja gigabaitų duomenų, kiek prašneka minučių, kiek išsiunčia SMS, kad galėtume savo paslaugas pritaikyti kiek įmanoma geriau. Bandome analizuoti duomenis, kad gautume įžvalgas ir kitokias, nesusijusias vien su vartojamomis paslaugomis. Jau kelerius metus esame paleidę paplūdimių žemėlapį, kurį, tikėtina, paleisime ir šiemet“, – pasakoja G. Jankauskas.

Jis paaiškina, kad „Tele2“ leido parengti žemėlapį, kuriame galima pasitikrinti paplūdimių užimtumą, kiek jis didelis, pagal tai pasirinkti poilsio vietą.

„Analizuojame judėjimą, žiūrime, kaip žmonės keliauja: į kokias šalis, iš kur atvyksta, analizuojame judėjimą pačioje Lietuvoje, kaip žmonės keliauja tarp savivaldybių. Na ir iš to kažkokias išvadų padarome. Galime įvertinti, kada Palangoje yra piko metas ir daugiausiai vartotojų“, – sako ekspertas.

G. Jankauskas pastebi, kad duomenų vartojimas ir toliau Lietuvoje auga, vien šiemet pirmą ketvirtį jis buvo rekordinis, ir 21 proc. didesnis, lyginant su praėjusiais metais. Daugiausia duomenų naudojama vakarais, jei darbo diena, o jei savaitgalis – duomenų naudojama tolygiai visą dieną.

Tad mobiliojo ryšio operatorius galėtų atsakyti, kur žmonės lankosi, kur juda, kokiomis kryptimis. Praėjusią vasarą buvo stebimas didesnis judėjimas iš miestų į kaimiškas vietoves, šiemet, kai skrydžių apribojimų neliko, daugiau žmonių ima rinktis poilsį užsienyje.
Gediminas Jankauskas, „Tele2“ didžiųjų duomenų mokslininkas ir projektų vadovas

„Po truputį auga judėjimas į kitas šalis. Pvz., jei lygintume balandį su kovu, apie keturis kartus yra išaugęs keliavimas į Turkiją, apie tris kartus į Graikiją. Žmonės vis daugiau juda, jaučiasi atostogų metas, artėjanti vasarą, judėjimas tikrai aktyvėja“, – regi G. Jankauskas.

Ir ne tik tą galima pamatyti. Vien „Tele2“ turi 2 milijonus aktyvių SIM kortelių. Negalima pasakyti, koks yra vidutinis telefono naudotojas, nes jų yra įvairių. Dalis kasmet perka naują „iPhone“, kita dalis pokyčių nemėgsta.

„Tiesą sakant, turime dar virš 1000 klientų, kurie naudoja seną gerą ir patikimą „Nokia 3310“ senąjį telefoną. Tai čia tas pats telefonas, kuris buvo mano pirmasis telefonas. Kiti žmonės jį dar naudoja“, – pastebėjo G. Jankauskas.

Dažniausiai prie tinklo prisijungęs „Samsung“ gamintas telefonas.

Duomenų mokslininkas paaiškina, kad vienoje bendrovėje yra terabaitai duomenų, tai reiškia šimtus milijonų ar net milijardus skirtingų įrašų eilučių, kurių jokiais kitais būdais vertinti nebūtų galima. Duomenų mokslininko darbas apima kodo rašymą, duomenų agregavimą, sutvarkymą, ir bandymus atsakyti į rūpimus klausimus.

Pasiūlė „Tele2“ duomenyse atsakymų ieškoti kitiems: ką gali naujas atlasas

Jau skelbta, kad „Tele2“ pristatė naują didžiųjų duomenų analizės paslaugą verslui – „Data Atlas“. Tai reiškia, kad bendrovės duomenų mokslininkų išvadų gali pasiprašyti ir kiti subjektai.

„Kokias mes įžvalgas galime pateikti – galėtume kalbėti apie konkrečias vietoves, arba prekybos centrų analizę. Galime analizuoti, koks užimtumas tam tikrame taške, kuris gali būti įdomus, galbūt palyginti keletą taškų, kur daugiausia žmonių lankosi, kuriuo metu daugiausia žmonių lankosi, tai būtų naudingos įžvalgos atsidarantiems verslams“, – pasakoja G. Jankauskas.

Duomenys gali parodyti ir kur palikti paspirtukus klientams, ir kur planuoti naują prekybos centrą ar parduotuvę.

„Imkime Lietuvos turizmo sektorių: būtų galima įvardyti, iš kokių šalių atvyksta turistai, kiek laiko jie praleidžia, galbūt apsilanko Trakuose, bet niekada ten neapsistoja. Galbūt matome didelį vokiečių srautą į Klaipėdą, bet ne į Šiaulių regioną. Tokius duomenis analizuojant galima priimti naudingų sprendimų, ir, kas svarbiausia, pasimatuoti rezultatus. Įsivaizduokime, paleistume kampaniją Italijoje „Atvyk į Vilnių“ – galėtume stebėti, ar išaugo lankytojų srautas būtent į šį regioną, ar jis išliko toks pats. Jei paaugom, vadinasi darome teisingai, plečiame, jei ne, bandome galvoti kažką naujo“, – „Data Atlas“ galimybes pristatė G. Jankauskas.
Poilsiautojai

Panaudojimo būdų rastų ir savivaldybės, pvz., planuodamos viešojo transporto maršrutus.

„Įsivaizduokime Vilniaus, Kauno ar Šiaulių miesto savivaldybės norėtų optimizuoti savo viešąjį transportą arba, galbūt, pakleisti naktinius autobusus. <...> Kaip gi įsivertinti, kokiais maršrutais reikėtų paleisti tuos autobusus, iš Pilaitės Stoties link, ar iš Saulėtekio Akropolio link – kuris optimalus maršrutas. Kadangi mes matome ir judėjimo agreguotus duomenis, galime su tuo padėti, galime pasakyti, kad derėtų paleisti vienokį ar kitokį maršrutą, nes matome didžiausią žmonių judėjimą tomis kryptimis, ir taip padėti miestui“, – sako mokslininkas.

Tačiau jis patikino, kad bendrovė saugo duomenis ir jais nesidalina – jie apdorojami ir pateikiamos apibendrintos įžvalgos.

Turi specialybę – darbo neieškai

Duomenų mokslininko specialybė šiuo metu tokia paklausi, kad konkuruoti su kitais specialistais praktiškai netenka, pripažino G. Jankauskas.

„Viskas priklauso nuo žmogaus. Jeigu žmogų domina programavimas, naujausios technologijos, jis jaučia meilę matematikai, manau, kad tai yra tikrai puiki specialybė, kurią reikėtų apsvarstyti. Paklausa tikrai yra labai didelė šios specialybės“, – sako G. Jankauskas.

Jis pripažino, kad dėl to netgi ir kolegų paieškos ilgokai užtrunka – žmones susiradę mylimą darbą retai nori jį keisti.

„Mokyklos laikais mane domino keli dalykai. Labai domino matematika, ir labai domino naujausios technologijos, programavimas, dalyvaudavau įvairiuose konkursuose. Ir kai jau reikėjo rinktis, kur norėčiau stoti, labiausiai akį ši specialybė patraukė, kuri suderino šiuos dalykus, kurie mane domino“, – pasidalino G. Jankauskas.
Gediminas Jankauskas, „Tele2“ didžiųjų duomenų mokslininkas ir projektų vadovas

Jis išskyrė, kad duomenų moksle labai reikia mokėti tris programavimo kalbas, visų pirma duomenų bazėms skirtą SQL, taip pat statistikų dažnai naudojamą „R“, arba „Python“.

Vis tik didžiausias iššūkis šiame darbe nėra techninis darbų atlikimas.

„Didžiausiu iššūkiu įvardyčiau suvokimą, kad reikia pateikti ne rezultatą, o įžvalgas. Ką turiu galvoje, nelabai yra naudinga, jei analitikas tiesiog pasako, apskaičiavau vidurkį, vidurkis yra 7. Nieko nesako. Daug čia ar mažai, ką čia reiškia, ar mūsų įmonei tai naudingas skaičius, didinti, mažinti? Iš duomenų analitiko turėtų ateiti įžvalga, kad peržvelgus duomenis, klientai pasiskirstę į grupes, ir, tarkime, 7 yra gerokai per didelis skaičius, kurį mums galbūt reikėtų sumažinti iki 4,5. Tai ateina su patirtimi“, – paaiškino duomenų mokslininkas.

Jis patikino, kad kas savaitę sprendžiamos problemos skiriasi, atitinkamai ir jų sprendimo būdai gali būti įvairūs, tenka įvertinti, kokių duomenų reikės, kaip juos agreguoti, išvalyti, analizuoti.

„Kas man patinka analitiko darbe, kad jis šiek tiek primena detektyvo darbą“, – apibendrino G. Jankauskas.