Kas yra duomenų patikimumas ir kokius duomenis galime vadinti patikimais?

2021 10 28 · 3 minutės

Remiantis 2021 m. bendrovės „Talend“ – duomenų analitikos produktų kūrimo lyderės pasaulyje – atliktu duomenų sveikatos tyrimu, 40% vadovų savo įmonės duomenų patikimumą vertina kaip „labai gerą“. Verslo lyderiams, siekiant priimti strategiškus ir pagrįstus sprendimus, yra būtini patikimi duomenys. Taigi kyla klausimas – kokiais duomenimis remiasi likusi vadovų dalis?

Prielaida gana paprasta – likusi dalis verslo lyderių arba naudoja nepatikimus duomenis, arba sprendimus priima, remiantis ne duomenimis, o intuicija. Atliktas tyrimas parodė, kad net 36% verslo lyderių būtent taip ir daro – versle kliaujasi ne duomenimis, o intuicija.

Nuo ko pradėti?

Žinoma, organizacijoms, kurios tik pradeda ieškoti būdų, kaip pagerinti savo duomenų sveikatą, informacijos ir gerųjų praktikų srautas dažnai gali atrodyti neįveikiamai didelis. Duomenų kokybė, duomenų vientisumas, duomenų patikimumas, pasitikėjimas duomenimis – vien susigaudyti tarp šių ir kitų sąvokų gali būti nelengva. Net nekalbant apie supratimą, ką išties reikia įgyvendinti ir nuo ko pradėti.

Daugeliui organizacijų duomenų patikimumas tampa atspirties tašku, kuriuo remiantis bus galima sukurti pažangesnius duomenų kokybės ir duomenų vientisumo užtikrinimo procesus. Tačiau pirmiausia reikia suprasti, kas iš tikrųjų yra tas duomenų patikimumas, kaip jį vertinti ir kaip padidinti bendrą įmonės duomenų patikimumo lygį.

Visa tai detaliau aprašome šiame blogo įraše.

Duomenų patikimumo apibrėžtis

Priežasčių, kurios lemia mažą duomenų patikimumą, gali būti daugybė. Todėl pirmiausia reikia išsiaiškinti, kurie duomenys yra patikimi, o kurie ne. Tai galima nustatyti atliekant pratimą, vadinamą duomenų patikimumo vertinimu.

Duomenų patikimumas reiškia, kad duomenys yra išsamūs ir tikslūs. Tai yra esminė sąlyga norint visoje organizacijoje siekti duomenų patikimumo. Taip pat duomenų patikimumas yra patikimos duomenų analizės ir įžvalgų sąlyga. Tai vienas svarbiausių dalykų, kuriuos reikia įgyvendinti teisingai, norint pagerinti bendrą organizacijos duomenų sveikatą. O verslo lyderiams, turint patikimus duomenis, nebereikia spėlioti, kuomet reikalinga priimti svarbius sprendimus.

Duomenų patikimumo vertinimas

Kol negalėsite tiksliai įvertinti savo duomenų patikimumo, tol negebėsite priimti absoliučiai patikimų, duomenimis grįstų sprendimų. Vertinimas gali:

  • Parodyti konkrečias problemines vietas, kai žinote ar įtariate, kad turimi duomenys yra nepatikimi.
  • Atskleisti užslėptas, sunkiai matomas problemas, kurių net neįtarėte esant.
  • Patvirtinti, kad vertinami duomenys yra patikimi ir su jais galima dirbti.

Atliekant šį vertinimą paprastai yra matuojami trys skirtingi duomenų patikimumo aspektai:

  • Tinkamumas – ar duomenys yra teisingai suformatuoti ir saugomi tinkamu būdu?
  • Išsamumas – ar turimų duomenų rinkinyje yra visų sistemos reikalaujamų laukų reikšmės?
  • Unikalumas – ar nėra duomenų dublikatų ir nekorektiškų įrašų?

Atliekant duomenų patikimumo vertinimą taip pat gali būti atsižvelgiama į kitus veiksnius bei duomenų kokybės aspektus. Pavyzdžiui, kiek kartų buvo remtasi konkrečiu duomenų rinkiniu, iš kur jis atsirado ir kaip duomenys buvo pakeisti. Visa tai yra ypač svarbu vertinant duomenis, susijusius su jautria informacija, kuriai būtinas visiškas tikslumas. Tarkime, atliekant finansinį auditą yra labai svarbu gebėti įrodyti duomenų patikimumą.

Duomenų vertinimo proceso metu mūsų specialistai bet kuriam duomenų rinkiniui gali priskirti kiekybiškai įvertintą patikimumo balą, nustatyti su atitinkamu duomenų rinkiniu susijusias patikimumo problemas ir išskirti sritis, kurias reikia patobulinti. Jei atliekant vertinimą nustatomi nepatikimi duomenys, pateikiamos rekomendacijos, kaip sutvarkyti problemines vietas. Taip pat tai sutvarkyti gali mūsų duomenų valdymo ir IT specialistai.

Duomenų patikimumo ir duomenų tinkamumo skirtumas

Vienas iš dažniausiai pasitaikančių klaidingų įsitikinimų yra tas, kad duomenų patikimumas bei duomenų tinkamumas yra vienas ir tas pats. Nors ir vienas, ir kitas yra svarbus patikimus duomenis norinčiai turėti organizacijai, iš tikrųjų jie nurodo skirtingus duomenų sveikatos (angl. data health) aspektus.

Tinkami duomenys – tai duomenys, kurie yra teisingai suformatuoti ir saugomi. Patikimi duomenys – tai duomenys, kurie gali būti patikimas pagrindas analizei ir sprendimų priėmimui. Tinkami duomenys yra svarbi patikimų duomenų dalis, tačiau vien tinkamumas dar negarantuoja patikimumo.

Pavyzdžiui, tinkami duomenys gali būti neišsamūs, todėl pasikliaunant tinkamumu kaip vieninteliu patikimumo matu, vis tiek gali kilti problemų, kai ateis laikas šiuos duomenis naudoti analizei ar sprendimams priimti.

Tarkime, galite turėti klientų, kuriems norite siųsti rinkodaros el. laiškus, duomenų bazę ir surinkti kontaktų sąrašą, užpildytą tokiais 100% tinkamais duomenimis. Tačiau jei šis sąrašas bus neišsamus – jei įrašuose trūks tokios informacijos kaip el. pašto adresai, vardai ar kita susijusi informacija, – šie duomenys nebus patikimi vertinant pagal jiems numatytą paskirtį. Arba, atsižvelgiant į tai, kaip šis sąrašas buvo sudarytas, gali kilti duomenų dubliavimosi problemų, kai duomenų rinkinyje tas pats įrašas kartojasi, o skirtingi įrašai yra nevienodai išsamūs. Todėl svarbu įvertinti visus duomenų patikimumo aspektus, kad kuo tiksliau ir išsamiau suprastumėte savo duomenis.

Kaip turėti patikimus duomenis?

Visų pirma, rekomenduotume įvertinti duomenų patikimumą pagal jų tinkamumą, išsamumą ir unikalumą, kad galėtumėte tiksliai suprasti, ką reikia tobulinti.

Kai žinosite, ką turite tobulinti, sukurkite planą, numatantį, ką taisysite pirmiausia. Tokie veiksmai, kaip besidubliuojančių duomenų pašalinimas, gali būti lengvas bei greitas laimėjimas, kuris leis jūsų duomenų tobulinimo iniciatyvai įgauti pagreitį ir nukreips ją tinkama linkme. Tada įvertinkite, kurie patobulinimai turės didžiausią teigiamą poveikį jūsų verslui ir sutelkite dėmesį į šias sritis. Kai kurios iš šių iniciatyvų gali užtrukti ilgiau. Pavyzdžiui, trūkstamų klientų duomenų rinkimas arba transformacijos procesų apibrėžimas norint užtikrinti visų jūsų organizacijos duomenų nuoseklumą, tačiau jos yra labai svarbios siekiant ilgalaikės sėkmės. Galiausiai spręskite visas kitas problemas, kurias atskleidė vertinimas.

Atminkite, kad duomenų patikimumo gerinimas nėra vienkartinis veiksmas. Kaip ir visose duomenų sveikatos srityse, čia svarbiausia yra nuoseklumas. Prevencinių priemonių taikymas, kuris padėtų įvertinti naujų duomenų patikimumą ir šiuos duomenis ištaisyti prieš jiems paplintant po jūsų sistemas, gali sumažinti duomenų patikimumo suprastėjimo riziką.

Jei norite sužinoti daugiau apie duomenų patikimumo vaidmenį siekiant užtikrinti sveikų duomenų (angl. healthy data) aplinką, taip pat ir apie kitas įmonės duomenų sveikatos palaikymo strategijas, patarimus bei gerąją praktiką, susisiekite su mumis ir mes mielai jus pakonsultuosime.