Svarbiausi patarimai, kaip užtikrinti organizacijos duomenų kokybę 2022-aisias

2022 01 12 · 3 minutės

Organizacijoje turimų duomenų kokybės užtikrinimas prasideda nuo duomenų kokybės vertinimo. Taip pat organizacijose duomenų vertinimas neretai yra periodinis veiksmas ir atliekamas, pavyzdžiui, kartą į metus – panašiai kaip saugumo ar finansų auditai. Labai dažnai duomenų vertinimui atlikti paskiriama metų pabaiga arba naujųjų metų pradžia. 

Organizacijos, siekiančios užtikrinti gerąsias duomenų valdymo praktikas, turi atlikti duomenų kokybės vertinimo procesus reguliariai, o dar geriau – nuolat. Sistemingas duomenų kokybės vertinimas organizacijoms padeda išvengti ir laiku spręsti su duomenimis susijusias problemas.  

Nors efektyvių duomenų valdymo ir analitikos sprendimų poreikis kasmet tik auga, o siekiant sėkmingai įgalinti duomenis verslo naudai, svarbu užtikrinti tinkamą duomenų sveikatą (angl. data health). 

Todėl trumpai aptardami duomenų vertinimo praktikas bei priemones, šiame blogo įraše pristatysime svarbiausius patarimus, kaip galite užtikrinti duomenų kokybę jūsų organizacijoje.

Duomenų kokybės užtikrinimas: kaip pasirinkti teisingą strategiją? 

Duomenų kokybės vertinimas – tai nuolatinis procesas, kuris paprastai prasideda nuo duomenų stebėjimo ir duomenų kokybės rodiklių išsigryninimo bei apskaičiavimo. Patikimas duomenų kokybės vertinimo būdas reikalauja sudėtingų skaičiavimo algoritmų. O didžioji dalis organizacijų, norėdamos įvertinti savo turimų duomenų kokybę, taiko tradicinius kokybės vertinimo metodus, pavyzdžiui, imčių tikrinimą, atsitiktinius testus, automatizavimo sprendimus.  

Įprastai duomenų kokybė yra vertinama programose, duomenų bazėse, duomenų ežeruose ar duomenų saugyklose, kuriose duomenys yra saugomi. Prieš atliekant vertinimo procesus, duomenis surinkti reikėtų vienoje sistemoje, pavyzdžiui, audito metu. Tačiau dėl didelio duomenų kiekio, su kuriuo dirba dauguma įmonių, toks duomenų dubliavimas yra neefektyvus. Tuomet organizacijų atstovai suvokia, kad vertinant duomenų kokybę po to, kai duomenys jau buvo suvesti į sistemą, sukelia nereikalingas rizikas, pavyzdžiui, didina klaidų tikimybę ir papildomas išlaidas. Tuo tarpu mažiausiai resursų ir rizikų keltų duomenų kokybės užtikrinimas pačioje pradžioje, jų suvedimo momentu. 

Šiuolaikiškesnis požiūris – tai visuotinė duomenų kokybė, integruota tiesiogiai į duomenų tiekimo grandinę. „Talend“ išskiria pagrindinius visuotinės duomenų kokybės kriterijus, taip pat taikomus „Talend Trust Score™“ platformoje: 

  • Galiojimas. Leidžia išspręsti su duomenų galiojimu susijusias problemas siekiant pagerinti turimų duomenų kokybę. Galiojimo kriterijus suteikia galimybę įvertinti galiojančių ir negaliojančių reikšmių skaičių duomenų rinkinio imtyje, duomenų tipą, semantinių tipų bei primityvių tipų santykį. 
  • Populiarumas. Tai leidžia pamatyti, kaip organizacijoje naudotojai vertina duomenų rinkinį, t.y. kokie yra atsiliepimai apie konkretų duomenų rinkinį, kaip jūsų organizacijos darbuotojai įvertina pastarųjų duomenų patikimumą ir pan. 
  • Išbaigtumas. Šis kriterijus atskleidžia, kaip išsamiai yra užpildyti duomenų ir jų rinkinių aprašymai. Jei duomenų rinkinyje yra tuščių ar nepilnai užpildytų reikšmių – papildykite jas reikalinga informacija. 
  • Atrandamumas. Kuo tiksliau dokumentuojami jūsų organizacijos duomenys, tuo lengviau jūsų kolegos atpažins ir supras skirtingos paskirties duomenų rinkinius. Naudokite žymas ir pridėkite reikalingus aprašymus tam, kad duomenis surasti būtų lengva ir paprasta. 
  • Naudojimas. Tam tikrų duomenų naudojimo dažnis atskleidžia, kiek konkretūs duomenų rinkiniai yra naudingi skirtingoms paskirtims. Šis kriterijus rodo, kaip dažnai naudojami ir atnaujinami tam tikri duomenys.   

Kuo anksčiau atliekamas duomenų kokybės įvertinimas, tuo greičiau nustatomos galimos rizikos ir sumažinamos išlaidos, reikalingos spręsti su duomenų kokybe susidariusius iššūkius. Tokie įrankiai, kaip „Talend Trust Score™“, leidžia įgyvendinti duomenų kokybės užtikrinimą neperkeliant duomenų iš duomenų saugyklų bei integruojant duomenų kokybės gerinimo praktikas į duomenų valdymo procesus. 

Duomenų kokybės užtikrinimo patarimai 

Kurdami nuolatinio tobulėjimo kultūrą ir pasitelkdami savo darbuotojus bei programinę įrangą, organizacijos gali apsisaugoti nuo didžiausios ir dažniausiai pasitaikančios rizikos. Jei duomenų kokybės funkcijas ir praktikas įtrauksime į duomenų gyvavimo ciklą jiems judant per sistemą ir juos naudojant analitikams bei taikomosioms programoms, duomenų kokybės užtikrinimas taps savaime suprantamu organizacijos procesu. 

Duomenų kokybės užtikrinimas apjungia įvairius su duomenų infrastruktūra, reguliavimu ir aprėptimi susijusius procesus. Taigi kokie procesai ir priemonės reikalingi siekiant užtikrinti esminį duomenų kokybės vertinimą ir palaikymą?  

1. Rizikos veiksnių nustatymas 

Rizikos veiksniai gali būti pastebimi tiek organizacijos viduje, įtraukiant įvairias taikomąsias programas, procesus ir darbuotojus, tiek išorėje – procesuose, kuriuose yra įtraukti klientai, tiekėjai, partneriai ir kiti atstovai iš išorės.  

Atpažindami sritis, kuriose kyla didžiausia su duomenimis susijusi rizika, galime veiksmingiau užkirsti kelią pavojams, jiems dar neatsiradus. 

2. Prevencija 

Aukšta duomenų kokybė reikalauja tinkamos duomenų praktikos ir disciplinos. Kaip pavyzdį galime aptarti maisto produktų etikečių atvejį. Šios etiketės – standartizuotas maistingumo faktų ar maistingumo balų apibendrinimas – veikia kaip edukacija apie tai, kaip tam tikras maistas paveiks jūsų bendrą savijautą. Žinodami šią informaciją galime nuspręsti, ar mums tinkamas konkretus maisto produktas, ar geriau reikėtų paieškoti produkto, turinčio tinkamesnį maistingumo įvertinimą. 

Duomenų kokybės užtikrinimo kontekste yra pasitelkiami įrankiai, pavyzdžiui, „Talend Trust Score™“, leidžiantys iš anksto įvertinti ir kontroliuoti duomenų priėmimą siekiant lengviau suprasti gaunamus informacijos rinkinius. „Talend Trust Score™“ nuskaito duomenis (maistingumo faktų ir balų apibendrinimą) ir įvertina, ar turimi informacijos rinkiniai (maisto produktas) yra tinkami organizacijos kokybiškai sistemų (sveikatos) veiklai ir jos užtikrinimui. 

3. Reguliari stebėsena 

Reguliarus duomenų kokybės užtikrinimo proceso ir pokyčių stebėjimas yra būtinas ilgalaikėje perspektyvoje siekiant užtikrinti tinkamą duomenų kokybę. Duomenų valdymo kontekste duomenų stebėsena gali būti įvardijama kaip duomenų vertinimas. 

Stebėsenos dėka galime kaip įmanoma anksčiau nustatyti atsiradusią problemą ir veiksmingai ją išspręsti.  

4. Reikalingų pokyčių įgyvendinimas 

Duomenų kokybės procesai dažnai yra susiję su rizikos ir naudos vertinimu. Reikalingi pokyčiai yra rekomenduojami, kai nustatoma nauda yra didesnė už galimas neigiamas pasekmes, tačiau tai nereiškia, kad pokyčiai įgyvendinami tik tada, kai nėra jokios rizikos.  

Duomenų kokybės kontekste yra daugybė ribinių duomenų kokybės problemų, kurių neįmanoma išspręsti vien tik visapusišku automatizavimu ir žmogaus pastangomis, nepaisant galimų žmogiškųjų klaidų. Taigi svarbu užtikrinti tiek automatizuotų įrankių, tiek žmogaus įsitraukimą į duomenų valdymo bei analizės procesus siekiant sėkmingai įgyvendinti reikalingus pokyčius

Susisiekite ir sužinokite plačiau, kokias galimybes sėkmingiems duomenų valdymo ir analitikos procesams suteikia „Talend Trust Score™“ įrankis. 

Rytojus priklauso lyderiams. Siekiate jais būti? SUSISIEKITE >