Aptarkime naujas galimybes jums
Norite pasikonsultuoti ar turite papildomų klausimų? Susisiekite jums patogiu būdu jau šiandien.
Rezervuoti laiką+370 5 2 780 400
info@ba.lt
Visą gyvenimą trunkanti sveika gyvensena reikalauja disciplinos ir veiksmingų priemonių tai palaikyti. Tie patys principai taip pat galioja kalbant apie duomenų sveikatą (angl. data health): organizacijose veikiančios programos, įvairios aplikacijos ir jų valdomi procesai tampa beverčiai, kuomet nėra užtikrinama tinkama duomenų sveikatos būklė. Norint įtvirtinti gerąsias duomenų valdymo praktikas, reikalinga tiksliai apibrėžti aiškius duomenų vaidmenis ir atsakomybes, taip pat užtikrinti reguliarius duomenų stebėjimo bei audito procesus.
Kuo daugiau dėmesio skiriama kokybiškai duomenų būklei organizacijoje, tuo mažesnė rizika priimti nepagrįstus verslo ir IT saugumo sprendimus. Organizacijoms, siekiančioms sukurti ir puoselėti gerąsias duomenų sveikatos praktikas, svarbu suprasti esminius duomenų kokybės aspektus.
Atsižvelgiant į tai, šiame blogo įraše pristatysime, kas yra kokybiški duomenys, kaip tikslingai nustatyti duomenų kokybės rodiklius ir tuo remiantis įvertinti duomenis.
Duomenų sveikatai labai svarbi duomenų kokybė. Tradiciškai duomenys gaunami dvejais būdais:
Bet kuriuo atveju, tikslų duomenų įvedimą yra sudėtinga kontroliuoti, kadangi tiek pirmuoju, tiek antruoju variantu gali pasitaikyti klaidų. Be to, gali atsirasti objektyvių kokybės iššūkių, kuomet konkrečios paskirties duomenys yra išgaunami visai kitam tikslui – dažnu atveju analizei. Pavyzdžiui, verslo sistemose taikomi duomenys nėra tinkami naudoti analitikos procesuose ir atvirkščiai.
Integracijai ir analizei reikia duomenų rinkinių iš įvairių taikomųjų sistemų, programinių įrangų ar duomenų bazių. Šiuo atveju, organizacijos neretai taiko nepagrįstus standartus duomenų aplikacijose ir bazėse. Taip pat organizacijos taiko skirtingus duomenų įvedimo ir optimizavimo metodus ar net istoriškai susiklosčiusius apėjimo būdus, kurie turi prasmę pirminio šaltinio viduje, tačiau išimti iš konteksto tampa netinkami naudojimui. Tuo atveju, jeigu duomenų formatas ar turinys nėra esminė kokybės problema pirminiame šaltinyje, vėliau tai gali tapti iššūkiu, kuomet duomenys bus išskirti ir sujungti su kitais integruojant ar vykdant analizės projektą.
Duomenų kokybė apima discipliną, metodologiją, darbo metodus ir programinę įrangą, kuri padeda spręsti šias problemas. Duomenų kokybės užtikrinimas gali būti įgyvendinamas dvejais etapais:
Šių žingsnių įgyvendinimas leidžia pagerinti duomenų kokybę ir dar veiksmingiau išnaudoti duomenis atsižvelgiant į jų paskirtį. Kuomet duomenų kokybė tampa visos įmonės prioritetu, analitikų komandos gali skirti didesnį dėmesį svarbių įmonės sprendimų priėmimui ir mažesnį specifiniams duomenų kokybės iššūkiams.
Vertinant duomenų kokybę, svarbu atsižvelgti į kelis pagrindinius rodiklius, kurie atskleidžia atskirų duomenų ir jų saugyklų kokybės būklę. Moksliniuose tyrimuose neretai gali būti aprašomi daugiau nei 10 duomenų kokybės aspektų. Tačiau paprastai įmonėms svarbu atsižvelgti į penkis pagrindinius rodiklius: išsamumas, tikslumas, savalaikiškumas, nuoseklumas ir prieinamumas.
Menkas ar visiškas duomenų kokybės rodiklių netaikymas kelia esminį iššūkį duomenų analitikų komandoms: duomenys, neatspindintys aiškios ir tikslios organizacijos procesų situacijos, lemia netinkamus verslo sprendimus, praleistas galimybes, padidėjusias išlaidas arba atitikties rizikas. Be viršuje išvardintų duomenų kokybės rodiklių, organizacijose paprastai naudojami ir su verslo procesais susiję matmenys, dažniausiai skirti užtikrinti duomenų atitiktį.
Taigi duomenų kokybės vertinimas gali tapti daugialypiu ir sudėtingu procesu. Tuo pačiu šiandieninių duomenų šaltinių apimtys ir įvairovė jau seniai pranoko žmogiškosios priežiūros galimybes. Dėl šios priežasties kiekvienam iš duomenų kokybės rodiklių yra apibrėžiamos atitinkamos metrikos, kurios gali būti apskaičiuojamos automatiškai naudojantis technologiniais įrankiais.
Į šį metrikų rinkinį papildomai galima įtraukti daugiau subjektyvių priemonių, paprastai prašant darbuotojų pateikti duomenų įvertinimo arba valdymo darbo eigą. Bet kuriuo atveju, organizacijos vis dažniau pasitelkia mašininio mokymosi ir kitus dirbtinio intelekto įrankius atliekant duomenų vertinimo ir duomenų analitikos procesus.
Norite pasikonsultuoti? Susisiekite su mūsų duomenų analitikų komanda jau dabar!
Norite pasikonsultuoti ar turite papildomų klausimų? Susisiekite jums patogiu būdu jau šiandien.
Rezervuoti laiką+370 5 2 780 400
info@ba.lt
Sužinokite daugiau apie PLAIS sistemą, kokią vertę PLAIS kuria prie jos prisijungusioms finansų įstaigoms bei bendrai finansų sektoriui. Skaitykite daugiau!
Baltic Amadeus tapo Advanced Tier AWS paslaugų partneriu, teikiančiu debesijos sprendimus verslui Baltijos šalyse ir Šiaurės Europoje.
Sužinokite, kodėl yra verta atlikti bandomąjį projektą (angl. Proof of Concept, POC) prieš pasirenkant norimą duomenų sandėlio sprendimą.