1. Home
  2. Knowledge base
  3. Data Description
  4. 1. Sissejuhatus

1. Sissejuhatus

Käesolev juhis on üks osa andmehalduse raamistikust,[1] mille eesmärk on aidata organisatsioonil kehtestada ühtseid põhimõtteid, protseduure ning paika seada andmehalduse korraldamiseks vajalikud rollid ja mõõdikud. Data Governance on organisatsiooni võimekus hallata andmeid varana. Peamine kasu tõhusast andmehalduse korraldustest tekib organisatsioonile läbi andmetest täiendava väärtuse loomise ja kvaliteetsemate juhtimisotsuste langetamise. Data Governancee raamistik annab organisatsioonile ühtlustatud andmetega töötamise vormi ja struktureeritud ning sujuva suhtlemise viisi erinevate üksuste vahel.

Andmekirjeldus esitab andmestike ja neis sisalduvate andmete kirjelduse (metaandmed). Andmete kirjeldamiseks kasutatavad metaandmed aitavad tagada andmete:

  • sisu kirjeldamise ja seletamise;
  • ülevaatlikust ja leitavust;
  • usaldusväärsust;
  • arusaadavust nii tehniliste kui äriliste kasutajate poolt;
  • masinmõistetavust ja semantilist koostalitusvõimet;
  • elukäigu haldamist.

Süsteemselt hallatud andmekirjeldus annab organisatsioonile ülevaate oma andmetega seotud varadest. Varadeks on andmestikud, andmeteenused, sõnastikud, klassifikaatorid ja loendid ning muud halltavad üksused, kuid peamiselt hallatakse andmeid andmestike kaupa. Andmekirjelduse olemasolu võimaldab andmete leidmist, kasutamist ja neist arusaamist nii inimestele kui ka n-ö masinmõistetavalt infosüsteemidele läbi mõistete ja sõnastike. Andmekirjeldus on andmehalduse närvivõrk, mis aitab asutusel pidada ülevaadet andmevaradest, tagab andmete usaldusväärsuse ja võimaldab neid tõhusalt taaskasutada.

Andmekirjelduse peamine roll andmehalduse raamistikus on tagada asutuse siseselt ja asutuste üleselt teadmine olemasolevatest andmestikest ning andmetest ja nende tähendusest. Andmekirjelduse haldamine on pidev tegevus, mille jaoks kehtestatakse organisatsioonis reeglid ja nõuded ning seda tööd teevad kindlaid rolle täitvad ja tööülesandeid teostavad töötajad. Käesolev juhis kirjeldab terviklikult nii andmekirjelduse loomise kui haldamise tegevusi.

[1] vt. EY, Data Governancee raamistik (2020)

1.1 Juhise koostamine

Juhise koostasid Statistikaameti tellimusel ja Euroopa Komisjoni Struktuursete Reformide Toetusteenistuse (SRSS) poolt rahastatavat projekti „Support for the establishment of data governance services“ (Teotus andmehaldusele. Eesti andmehalduse metoodikaprojekt) teostanud ettevõtte Ernst & Young eksperdid. Juhis koostati 2019 sügisest 2020 aasta suveni ja selle aluseks olid Eestis varem andmehalduse kirjeldamise vallas tehtu ning rahvusvahelised standardid ja parem praktika.

Tellija poolne projektijuht oli Statistikaameti andmehalduse ekspert Veiko Berendsen. Täitja poolne projektijuht oli Siim Aben, eksperdid olid Kuldar Aas ja Raivo Ruusalepp.

1.2 Andmekirjelduse juhise eesmärgid

Juhis on loodud selleks, et asutustel oleks andmekirjelduse loomiseks ja haldamiseks olemas tegevusjuhised, kvaliteedinõuded ja standard. 2019. a. sügisel läbi viidud hetkeolukorra analüüs näitas, et andmete kirjeldamisele on seni asutustes vähe tähelepanud pööratud ja ühtne praktika puudub. Seetõttu on andmekirjelduse juhise peamine eesmärk juhendada organisatsioone andmekirjelduse koostamisel ja haldamisel.

Juhise järgimine aitab kaasa andmehalduse raamistiku terviklikule rakendamisele organisatsioonis. Juhise järgi koostatud andmekirjelduste avalikustamine annab teistele osapooltele ja ühiskonnale tervikuna võimaluse võrreldavaks ülevaateks kogutavatest ja olemasolevatest andmetest. Sellise ülevaate omamine võimaldab andmeid nutikamalt kasutada.

1.3 Andmekirjelduse juhise sihtrühmad

Juhise sihtrühmaks on asutused ja organisatsioonid, kes töötlevad andmeid nii andmekogudes kui ka muudes infosüsteemides ja andmebaasides ning kes kasutavad neid andmeid nii esmase infoallikana toiminguteks ja teenusteks, aga ka teiseseks kasutamiseks aruandluses ja statistikas.

Juhis on suunatud eelkõige erialaspetsialistidele – andmehalduritele, kes korraldavad organisatsiooni andmehaldust ning IT spetsialistidele, kes loovad andmeteenuseid ja andmemudeleid.

Andmekirjelduse juhise peamised kasutajad organisatsiooni sees on andmehaldusega tegelevad spetsialistid, kes saavad andmekirjelduse kaudu ülevaate organisatsiooni andmestikest kui varadest ning on suutelised korraldama asutuste vahelist andmevahetust; IT arendajad ja nende andmespetsialistid, kes saavad ülevaate organisatsiooni andmestikest ning on suutelised tagama tõhusat asutuse infosüsteemide arendamist ja uuendamist; organisatsiooni juhid, kes saavad kvaliteetsema sisendi juhtimisotsuste tegemiseks ning andmepõhise juhtimise eest vastutavad töötajad ja teised andmete kasutajad, kes saavad ülevaate organisatsiooni andmestikest ja nende haldamisest.

Väljaspool organisatsiooni on juhis mõeldud riigi keskse andmehalduse rakenduse halduritele ja kasutajatele ning andmeportaalide pidajatele, kes saavad ülevaate sellest, milliseid andmeid kus kogutakse ja hoitakse; IT arendajatele, ning laiemale avalikkusele, kes on huvitatud avaandmetest ja nende kasutamisest.

1.4 Andmekirjelduse juhise ülesehitus ja põhimõtted

Juhis annab suunised andmekirjelduse protsesside välja töötamiseks ja juurutamiseks organisatsioonis ning vajalike rollide ja vastutuste määramiseks nende protsesside realiseerimisel. Juhis koosneb kolmest põhiosast, mis seletavad mida ja miks on vaja andmekirjeldusega teha (ptk. 2), kuidas andmekirjelduse haldamist teostada (ptk. 3) ning milliseid abivahendeid on seejuures võimalik kasutada (Lisad). Andmekirjelduse protsessid katavad kirjeldatavate andmestike kindlaksmääramist, andmekirjelduse mudeli loomist, sõnastike valimist ning andmete kirjeldamist ja kirjelduse pidevat haldamist. Juhises kasutatakse sõnastike illustreerimiseks Ehitisregistri baasil loodud näiteid (ptk. 3). Juhis on kasutatav koos erinevate andmekirjelduse loomist võimaldavate rakendustega. Juhis võiks edaspidi olla kasutatav elava on-line keskkonnana, mis on seotud teadmusbaasiga ja mida saab kestvalt täiendada.

Andmekirjelduse juhise koostamisel lähtuti rahvusvaheliselt tunnustatuimas käsiraamatus „The Data Management Body of Knowledge (DAMA-DMBOK2) (2nd ed., 2017)“ esitatud andmehalduse mudelist.[1] Andmekirjelduse standardi koostamisel tugineti standarditele „Data Catalog Vocabulary (DCAT)“ (ver. 2, 04.02.2020)[2] ja „Data Documentation Initiative (DDI)“ (Lifecycle 3.3, 20.04.2020).[3]

[1] https://dama.org/sites/default/files/download/DAMA-DMBOK2-Framework-V2-20140317-FINAL.pdf

[2] https://www.w3.org/TR/vocab-dcat-2/

[3] https://ddialliance.org/Specification/DDI-Lifecycle/3.3/

1.5 Andmekirjelduse õiguslik raamistik

Eestis eraldi andmekirjeldust reguleerivat õigusakti ei ole. Samuti ei ole kehtestatud selgeid nõudeid andmekirjelduse haldamisele. Küll aga sisaldub andmekirjelduse aspekte eri tasandi regulatsioonides, sh. andmekogu-põhised õigusaktid, riigi infosüsteemi ja selle koostalitusvõimet reguleerivad õigusaktid ning raamistikud ja soovituslikud juhised eri asutustelt nagu Riigi Infosüsteemide Amet, Statistikaamet või Rahvusarhiiv. Asutustes on konkreetsete andmekogude kirjeldamise nõudeid esitatud andmekogu (tehnilises) dokumentatsioonis. Ülevaade õigusaktidest, soovituslikest juhistest ja standarditest on juhise Lisas 1.

Was this article helpful to you? Yes No

How can we help?