1. Avaleht
  2. Teadmusbaas
  3. Andmehalduse raamistik
  4. 5. Andmehalduse töövahendid

5. Andmehalduse töövahendid

Andmehaldus organisatsioonis on peamiselt töökorralduse küsimus ning toetub laiemalt  organisatsioonikultuurile ja kitsamalt kindlaksmääratud rollidele ja vastutustele. Ehk siis, loota sellele, et on olemas mingid isetöötavad tehnoloogiad ja väga võimsad töövahendid, ei tasu. Ise need ikkagi ei tööta.  Siiski on olemas mõned tehnilised lahendused, mis sobivad töökorraldusse hästi nii, et pole vaja hakata andmehalduse rätsepülikonda õmblema alustades villast ja kangast. Kasutada saab eriti alguses juba loodud komponente ja rakendusi. Näiteks head infohalduse- ja ühistöö rakendused toetavad tegevuskavade, standardite ja nõuete koostamist ja haldamist. Lisaks peavad andmehalduse juhid ise oma igapäevast tööd ja andmeid tõhusalt haldama ning ülesandeid erinevate mõõdikutega täiendama. Ka selleks sobivad mitmed info- ja sisuhalduse rakendused, milles teksti ja tabelitega saab töötada.

Enne konkreetse funktsiooni tarbeks töövahendi valimist ja juurutamist, näiteks ärisõnastiku lahenduse jaoks, peab organisatsioon määratlema oma laiemad andmehalduse eesmärgid ja vajadused. Mõned ärisõnastiku lahendused võivad sisalda lisaks ka tegevusplaanide ja töövoogude juhtimise lisafunktsionaalsust. Aga kui sellist täiendavat funktsionaalsust soovitakse, tuleks nõudeid selgitada ja testida juba enne töövahendi kasutusele võtmist. Vastasel juhul tekib organisatsioonis mitu erinevat töövahendit ja ükski neist ei pruugi lõpuks vastata vajadustele. Hoiduda tuleks nii sellest, et iga üksikülesannet hakataks haldama eri rakendusega ja eraldi kui ka sellest, et tegelikku sisulist tööd ei alustatagi ning aasta paar arendatakse mingit eriti paljulubavat rakendust või ostetakse teadaolevalt parim, sageli kalleim, tarkvara, mida aga ei juurutata.

5.1 Veebipõhine teadmusbaas ja intranet

Andmehaldus peaks kindlasti olema osa organisatsiooni intranetis hallatavast teabest. Veebisait või koostööportaal võimaldab teha dokumendid keskselt kättesaadavaks. Dokumendid võivad olla teksti ja tabelite failid, aga parem on, kui need on wikilehed. Intranet võib sisaldada lisaks dokumentatsioonile ka elektroonilist raamatukogu, mis koondab endasse sagedasti kasutatavad failid raamatute, standardite, juhiste jms teabega. Tavaliselt on Intranetil olemas otsinguvõimalused nii kogu tekstist (n-ö täistekstotsing) kui ka sirvimis- ja otsivõimalused märksõnade järgi. See võib aidata hallata lihtsat töövoogu jne. Veebipõhine teadmusbaas peaks kindlasti sisaldama:

  • Organisatsiooni andmehalduse strateegiat, visiooni, eesmärke ja rakendamise tegevuskavasid;
  • Andmehalduse põhimõtteid;
  • Andmekirjelduse standardeid ja juhiseid;
  • Andmehaldusega seonduvate rollide ja vastutuste kirjeldusi;
  • Temaatilisi uudised ja teadaandeid;
  • Linke huvipakkuvatele andmehalduse foorumitele;
  • Linke organisatsiooni juhtimistasandil toimunud aruteludele andmehalduse teemadel;
  • Andmekvaliteedi mõõtmise põhimõtteid ja aruandeid;
  • Andmekvaliteedi probleemide tuvastamise ja teavitamise protseduure;
  • Linke andmehalduse töövahenditele ja kohta nende kasutusõiguste taotlemiseks;
  • Kohta andmehaldusega seotud probleemide kajastamiseks;
  • Dokumente, esitlusi ja koolitusprogramme koos linkidega;
  • Andmehalduse eest vastutajate kontakte.

5.2 Ärisõnastik

Ärisõnastik on andmehalduse töövahend. See sisaldab mõistete kokkulepitud terminoloogiat ja määratlusi / kirjeldusi, mõistete omavahelisi seoseid ning seoseid andmeobjektidega. Erineva funktsionaalsusega ärisõnastiku töövahendeid on turul palju, lisaks võib sõnastik olla osa ERP-süsteemist, andmete laadimis/teisendus töövahenditest (ETL) või metaandmete töövahendist. Kõige lihtsam sõnastik on lisamoodulina olemas ka Atlassian tooteperekonnas, aga sobib ka iga teine wiki tüüpi lahendus, mis suudab hüperteksti avaldada. Spetsiaalse tarkvarana võib kasutada: Informatica, PowerDesigner, ER/Studio, Sparx EA, Oracle SQL Developer Data Modeler, CA Erwin, IBM – InfoSphere Data Architect.

5.3 Töövoo juhtimise lahendused

Suuremad organisatsioonid võiksid kaaluda mõne töövoolahenduse juurutamist (näiteks Atlassian Jira) ja seda just andmehalduse põhimõtetest lähtudes. Need töövahendid ühendavad protsesse dokumentidega ja on kasulikud palju administreerimist vajavate ülesannete lahendamisel.

5.4 Andmehalduse juhtimislaud (dashboard)

Andmehalduse edenemise ja ulatuse jälgimist ning aruandlust saab esitada automatiseeritud tulemuskaardil või juhtimislaudadel.

5.5. Põhiandmete haldus

Põhiandmed asuvad organisatsioonis ainult ühes kohas, aga seda kasutavad mitmed infosüsteemid. Seetõttu on oluline, et kasutajatel oleksid olemas põhiandmete kasutamiseks, muutuseks ja kustutamiseks täpselt määratud õigused. Neid õigusi peaks saama hallata läbi keskse identiteedihalduse.

Põhiandmete endi haldamist saab teostada läbi andmeintegratsiooni (ETL) või tarkvaraarenduse tööriistade, operatiivsete andmebaaside (ODS), andmejagamise platvormide (Data Sharing Hubs) või mõnikord ka spetsiaalselt põhiandmete haldamiseks mõeldud rakenduste kaudu, mis võivad katta ühte või mitut põhiandmete objektide loendit. Organisatsiooni põhiandmete haldamisel:

  • On oluline eelnevalt kokku lepitud andmearhitektuur. Teisenduste ja agregeerimiste puhul peab arvestama organisatsiooni struktuuri, lähtesüsteemide arvu, andmehalduse küpsusastet, andmetele juurdepääsu vajadusi ja latentsust, samuti andmeid tarbivate süsteemide ja rakenduste arvu.
  • Põhi- ja viiteandmete (reference data) liikumine organisatsioonis. Ühiskasutuskeskkonnas tuleb pidada silmas, et:
    • oleks alati võimalik tõendada, kuidas andmeid organisatsioonis jagatakse ja kasutatakse;
    • kõik andmeallikad oleksid hiljem tuvastatavad;
    • probleemide põhjuste analüüsimisel pakutaks lähtesüsteemidele abi;
    • organisatsioonile tuleks näidata, kuidas põhiandmete keskne haldus on tõstnud andmekasutuse efektiivsust ja andmekvaliteeti;
    • põhiandmete latentsus ehk uuendamiste viiteaega hinnataks andmete kasutamisvajaduse, mitte nende kogumise kaudu;
    • integratsioonide ja teisenduste korral jääksid kõik ärireeglid kehtima.
  • Viiteandmed peavad olema keskselt jagatud ressurss. Andmehalduse raames kinnitatud korrad ja protsessid tagavad muudatuste korrektsuse ja kättesaadavuse. Viiteandmete haldamisest lokaalsetes infosüsteemides tuleks loobuda.

Sõlmige andmevahetuslepingud. Viite- ja põhiandmete jagamine ja kasutamine nõuab organisatsiooni erinevate- ja väliste osapoolte vahel koostööd. Juurdepääsude ja kasutatavuse tagamiseks peab sõlmima kokkulepped, milles sätestatakse andmete jagamise tingimused. Lepingud lahendavad andmete kättesaadavuse või kvaliteediga seonduvaid probleeme. Andmehaldus paneb lähtesüsteemide omanikke tarnima ainult kvaliteetseid andmeid. Selleks sõlmitakse nendega eraldi teenustasemete lepingud (SLA) ja lepitakse kokku mõõdikud. Samuti on väga oluline ühtne kommunikatsioon, et hoida kõiki osapooli kursis probleemide ja tegevustega.

5.6 Andmete ja info jagamine

  • Andmete teisendamised. ETL tööriistad (vt. Joonis 17) on andmete teisendamise peamised vahendid. Kuna nende juurutamine on töömahukas, siis ühekordsete teisenduste puhul kasutatakse lihtsalt SQL skripte. ETL töövahendi valimisel tuleb teada, kas andmeid on vaja tulevikus käsitleda reaalajas ja kas lisaks struktureeritud andmetel käideldakse ka struktureerimata andmeid.
  • Andmete virtualiseerimine. Andmete teisendamist võib ETL vahenditega teostada füüsilises andmebaasis aga võib kasutada ka virtuaaliseerimise kihti, mis parandavad oluliselt jõudlust. Virtuaalserverid suudavad ühendada ka struktureeritud ja struktureerimata andmeid. Virtuaalserverid ei asenda andmeladu, vaid on pigem üheks lähtesüsteemiks.
  • Andmevahetuskiht (Service Bus). Sõnumipõhine andmevahetusarhitektuur, mida kasutatakse reaalajas baaside, rakenduste ja serverite vahel andmevahetuseks. Kõige sagedamini kasutatakse asünkroonset andmevahetust, kus sõnumile kinnitusvastust ei oodata ja tagatakse nii andmeliiklusele vaba voog. Keskne server moodustab sõnumitest järjekorra, hallates andmetellimusi ja prioriteete.
  • Ärireeglite haldusvahend. Andmevahetused ja teisendused sõltuvad ärireeglitest, mis on organisatsiooni oluline metaandmestik. Ärireeglite haldusvahend võimaldab mittetehnilistel kasutajatel, ilma andmevahetuste tehnilist koodi muutmata, teha reeglites muudatusi.
  • Andmete ja protsesside modelleerimise töövahendeid saab kasutada ka andmevahetuseks vajalike ajutiste andmestruktuuride disainimiseks. Infosüsteemide ja organisatsiooni üksuste vahel edastatavate sõnumite või andmevoogude struktuuri tavaliselt ei säilitata, aga see tuleks sellegipoolest modelleerida.
  • Andmete profileerimine. Töövahend võimaldab analüütikutel ja andmehalduritel skaneerida andmemudeleid ja teostada kvaliteeditunnuste esialgset hindamist ja koostada andmete esmast analüüsi (EDA – exploratory data analysis). Mõningaid tööriistu saab kasutada ka andmete pidevaks jälgimiseks. Andmete visualiseerimise võimalus töövahendis lihtsustab kasutamist.
  • Metaandmete hoidlad / Andmekataloogid sisaldavad teavet organisatsiooni andmete kohta, sealhulgas andmestruktuuride ja ärireeglite kohta. Integratsiooniprojektide ajal võib hoidlaid kasutada hangitavate andmete tehnilise struktuuri ja ärilise tähenduse dokumenteerimiseks.

5.7 Andmeturvalisuse tagamine

Andmeturvalisuse haldamiseks kasutatavad töövahendid sõltuvad organisatsiooni suurusest, võrguarhitektuurist ning turvamiseks kasutusel olevatest põhimõtetest ja standarditest.

Töövahendid võib grupeerida järgnevalt:

  • Juurdepääsu kontrollivad süsteemid (andmevahetuse ja suhtluse krüpteerimine, tulemüürid).
  • Arvuteid ja -võrke kaitsvad süsteemid (viirusetõrje tarkvara).
  • Identiteete haldavad süsteemid (kasutajale määratud mandaadid (credentials) ja sisselogimisel nende infosüsteemidega jagamine (võtmed). Enamikul juhtudel rakendatakse keskset lahendust ja LDAP protokolli).
  • Sissetungide tuvastamise ja ennetamise tarkvara (IPS) (tulemüüridesse või muudesse turvameetmetesse sissetungi korral ründe tuvastamise ja dünaamilise juurdepääsu keelamise tööriistad).
  • Ründe tuvastamise süsteemid (IDS), mis alarmeerivad juhtumi toimumisest. IDS koos ründe ennetamise süsteemidega (IPS) teostavad organisatsioonisiseste mustrite analüüsi, mille tundmine võimaldab tuvastada tavapäratuid sündmusi.
  • Metaandmete jälgimine aitab organisatsioonil monitoorida tundlike andmete liikumist ja seeläbi vältida riske, kus sisemine teave lekib dokumentide kaudu. Kuigi võib tekkida hirm, et metaandmete keskne hoidla sisaldab liiga palju tundlikku teavet ja muutub pideva ründe objektiks, ei ole see risk siiski võrreldav sellega, mis tuleneb andmekaitse puudumisest teadmatuse tõttu. Avatud võrke ja avatud dokumente on rünnata alati lihtsam kui metaandmete hoidlat.
  • Andmete hägustamine (obfuskeerimine) / Krüpteerimine. Need tööriistad on vajalikud tundlike andmete liikumise piiramiseks.

Lisaks töövahenditele on kasutusele ka erinevad tehnikad:

  • CRUD maatriks – andmete loomise, lugemise, uuendamise, kustutamise õiguste maatriks aitab kaardistada andmetele juurdepääsuõiguseid ja vajadusi.
  • Turvaparanduste kohene paigaldamine kõikidesse serveritesse peab olema organisatsiooni hea tava ning protsessidega kaetud. Ka kasutajad ei tohiks värskendusi edasi lükata.
  • Metaandmestiku olemasolu tagab organisatsiooni andmemudeli terviklikkuse ja järjepideva kasutamise kõikides äriprotsessides. Metaandmed peavad sisaldama ka andmete turvaklasse ja osutama juurdepääsu piirangute vajadustele, näiteks sellega, et andmed on märgitud isikuandmeteks. Need kaitsevad andmeid teadmatute töötajate eest, lihtsustavad õiguste ja volituste haldamist, samuti teavitavad IT arendusmeeskondi tundlike andmetega seonduvast.
Kas see artikkel aitas sind? Jah Ei

Abi saamiseks konktakteeru meiega.