Hirdetés
. Hirdetés

Veszélyes adattavak

|

Több szállító is igyekszik a bigdata-projektek nélkülözhetetlen elemeként beállítani az adattavakat, miközben elég nagy a szórás azt illetően, hogy ki mit ért adattó (data lake) alatt, és abból az üzleti felhasználó miként nyerhet értéket, ami eléggé zavarossá teszi az információmenedzsment legújabb koncepcióját.

Hirdetés

Tágabb értelemben az adattavakat nagyvállalati szintű adatmenedzsment-platformként határozzák meg a szállítók, amelyen a különböző forrásokból származó adatok natív formátumukban érhetők el elemzésre. Az adatokat nem kell egy adott célnak megfelelően kialakított adattárba helyezni, előkészíteni, megtisztítani és átalakítani, azok eredeti formátumukban kerülnek az adattóba, és azonnal hozzáférhetők a szervezet egészében, amivel idő és költség takarítható meg.

Hirdetés

Ha hinni lehet a koncepciót tömjénező marketingüzeneteknek, az adattavakat a nagyvállalatoknál a felhasználók minden eddiginél szélesebb köre tudja hasznosítani munkája során. A pozicionálás azonban láthatóan azt is feltételezi, hogy az üzleti felhasználók mindegyike magas szinten műveli az adatmanipuláció és az analitika tudományát is, mivel az adattavakból hiányzik a szemantikus következetesség, és hiányoznak a metaadatok is, hívta fel a figyelmet a Gartner (The Data Lake Fallacy: All Water and Little Substance, 2014).

Az adattavak a legkülönfélébb forrásokból származó adatokat gyűjtik magukba, tekintet nélkül arra, hogy azokat a vállalat miként fogja felhasználni, milyen szabályok szerint kezeli, definiálja és védi őket. Ez a koncepció egy régi és egy új problémát hivatott megoldani. Előbbi az információs silók problémája: az egymástól elszigetelt adattárak konszolidálásával az adattavak elméletileg az információhasználat és -megosztás katalizátorává válnak a szervezetnél, miközben költségcsökkentéshez is hozzásegítik a vállalatot.

 

Az új probléma a bigdata-kezdeményezésekhez kötődik. Ezek a projektek olyan nagy és változatos információmennyiségek kezelését feltételezik, amelyeknél az adatok beérkezésekor még nem dönthető el, hogy a szervezet milyen elemzésekhez fogja használni őket. Éppen ezért a nagy adat lényege veszne el, ha ezt az információfolyamot a vállalat megpróbálná azonnal egy strukturált adattárházba, relációs adatbázisba sulykolni, amely eleve behatárolná a jövőben elemzések körét.

Rövid távon egy adattó kétségtelenül megkönnyítheti az IT-osztály munkáját, mivel nem kell időt és más erőforrásokat fordítania arra, hogy megértse, az üzleti oldal miként kívánja hasznosítani az információkat. A koncepció azonban komoly kockázatokat hordoz magában. Miután minden adat belezúdul, előzetes felügyelet vagy irányítás nélkül, az adattóból hiányoznak a leíró metaadatok, és a fenntartásukhoz szükséges mechanizmusok is.

Ezek hiányában az adattó könnyen adatmocsárrá változhat, amelyben lehetetlen meghatározni az adatok minőségét, és a korábbi elemzések eredményeit sem lehet hasznosítani, minden analízist az alapoktól kell kezdeni. További kockázatot jelentenek az adatbiztonság és a hozzáférés szabályozásának hiányosságai. Az adattavakba kerülő információk a törvényi megfelelés szempontjából minden bizonnyal eltérő elbírálás alá esnek, ami olyan kérdéseket vet fel, amelyeket az üzleti felhasználók önállóan aligha fognak megoldani.

Nem hagyhatja figyelmen kívül a vállalat a teljesítmény szempontját sem. Az elemzőeszközök és az adatinterfészek egyszerűen nem nyújthatják ugyanazt a teljesítményt egy általános adattáron, mint ami egy adott célnak megfelelően kialakított és optimalizált infrastruktúrán elérhető velük. Éppen ezért a Gartner azt tanácsolja, hogy a vállalatok inkább az adattárházak szemantikus következetességéből és teljesítményéből származó előnyökre fókuszáljanak, mint az adattavakkal elérhető információkonszolidálásra.

Az adattavak jellemzően irányítás nélküli információgyűjtő helyként kezdenek működni, az üzleti felhasználók széles köre azonban szabályozott és felügyelt, adatminőséget, szemantikus következetességet és ellenőrzött hozzáférést biztosító adattárakkal szolgálható ki jól, és ezek az elemek már eleve adottak az adattárházakban.

Alapvető problémát jelent az adattó koncepciójában az a feltételezés, hogy a felhasználók tisztában lesznek az oda kerülő információk kontextuális hiányosságaival, azokat nemcsak megértik majd, hanem azt is tudni fogják, hogy a különböző forrásokból származó adatokat miként készítsék elő elemzéseikhez. Jóllehet, ez igaz lehet a munkakörükből adódóan adatokkal dolgozó felhasználókra, például az adatkutatókra, az üzleti felhasználók túlnyomó többsége aligha áll ezen a szinten.

A szükséges kompetenciák megszerzését sem lehetne elvárni tőlük, ez nemcsak időigényes és költséges, hanem ilyen méretekben felesleges, vagy egyenesen lehetetlen volna.
Mérlegelnie kell ezért a vállalatnak, hogy az analitika terén milyen stratégiát kövessen. Ha az egyedi, egymástól független, ötletszerű elemzéseket támogatná, akkor egy adattó vonzó megoldás lehet. De ha bizonyos mértékig formalizálná analitikai törekvéseit, akkor érdemes továbblépnie, és egy robusztus, logikai adattárház-stratégiát kialakítania.

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.computertrends.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.