Adatok a felhőben
Immár számos lehetőség közül választhatnak azok a cégek, amelyek felhőalapú adattárház-platform bevezetésére készülnek. A három nagy publikus cloud versenyében továbbra is az Amazon Web Services (AWS) áll az élen, amely dinamikusan fejleszti portfólióját, és egyre újabbnál újabb adatmenedzsment-szolgáltatásokat jelent be. A jól ismert Redshift DW platform mellett immár elérhetőek a fix infrastruktúrát nem igénylő, úgynevezett ServerLess architektúrák, valamint megjelentek a kínálatban a menedzselt streamingdata-szolgáltatások és a MongoDB és ElasticSearch-jellegű NoSQL adatbázisok is.
Szintén nagyon érdekes szereplője a felhőalapú DW-k szegmensének a Snowflake, amely csak néhány éve robbant be a piacra, de hatalmas tempóban száguld előre, és sok százmillió dolláros kockázati tőke áll mögötte. A Snowflake architektúrát kifejezetten a felhőre tervezték és optimalizálták, így különösen kedvező ár/teljesítményt nyújt.
Automatizált adattárházak
Az adattárházas fejlesztések közmondásosan sokáig tartanak, és rengeteg pénzt visznek el, ami főként a számos különböző rendszerből származó, sokszor közepes vagy éppen gyenge minőségű forrásadatok integrálásának nehézségeiből fakad. Ráadásul mire elérne valahová a fejlesztés, addigra vagy az alaprendszerek változnak meg, vagy az üzleti felhasználók igényei.
E problémák megoldását ígérik az adattárház-automatizációs szoftverek, ezek egyik vezető képviselője a WhereScape. A hagyományos kézi fejlesztéssel szemben a modellalapú, kódgenerálásra épülő eszközök használatával nemcsak az eredeti fejlesztés lesz gyorsabb, hanem az üzleti vagy technológiai változások követése is egyszerűsödik.
A big data új arca
Bigdata-körökben az elmúlt év legnagyobb eseménye a Cloudera és a Hortonworks összeolvadása volt. A közös gyökerekkel rendelkező, de eltérő üzleti stratégiát képviselő cégek összefogásával teljesen új helyzet jön létre ezen a piacon, az integráció azonban számos érdekes kérdést vet fel.
Jó példa erre, hogy a Cloudera termékkínálata csak részben volt open source, bizonyos modulokat csak a fizetős ügyfelek érhettek el, ezzel szemben a Hortonworks a 100 százalékig nyílt forráskód filozófiáját vallotta. Azt már tudjuk, hogy az új, közös platform szintén teljesen nyílt lesz, de a pontos feltételek még nem ismertek.
Szintén izgalmas kérdés, hogy a hasonló célú, eddig egymással versenyző Hadoop-modulok közül a jövőben melyiket lesz érdemes inkább használni. Ilyen terület például az SQL-lekérdezések, ahol a Hortonworks teljes erővel a Hive mögött állt, míg a Cloudera az Impala motort fejlesztette.
Magyar fejlesztések
Megtalálhatóak a programban az új technológiák bemutatása mellett hazai esettanulmányok is. A tervek szerint lesz szó adattárház-építési tanulságokról, nagyméretű DW-rendszerek újraszervezéséről és átalakításáról, vagy éppen egy új, zöldmezős adatalapú döntéstámogató rendszer kialakításának lépéseiről.
Az előadók között szerepel majd többek között az Extreme Digital, a Freemail, az OTP Bank, a Prezi és az IBM Budapest Labs (ex-Ustream) is.
Karrierek az adatok világában
A konferencia kísérőrendezvénye az ingyenesen látogatható, állásbörzével összekötött Data Careers Night nyílt este, amelyen az érdeklődők betekintést nyerhetnek a különböző adatos szakmák rejtelmeibe, a Mentorsarokban személyre szabott karriertanácsokat kaphatnak, és megismerkedhetnek a kiállítók aktuális állásajánlataival. Az este részletes programja a datajobfair.hu oldalon olvasható.
Adattárházak, big data, adattudomány
2019. május 21-23.
Budapestdata.hu