A PetaPylon a logelemzésen túlmutató, teljes körű adatmenedzsment-megoldásként jelenik meg a piacon, amely a LogDrill hasonló nevű szakértői szoftverénél szélesebb felhasználási spektrumot fed le, mivel – a forrásadatok formátumától és strukturáltságától, az adatforrások számától függetlenül – tranzakciós és naplóadatok egyidejű feldolgozására is alkalmas. Bevezetésével a felhasználó szervezetek komplex, az adatgyűjtés, -tárolás és -elemzés teljes folyamatát lefedő adatmenedzsment infrastruktúrát alakíthatnak ki, a LogDrill szerint más megoldásokhoz képest alacsonyabb beruházási költségek mellett.
A nyílt forráskódú szoftverelemekre – a Hadoop disztribúciójára és a Cloudera Impala masszívan párhuzamos feldolgozást támogató SQL lekérdező motorjára – épülő PetaPylon hardverelemeit a Fujitsu szállítja, a referencia architektúrák alapján azonban a célgép konfigurációját maguk a felhasználók is összeállíthatják, illetve bővíthetik olcsó, szabványos komponensekből – mondta dr. Nagy Zsolt, a LogDrill Kft. ügyvezető igazgatója a big data készülék budapesti bejelentésén.
A PetaPylon már minimális kiépítésben - öt node-ból kialakított klaszteren – is több mint 20 terabájt mennyiségű adat elemzésére alkalmas. Elosztott adattároló infrastruktúrája kiemelkedő adatbetöltési és feldolgozási sebességet, méretezhetőséget és – a cserélhető komponensek folytán – üzembiztonságot ad. A PetaPylon analitikai teljesítményét jól érzékelteti, hogy a részét képező LogDrill szoftver a megadott paramétereknek megfelelően 5 milliárd logsort (kb. 1 terabájt méretű naplófájlt) 3 perc alatt 5 millió, 10 perc alatt 5 ezer, nem egész 14 perc alatt 50 logsorrá szűr, amelyeken egységesen 1 másodperc alatt lefuttatja a lekérdezéseket.
Az általános célú analitikai eszköz különösen jól alkalmazható folyamatosan nagy mennyiségben előálló, például szenzorokról érkező adatok, mérési eredmények gyors kiértékelésére. A PetaPylon szabványos SQL interfészen keresztül az elterjedt vállalati szoftverekhez, üzleti intelligencia rendszerekhez is könnyen illeszthető, bevezetése a célgépekre jellemző módon nem igényel külön felkészülést és ezzel járó ráfordítást.
A LogDrill és a PetaPylon két beépülő modulja, a strukturálatlan vagy félig strukturált adatok strukturálttá alakítását biztosító Normalizáló, valamint az érzékeny adatok biztonságos elemzését lehetővé tevő Anonimizáló önálló termékként is elérhető. A termékcsalád 3 éves fejlesztőmunka eredménye, amelyre a LogDrill 1,2 milliárd forintot fordított – ebből 700 millió forintot tett ki az Új Széchenyi Terv gazdaságfejlesztési program pályázatán nyert uniós támogatás.
A termékcsalád egyes elemeit már több nagyvállalat is használja, eddig elsősorban a pénzügyi és a távközlési szektorban történtek termékbevezetések. A LogDrill idén márciusban is ott volt a Cebiten, a cég standját 46 országból több mint 200 érdeklődő kereste fel. Nagy Zsolt elmondta, hogy jelenleg több, külföldi végfelhasználóval és viszonteladóval is tárgyalnak, többek között iparág-specifikus – például agrárinformatikai – big data megoldások kidolgozásáról is.