Kétségtelen tény, hogy az informatikai rendszerek működésének egyaránt kiszolgáltatottak a szolgáltatók és a fogyasztók. Az IT-eszközöket és -alkalmazásokat használó cégeknél egy áramszünet, az internetkapcsolat megszakadása vagy egy adatvesztés ugyanúgy katasztrófát jelenthet, mint egy természeti csapás. Egyes kritikus szervezetek (például bankok, biztosítók) számára jogi előírás a katasztrófaelhárítási terv megléte. Számos olyan területen, ahol ugyan nincs ilyen követelmény, szintén legalább az elvárható gondos gyakorlat szintjén indokolt a felkészülés, ezt a de facto szabványok (például ITIL) is támogatják. Mindenekelőtt tehát azt kell felmérni, hogy mik azok a váratlan események, amik az adott cég működését veszélyeztetik. Ezt követi a megoldást jelentő tervek elkészítése.
„A problémakör fő nehézsége, hogy vannak ugyan általános érvényű előírások, ám minden felborul, ha azokat megpróbálják átültetni a gyakorlatba. A tervek, tartalmukat tekintve jellemzően modellekből és táblázatokból állnak, amelyekben az szerepel, hogy az adott cég mit gondol a saját rendszeréről. A valós rendszer azonban sokszor különbözik az elképzelt modelltől. Szerencsére az utóbbi években számos olyan technológia jelent meg, melyek segítségével naprakész képet lehet kapni arról, hogy egy cég hogyan is működik valójában informatikai szempontból” – mutat rá Gönczy László, a Műegyetem Méréstechnika és Információs Rendszerek Tanszék Hibatűrő Rendszerek csoportjának kutatómérnöke.
Előnyös a felhő
A felmérésnél kétféle metodikát célszerű követni: lentről fölfelé, valamint föntről lefelé közelíteni a kérdést. Az informatikusok általában szeretnek a konkrét, megfogható számítástechnikai eszközök felől elindulni. Ezt a módszert segítheti, ha az adott cégnek van egy úgynevezett konfigurációmenedzsment-adatbázisa (CMDB), ami lényegében egy leltár, a cég informatikai erőforrásainak automatikusan készített és karbantartott leltára, amely egyben élő képet ad a rendszerről.
A másik, föntről lefelé haladó felmérés jelenti általában a nagyobb kihívást. Ennek során azt kell meghatározni, hogy az adott cég szempontjából melyek azok a funkciók, amelyeknek a kiesése kritikus. Ezen megközelítés alapja a cég üzleti folyamatainak definiálása, akár folyamatmodellek, akár szöveges leírások szintjén. A feladat nem kicsi, hiszen az üzletmenethez kapcsolódó folyamatok száma egy közepes méretű magyar cégnél is több százra rúghat.
Ezután – az üzleti szakterület bevonásával – kockázatelemzéssel meg kell határozni a legfontosabb folyamatokat. A választásnál több szempontot célszerű figyelembe venni. Az első helyen a pénzügyi szempontok állnak, de fontosak lehetnek a jogi, valamint az adott cég belső szabályozásából adódó szempontok is. Jellemzően azt vizsgálják, hogy egy relatív skálán egy adott időtartamra vonatkoztatva milyen súlyosságú egy rendszer kiesése.
A következő lépésben a kiválasztott folyamatokat össze kell rendelni a cégnél használt erőforrásokkal. Így megmondható, hogy katasztrófa esetén mit kell helyreállítani, illetve minek az alapszintű működése elengedhetetlen. „Ez már egy közepes méretű cégnél is komoly kihívás, hiszen az adott folyamatok gyakorlati megvalósítása gyakran eltér a dokumentációkban foglaltaktól. Sokszor a különböző automatizált és manuális módszerek segítségével történő felderítésnek nincs alternatívája a kritikusnak minősített üzleti folyamatok meghatározására, ami a helyreállítási terv alapja. Fontos, hogy a helyreállítási terv ne csak az informatikai jellegű lépéseket tartalmazza, hanem az ezekhez szükséges szervezeti hátteret is. A szerepkörök definiálásával rögzíteni kell, hogy a cégen belül kik képesek a szükséges helyreállítási lépéseket megtenni, illetve ha házon belül nincs ilyen szakember, akkor milyen tudású, képesítésű külső szakembert kell a feladat elvégzéséhez igénybe venni. A katasztrófaelhárítási terv tehát számos, az informatikán túlmutató elemet is tartalmazhat, ugyanakkor elkészítése önmagában is ’rendet’ csinál” – hangsúlyozza a szakember.
Technológiai oldalról nézve a probléma megoldását, a katasztrófaelhárítás folyamatát nagymértékben segíthetik a felhőalapú szolgáltatások, amikor is a cég nem maga üzemelteti az informatikát, vagy ha mégis, akkor is fenntarthat a távolban egy meleg vagy forró tartalékot, amire akár kiesés nélkül átállhat.
Nem szabad megfeledkezni a frissítésről
A katasztrófaelhárítás szempontjából kényes kérdés az informatikai rendszer változásainak időről időre történő nyomon követése. Mivel az ITIL szabványnak része a változáskezelés, azon szervezetek, amelyek az ITIL szerint próbálnak meg működni, könnyebb helyzetben vannak. Itt a katasztrófaelhárítási terv frissítését célszerű lehet akár a változáskezelési folyamat részévé tenni.
A kisebb cégeknél, illetve ott, ahol nem rendelkeznek ITIL jellegű működési kézikönyvvel, legalább a nagyobb hardveres és szoftveres változások után érdemes a tervet frissíteni. Ezen kívül évente legalább egyszer ajánlott ellenőrizni a feltételezéseket (a rendszerek megfelelnek-e a tervben foglaltaknak, a megnevezett munkatársak elérhetőek-e, a szerződések élnek-e stb.)
Hiányzik az emberi erőforrás
Magyarországon a cégeknél még nem általánosan elterjedt a katasztrófaelhárítási és/vagy üzletmenet-folytonossági terv készítése. Annak dacára ez a helyzet, hogy a tervek elkészítéséhez számtalan ingyenes (jellemzően angol nyelvű) forrás áll rendelkezésre. Szó sincs tehát arról, hogy feltétlenül költséges szoftverberuházásban kellene gondolkozni.
„Tapasztalatunk szerint a tervek elkészítésének legfőbb akadálya az emberi erőforrás hiánya. Egy megfelelő elhárítási tervvel számos, manapság igen gyakori rendszerleállást lehetne megelőzni. Ráadásul egy ilyen tervnek járulékos haszna is van. Alkalmazásával teljesebbé válik a rendszerrel kapcsolatos tudás, aminek birtokában akár a hibaokok is kiküszöbölhetők, azaz minimális beruházással megelőzhetők bizonyos katasztrófák. A katasztrófaelhárítási terv költsége természetesen függ a cég méretétől. Nagyságrendje összehasonlítható egy rendszerfelmérési projekt költségével” – tájékoztat Gönczy László.
A katasztrófaelhárítási tervvel egy cég nem csupán az esetleges kiesésekből származó veszteségeket csökkentheti, hanem erőforrásai pontos ismeretében olcsóbbá is teheti üzemeltetését.
Minden cégnek érdemes lehet felmérnie, hogy mivel jár, ha az informatika egy óráig/napig/hétig nem működik. Ha ezt számszerűsítik, valószínűleg átlagosnak mondható hazai cégméret esetén is érdemes a katasztrófelhárítással foglalkozni.
A szakember szerint tipikus hiba a katasztrófaelhárítási terv készítésének teljes folyamatát rábízni a rendszergazdára. Nem elég ugyanis a teljes informatikai rendszert feltérképezni, azt is pontosan fel kell mérni, hogy mindebből mire van igazán szükség a cégnél. Ez utóbbi feladatot csak olyasvalaki tudja elvégezni, akinek horizontális rálátása van a cég teljes működésére. (Esetleg több ember láthatja el ezt a feladatot.) Összességében a katasztrófaelhárítási terv elkészítésénél az informatikai szakembereknek – fejlesztőknek és üzemeltetőknek – a vállalat üzleti vezetőivel együtt kell dolgozni.
A területhez kapcsolódóan júniusban Budapesten rendezik meg a hibatűrő módszerek világkonferenciáját, az IEEE/IFIP Dependable Systems and Network Conference 43. kiadását.
DRP és BLP
A katasztrófahelyzetek megfelelő kezelésére alapvetően kétfajta terv létezik: a katasztrófaelhárítási terv (disaster recovery plan, DRP) és az üzletmenet-folytonossági terv (business continuity plan, BCP). Míg a DRP szorosan nézve a helyreállítással foglalkozik, addig a BCP arra is kitér, hogy miként lehet már a helyreállítás közben is valamilyen – akár csökkent értékű – szolgáltatást nyújtani az ügyfeleknek.
Fontos a dokumentálás
A BME informatikusképzésének több szakirányán oktatnak katasztrófaelhárítással kapcsolatos ismereteket. Az elmélet gyakorlati alkalmazására vonatkozó ajánlások megismertetésén kívül azt a legfontosabb tudatosítani a szakemberekben, hogy egy informatikai infrastruktúra működtetése maga is üzleti érték, amihez bizonyos üzleti folyamatok tartoznak. Ebből következően elengedhetetlen az informatikai erőforrások pontos modellezése/dokumentálása.
Logelemzés
Az informatikai rendszerek működésük közben rengeteg adatot termelnek, amelyek tanulságosak lehetnek. A logokból következtetések vonhatók le például a rendszer működéséről, a kiesésekről. Érdemes tehát elgondolkozni azon, hogy miként lehet a logokat figyelni, hasznosítani.