Hatalmas üzleti transzformációs lehetőséget hordoznak az adatok, napjainkban azonban a szervezetek ennek csupán a töredékét tudják megragadni és hasznosítani, mivel megfelelő és könnyen elérhető adatok és eszközök híján adattudósaik képtelenek kellően hatékony gépi tanulási (ML-) modelleket építeni és bevezetni. Következésképpen az algoritmusok tanítása, a modellek fejlesztése túl hosszú időbe telik, pontosságuk és megbízhatóságuk sem felel meg mindig a követelményeknek, ezért a vállalatok a ráfordítások ellenére gyakran lemondanak a bevetésükről éles környezetben.
- Bár egy-egy jól megfogalmazott és kidolgozott modellt, például a beszéd- vagy képfelismerést a vállalatok szolgáltatásként is elérhetnek, és könnyen beépíthetnek megoldásukba, gyakran előfordul, hogy saját modelleket kell építeniük és tanítaniuk, mivel speciális üzleti problémáik vagy meglévő rendszereik ezt szükségessé teszik, mondja Molnár Balázs, az Oracle regionális felhőszakértője.
- Minthogy messze vagyunk még a gépek önálló problémamegoldásától, ez hozzáértő emberi közreműködést feltételez. Sok vállalatnak okoz nehézséget a feladat, mert már a megfelelő szoftverkörnyezet számos komponensének összeállításához is speciális tudású szakemberek kellenek. Az algoritmusok tanításához szükséges számítási kapacitás sem áll rendelkezésre minden cégnél, már csak azért sem, mert annak kihasználtsága nagyon szezonális lesz, erősen változik a modellek élettartama során. Amíg az algoritmusok tanítása kifejezetten feldolgozás-igényes, addig bevezetésüket követően a korábbi kapacitás töredékével is beérhetik. Az adatokról nem is szólva: feltérképezésük, kinyerésük a forrásrendszerekből, többlépcsős feldolgozásuk, megfelelő formába öntésük adja a legtöbb feladatot a szakembereknek. Nagyon sok és sokféle adatról beszélünk persze, amit mozgatni kell a rendszerek között, nem véletlenül mondják, hogy az AI-projektek 90 százaléka adatkezelés és -formázás.
Nem kisebb kihívás az ML/AI-modellek összeállítása sem, mert az adattudósoknak jól kell feltenniük a kérdéseket, megfogalmazniuk a célokat, hogy később a modellekre támaszkodó alkalmazásoktól értékelhető válaszokat, előrejelzéseket kapjon a vállalat. A felkészült szakemberek ebben a szerepkörben értenek az üzlethez, tisztában vannak a fogalmakkal és adatbázisokban történő leképezésükkel csakúgy, mint az adatkezelés jogi szabályaival. A modelleket az adattudósok több rétegből, új és már meglévő elemekből állítják össze, majd tanítják, tesztelik és mérik hatékonyságukat, azután hangolják őket, és kezdik a folyamatot az elejétől, amíg nem kapnak kívánt pontosságú eredményt. Rengeteget kommunikálnak eközben az érintett rendszerek fejlesztőivel, üzemeltetőivel, a biztonsági szakemberekkel és az üzlet képviselőivel is.
- Az Oracle Cloud Data Science platformja ezt a teljes folyamatot segíti, a felhőben kulcsrakész laboratóriumot ad, amelyben az adattudósok mindezeket a feladatokat el tudják végezni, mondja Molnár Balázs. - A platform előre elkészített modelleket tesz elérhetővé, automatikus algoritmusokkal segíti az adatok feltérképezését, a modellek számára legértékesebb paraméterek kiválasztását, a modellek hangolását, újrahasznosítását és dokumentálását, amivel sok száz emberi munkaórát takarít meg. A vállalatok a felhőből bérelhetnek azonnal használható, akár hatalmas adattárolási és számítási kapacitásokat arra az időre, amíg ez szükséges, majd átengedhetik az erőforrásokat másoknak, a szakemberek értékes idejét nem kell a komponensek telepítésére, a környezet felállítására pazarolniuk. A csapattagok így az üzleti problémára összpontosíthatnak, amelynek eredményes megoldásán múlik végső soron a projekt sikere.
Felhőlabor gépi tanuláshoz
Az Oracle Cloud Data Science Platform magját az Oracle Cloud Infrastructure Data Science alkotja, amelyet a szoftvercég a 2018-ban felvásárolt DataScience.com felhőalapú megoldásából kiindulva fejlesztett tovább, hogy a felhő-infrastruktúráját használó vállalatoknak nagy teljesítményű és rugalmasan méretezhető környezetet adjon a gépi tanulás és mesterséges intelligencia alkalmazását célzó projektek megvalósításához. A Data Science platformon az adattudósok csapatmunkában építhetnek, taníthatnak, menedzselhetnek és vezethetnek be ML/AI-modelleket, így nagyban növelhetik a projektek sikerességét. Az Oracle szerint a megoldás azzal tűnik ki a mezőnyből, hogy előtérbe helyezi az adattudósok együttműködését, amit többek között projektmegosztással, modellkatalogizálással, csapatszintű biztonsági házirendekkel, valamint a munkafolyamatok megismételhetőségével és tanúsíthatóságával támogat.
Modern szoftverfejlesztési folyamatokból és módszerekből merített ihletet az Oracle a platform csapatmunka-támogató képességeinek kialakításához. Az adattudósok ugyanis hajlanak arra, hogy mindenféle eszközöket és adatokat töltsenek le laptopjukra, amellyel azután félrevonulnak az elmélyült, de másoktól meglehetősen elszigetelt munkához. Könnyű belátni, hogy ezzel gyengül az elszámoltathatóság, sérülhet a biztonság, és a szoftverfejlesztés jó gyakorlatát is nehéz követni. A szoftvercég ezért olyan platformmegoldást fejlesztett, amely a munka strukturálásával és az együttműködés előmozdításával orvosolja a problémát, de az adattudósokban sem kelt olyan érzést, hogy munkamódszereiket korlátok közé akarná szorítani.
Sokkal inkább az Oracle Cloud Infrastructure Data Science olyan képességekkel segíti az adattudósok egyéni és csapatmunkáját, mint az AutoML, amely automatizálja a célnak legmegfelelőbb algoritmusok kiválasztását és hangolását, a tanításhoz használt adatkészletek optimalizálását, a modellek kiértékelését és alátámasztását, megindokolását. Az Oracle Cloud Data Science Platform funkcionalitása ráadásul átfogja a gépi tanulás teljes életciklusát, vagyis a modellek fejlesztésén és tanításán túl azok bevezetését és karbantartását is hasonlóan hatékony eszközökkel támogatja.
Napjainkban, a Covid-19 krízisben is tapasztaljuk, hogy az adatok milyen gyorsan változhatnak, és a kidolgozott modellek hamar érvényüket veszíthetik, ezért a vállalatoknak az adattudomány terén is agilitásra kell szert tenniük, hogy a gépi tanulás és a mesterséges intelligencia képességeit hívhassák segítségül a gyors válaszadáshoz. A gyorsaság ugyanakkor nem mehet a megbízhatóság rovására, a szervezetek nem tépelődhetnek azon, hogy modelljeik valóban jó és pontos válaszokat adnak, vagy sem, ezt nem bízhatják a véletlenre. Cloud Data Science platformját ezért az Oracle az együttműködés és az irányítás környezeteként építette fel az adattudósoknak.
Platform AI-ismerkedéshez
Világszerte a mesterséges intelligencia számos használati esetével találkozunk, és néhány nagyobb cég már idehaza is az éles működés szakaszába lépett AI-projektjével. A bevezetett megoldások többek között a marketing, a raktárkészlet és a logisztika optimalizálása, a flottamenedzsment és a tudományos alapkutatás területén működnek. Sok hazai vállalat viszont most ismerkedik a mesterséges intelligenciával, amihez tesztkörnyezetet, úgynevezett homokozót épít. Az Oracle Cloud Data Science platformja az AI ízlelgetését is élvezetesebbé teheti.
- Sokat hallottuk már, hogy az adat az új olaj, ezért ha továbbvisszük az analógiát, akkor a mesterséges intelligencia az ember erejét megsokszorozó motor, amely adattal működik, mondja Molnár Balázs. - A vállalatoknak ezért elsősorban adatplatformjukat kell felkészíteniük a feladatra, ha kiaknáznák az AI lehetőségeit, mert minden eddiginél több és változatosabb, eltérő forrásból származó adatot kell kezelniük és transzformálniuk. Kézenfekvő, hogy ehhez a legjobb adatkezelő platformot érdemes használniuk. Az olyan technológiák, mint a bigdata-platformok, szintén az új típusú, például a dolgok internetén és a közösségi hálókon keletkező, az élő videófolyamokban érkező adatok feldolgozására termettek. Mérlegelniük kell a vállalatoknak továbbá, hogy mely adataikat vihetik ki a felhőbe, ahol sokkal rugalmasabb, olcsóbb és hatékonyabb eszközökkel dolgozhatnak, mint saját adatközpontjukban, bár utóbbiban is kiépíthető a megfelelő környezet, ha a törvényi megfelelés ezt megköveteli.
Voksoljon bármely környezetre a vállalat, a biztonságos adatkezelés és eszközhasználat érdekében a felügyelet és az üzemeltetés megfelelő feltételeit is meg kell teremtenie. Egységes platformon ez egyszerűbb lehet.
- Az Oracle adatkezelő platformja a hagyományos, relációs világban és a házon belüli adatközpontban éppúgy otthon érzi magát, mint a big data és a gépi tanulás terén, a nyilvános felhőben, fogalmaz Molnár Balázs. - A vállalatoknak így nem kell minden feladathoz más adatplatformot bevezetniük, és ahhoz értő szakembereket alkalmazniuk. Sok esetben az Oracle is hasonló, nyílt forráskódú technológiákra épít, mint a Hadoop vagy a Kafka, de a megoldásokat már válogatott és integrált, "konyhakész" és támogatott szolgáltatásként adja a felhasználóknak, tehermentesítve őket a környezetépítés és -üzemeltetés sok feladata alól. A szervezeteknek az adattudomány házon belüli kompetenciáit kell kiépíteniük, olyan szakemberekre lesz szükségük, akik tisztában vannak az üzlet céljaival, a vállalat folyamataival és a bennük fellelhető adatok jelentőségével, a külső forrásokból beszerezhető adatok értékével, és persze megtanulták az AI/ML működésének alapjait, értik, milyen üzleti célok eléréséhez használható jól ez a technológia. Az ő tevékenységüket segíti jelentősen a most bejelentett Data Science platform is, amely csupán a jéghegy csúcsa. Önmagában is nagyon sok fáradságot tud megtakarítani különösen a mesterséges intelligencia lehetőségeivel most ismerkedő vállalatoknak, de még jobb, ha egy erős és biztos adatkezelő platformra épül.