A korábbi években az S&T SAP csapata az üzleti folyamatok optimalizációjára és automatizálására fókuszált. Ezek mellé emelte be a cég következő stratégiai fókuszként az SAP Cloud platformra épülő big data- és machine learning-megoldásokat. Számos területen értek el már ma is eredményeket, de a jövő lehetőségeit még csak most, az első projektek után kezdik látni ügyfeleikkel. Török György adattudós szakértővel, az S&T Hungary SAP üzletágvezetőjével beszélgettünk.
Computerworld: Mindenekelőtt tisztázzuk a big data és a machine learning fogalmát és azt, hogyan kapcsolódnak egymáshoz!
Török György: Kezdjük a big datával! Mára már olyan olcsó adatot tárolni, hogy inkább összegyűjtünk és elmentünk mindent. A big data lényege, hogy láthatóvá és érthetővé váljanak az ezeken a hatalmas adathalmazokon belüli összefüggések, amelyeket egészen a közelmúltig nehéz volt pontosan megragadni, mert az adatok nem homogének; a big szócska a különféle adatok sokaságára vonatkozik. A régebbi technológiákkal ezeket a nagyon változatos szerkezetű adatbázisokat nem lehetett feldolgozni, de az új technológiákkal, mint a Hadoop, a Spark és immár az SAP Cloud Platform bigdata-megoldásaival viszont feldolgozhatókká váltak.
Török György SAP üzletágvezető, S&T Consulting Hungary
Folytassuk a machine learninggel! A gépi tanulás lehetővé teszi a számítógépek számára a tanulást anélkül, hogy explicit módon erre beprogramozták volna őket. Hogyan történik ez? A rendszer példaadatok, minták alapján képes önállóan vagy emberi segítséggel szabályszerűségeket/szabályokat felismerni/meghatározni. A rendszer tehát nem csupán betanulja "kívülről" a mintákat, hanem képes ezek alapján olyan általánosításra, ami alapján - a tanulási szakasz végeztével - ismeretlen adatokra vonatkozólag is "helyes" döntéseket tud hozni. Az egésznek a célja a precíz jóslás, divatos kifejezéssel a prediktív analízis. Minél több adatból tud dolgozni tanuló algoritmusunk, annál pontosabb következtetéseket kapunk eredményül.
CW: Mely vállalatok értek el eddig kiemelt eredményeket gépi tanulással?
TGy: Ott vannak kiemelkedő eredmények, ahol nagyon sok adat áll rendelkezésre, illetve azon vállalatoknál, amelyek ezeket az adatokat hamar és hatalmas mennyiségben kezdték gyűjteni. Néhányan az élenjárók közül: Google (keresési motorok), Apple, Microsoft (Siri, Cortana), Facebook (hírfolyam, hirdetések), Waze, Uber (közlekedésoptimalizálás), Amazon, Netflix, Spotify (termékajánlás), Google, Tesla (önvezető autók). Az egészségügyben szintén hatalmas előrehaladást hozott az ML-algoritmusok használata.
CW: Az SAP mely területeken alkalmazza a gépi tanulást?
TGy: Mivel az Ipar 4.0 kiemelt terület az S&T Hungary stratégiájában, ezért a gyártás volt az első, ahol az ML-t tanulmányoztuk. Az ipar 4.0 világában a gyártósorok rengeteg adatot állítanak elő mind a gyártásra, mind a gépek állapotára vonatkozóan. A machine learning segíthet a gyártósorok leállásának megelőzésében és a gyártás minőségének javításában.
A közműszektorban a vevőiviselkedés-elemzés hozta a legfontosabb eredményeket. A lojalitás, a fizetési hajlandóság és a szaporodó csalási esetek analízise a fő fókusz, akárcsak a banki, biztosítói és telco szektorokban. Ezekben az iparágakban nagy előrelépésre számítok még az ML-alapokon működő "robot ügyfélszolgálatok" elterjedésével.
Természetesen az SAP-nak is van megoldása a retail fő kihívásaira mind a termékajánlás, mind a marketing területén.
CW: Mik az összetevői az SAP Machine Learning megoldásának?
TGy: Az első tényező a HANA adatbázisra épített SAP Cloud Platform. Ez egy olyan technológia, amely képes szinte tetszőleges méretű big data adatbázisok gyors és hatékony kezelésére. A második tényező, hogy az elmúlt 30-40 év üzleti tapasztalatára építve sikerült ez előző kérdésben részletezett területeken olyan ML-algoritmusokat implementálni, amelyek használata komoly üzleti előnyt jelentett az algoritmusokat használó vállalatoknak.
A harmadik tényező már az ügyfeleken múlik. Mind az SAP ERP-, mind az SAP CRM-rendszerekben olyan mennyiségű adat gyűlt össze az elmúlt években, amelyek komoly alapjai lehetnek a Machine Learning algoritmusoknak.
CW: Min múlik a big datára épülő ML-projektek sikere?
TGy: Az első és talán a legfontosabb az adat. Minél több, annál jobb. Még az sem probléma, ha a mennyiség részben a minőség rovására megy.
Talán meglepő, hogy ezt emelem ki másodiknak, de jó kérdést, kérdéseket kell feltennünk.
És nem utolsósorban a megfelelő data science szakértők (adattudósok) - igen, ez egy külön szakma - bevonása a projektbe.