Mindössze hat éve méri az adattudományt és gépi tanulást támogató DSML-platformok fiatal piacát a Gartner. Idén februárban közzétett, de tavaly novemberi adatokat és megállapításokat tartalmazó legfrissebb értékelése (2020 Magic Quadrant for Data Science and Machine Learning Platforms) szerint a DSML-platformok piaca 2018-ban 19 százalékkal 3,2 milliárd dollárra bővült, a megelőző évben mért 17 százalékos növekedésnél is gyorsabb ütemben, így az analitikai és üzletiintelligencia-szoftverek piacán, közvetlenül a modern BI-platformok után, a második leggyorsabban fejlődő szegmensnek számít.
Több kisebb és fiatalabb szereplő teljesítményét ezen a területen egyenesen a kitartó hipernövekedés jellemzi, tette hozzá az elemző, de a mezőny zsúfoltsága miatt számukra a piaci átlag körüli bővülés egyébként is túl lassú lenne.
Nagy nevek, nyílt forráskód
Mindez a pörgés persze nem könnyíti meg a felhasználók, a DSML-platformot kereső vállalatok dolgát sem, akár az első lépéseket tennék meg az előrejelző és előíró analitika útján, akár fejlett analitikai képességeiket bővítenék tovább. A piacon olyan gyors az egyszerre több irányba mutató mozgás, hogy az erőviszonyokról csupán hamar elévülő pillanatfelvételt készíthet bármely elemzés, hangsúlyozza a Gartner. A vállalatoknak a platformokon megjelenő fejlesztések mellett azt is követniük kell, hogy az új képességeket a felhasználók különböző csoportjai milyen könnyen tudják hasznosítani, azokkal a szállítók milyen támogatást adnak a használati esetek egyre szélesebb köréhez. Az elemző szerint a DSML-platformok piacának alábbi trendjeit érdemes folyamatosan figyelemmel kísérni:
A DSML-platformok felhasználói tábora mind népesebbé és sokszínűbbé válik. Jóllehet továbbra is a szakértő adattudósok alkotják a DSML-platformok elsődleges felhasználói körét, az úgynevezett polgári adattudósok, a laikus üzleti felhasználók gyorsan bővülő tábora ma már közel jár ahhoz, hogy a kereslet és a bevételek gazdagabb forrásává váljon a szállítók számára. Ráadásul a polgári adattudós fogalma is tág, a szerep az üzleti és a BI-elemzőkre éppúgy illik, mint a hagyományos adatelemzőkre és -mérnökökre, vagy akár az alkalmazásfejlesztőkre és -tervezőkre. Az együttműködés és a megosztás támogatása ezért kulcsfontosságúvá válik a DSML-platformokon is.
Mind nagyobb az átfedés és a kölcsönhatás az analitikai és BI-, valamint a DSML-platformok világa között. Az analitikai és BI-szoftverek mind több szállítója bővíti megoldását előjelző és előíró analitikai képességekkel, miközben a DSML-szállítók is egyre robusztusabb adat-átalakító és -vizualizáló funkcionalitással gyarapítják platformjaikat, hogy a szigorú értelemben vett adattudományi háttérrel nem rendelkező felhasználóknak is barátságosabb környezetet teremtsenek.
Bár új szereplők lépnek piacra, a "hagyományos" szállítók továbbra is relevánsak. A DSML-aréna nagy nevei továbbra is új képességeket vonultatnak fel, sok közülük kiforrott termékekkel jelentkezik, frissíti stratégiáját, de partneri együttműködések, felvásárlások útján is fiatalít. Meglévő ügyfeleik így továbbra is értéket nyernek korábbi beruházásaikból, és a már ismert technológiával, eszközökkel folytathatják a munkát.
Legalább olyan élénk ma is a nyílt forráskódú ökoszisztéma és közösség, mint eddig bármikor. A Python az adattudomány és a gépi tanulás uralkodó programnyelve, ám az R-közösség is folyamatosan bővül. Nyílt forráskódú szoftverekkel a szervezetek gyorsan elindíthatják vagy kiterjeszthetik DSML-kezdeményezéseiket, különösebb induló beruházás vagy utólagos ráfordítás nélkül. A nyílt ökoszisztémát emellett a zárt kódú, kereskedelmi platformokat szállító piaci szereplők is támogatják.
ML-modellek és API-k
Algoritmus-építőkockák könnyítik az ML modellek készítését. A szállítók egyre több modellt általánosítanak és csomagolnak előre speciális analitikai problémák megoldásához, így ez a trend tovább erősödik. Az előrecsomagolt modelleket a szereplők mindinkább API-kon keresztül teszik elérhetővé, amelyek megkönnyítik az alkalmazásokkal történő integrációt. Sok felhőszolgáltatás API-ja specifikus problémákra szabott, így a felhasználó vállalatoknak esetenként már egyáltalán nem kell saját modellt építeniük.
Sokkal jobbak az adattudósok az ML-modellek építésében, mint bevezetésükben és üzemeltetésükben. Gyakran megesik ezért, hogy a vállalat végül nem tudja mérni DSML-kezdeményezéseinek üzleti értékét vagy elérni a kitűzött célokat. A DSML-platformok MLOps-képességei ezért túlmennek a puszta bevezetésen, és kiterjednek az éles környezetben működő modellek folyamatos felügyeletére és karbantartására is. Különösen fontos ez a támogatás, mert növeli az értékteremtésre ténylegesen használt modellek számát, ugyanakkor segít elkerülni elévülésüket; a rosszul menedzselt ML-modellek ugyanis a gyorsan változó üzleti körülmények között hamar irrelevánssá vagy pontatlanná válhatnak.
Mágikus négyzetében a Gartner a DSML-platformpiac vezetői között emelte ki az SAS-t, és ebbe a kategóriába sorolt még olyan cégeket, mint többek között a Databricks, a Mathworks és a Tibco. Kihívójuk az IBM lett, az elsősorban jövőbemutató megoldásokban erős, látnokok illusztris csapatát pedig a Microsoft, a Google, a DataRobot, a H2O.ai, a RapidMinder, a Domino és a KNME erősíti, míg az SAP és az Oracle hiányzik a mezőnyből. Mindez azonban az elemzéshez felállított rendkívül részletes kritériumrendszernek tudható be, és - mint minden mágikus négyzet esetében - a Gartner ezúttal is hangsúlyozza, a felállásból nem következik, hogy minden vállalat akkor jár legjobban, ha a vezetők közül választ szállítót.
Sok vállalat ingyenesen elérhető vagy rendkívül kedvező árkonstrukcióban használható nyílt forráskódú eszközökkel, nyilvános felhőszolgáltatásokkal indítja DSML-projektjeit, hogy felmérje a lehetőségeket és bővítse ismereteit. Ha elégedett a kezdeti eredményekkel, akkor kereskedelmi forgalomban kapható szoftvereket is bevezet, hogy a használati esetek szélesebb körét támogathassa, továbblépjen a csapatmunka, az együttműködés támogatásában, és ML-modelljeit éles környezetben is munkára fogja, hosszabb távon is menedzselje és karbantartsa. Bár a vállalatok tisztán nyílt forráskódú szoftverekkel is sikereket érhetnek el az adattudományban, a Gartner szerint a tapasztalt, és az üzletre valóban nagy hatással bíró adattudós-csapatok túlnyomó többsége kereskedelmi forgalomban kapható DSML-platform bevezetésébe is beruház.