"Végső soron az MI jövője az elosztott számítástechnikában rejlik" - mondta Ion Stoica, az Anyscale társalapító elnöke a VenureBeatnek. Az elosztott számítástechnika lehetővé teszi, hogy a szoftverrendszerek összetevőit több számítógép között megosszák, és egy rendszerként futtassák, így javítva a hatékonyságot és a teljesítményt. De miközben az elosztott számítástechnikára szükség van, az elosztott alkalmazások írása nehéz, Stoica szerint még nehezebb, mint korábban.
Különösen a mesterséges intelligenciával és az ML-lel kapcsolatos elosztott számítástechnika számos kihívással jár. Az elosztott rendszerek megvalósításának nehézségei igen eltérőek, és a mérnököknek a hálózati és eszközhibák minden aspektusát, valamint a hibákat és azok különböző permutációit is tesztelniük kell.
Ez lehetőséget adott az olyan vállalatok megjelenésére, mint az Anyscale, amely olyan eszközkészletet kínál, amellyel a fejlesztők képesek elosztott alkalmazásokat építeni, telepíteni és kezelni. A vállalatot a Ray, az elosztott MI nyílt forráskódú keretrendszer alkotói alapították, amely egyszerűsíti az MI-munkaterhelések felhőbe történő skálázását. A Ray lehetővé teszi a felhasználók számára, hogy a szekvenciálisan futó Python-kódot minimális kódmódosítással elosztott alkalmazássá alakítsák.
Mint Stoica megjegyezte, az adatkészlettől függően a legkorszerűbb modellek képzéséhez szükséges számítási követelmények nagyságrendekkel tovább nőnek. Például a Google Pathways Language Model (PaLM) - az egyetlen modell, amely nagy hatékonysággal általánosítja a különböző tartományokat és feladatokat - 530 milliárd paramétert tartalmaz. A legnagyobb hordozók némelyike pedig több mint 1 billió paraméterrel fut.
Az ML-alkalmazások igényei és egyetlen processzor vagy szerver képességei között hatalmas szakadék tátong. Stoica rámutatott arra is, hogy amikor az Apache Sparkot kifejlesztették és 2014-ben kiadták, minden gépet homogénnek tekintettek. Ez a feltételezés azonban már nem áll meg, mivel a mai tájkép sokféle hardveres gyorsítót foglal magában.
Egy ML-alkalmazás felépítésének több szakasza van, például címkézés, adatspecifikus képzés, tuning, megerősítő képzés. "Mindegyik szakaszhoz skálázásra van szükség, mindegyikhez jellemzően más-más elosztott rendszer szükséges" - mondta az Anyscale vezetője.
Stoica úgy jellemezte a mesterséges intelligenciát, mint ami lényegében ott tart, ahol 10 évvel ezelőtt a big data volt. Szerinte időbe telik, amíg beérik, mert nemcsak az eszközök fejlesztéséről, hanem a szakértők képzéséről is szó van. Nagyjából öt-hat éve, hogy a főiskolák és egyetemek elkezdtek adattudományi diplomákat adni. Mostanra egyre több mesterséges intelligencia kurzust kínálnak, és egyre több alkalmazott mesterséges intelligencia kurzus fog megjelenni - jósolta. Szerinte ebben a meccsben még csak az első menetben járunk.