Az IBM még július elején jelentette be a CodeFlare nyílt forráskódú, szerver nélküli keretrendszerét, amelynek célja a nagy adat- és AI-munkafolyamatok integrációjának és hatékony skálázásának egyszerűsítése a hibrid felhőben. A CodeFlare a Ray nevű, a gépi tanulási alkalmazásokhoz kifejlesztett, nyílt forráskódú, elosztott számítási keretrendszerre épül. Az IBM szerint a CodeFlare a Ray képességeit olyan speciális elemekkel bővíti, amelyek megkönnyítik a munkafolyamatok skálázását.
Az adatok és a gépi tanulási analitika szinte minden iparágban elterjedt, a feladatok sokkal összetettebbé válnak az cég szerint. Fontos, hogy nagyobb adathalmazok és több rendszer legyen álljon rendelkezésre az AI-kutatáshoz, mivel ezek a munkafolyamatok egyre bonyolultabbá válnak, a kutatók egyre több időt töltenek a beállítások konfigurálásával, az adattudomány művelése helyett.
Egy gépi tanulási modell létrehozásához ma a kutatóknak és a fejlesztőknek először be kell tanítaniuk és optimalizálniuk a modellt - állítja az IBM. Ez magában foglalhatja az adatok tisztítását, a jellemzők kinyerését és a modell optimalizálását. A CodeFlare célja, hogy ezt a folyamatot egyszerűsítse egy Python-alapú felület segítségével, amelyet az IBM csővezetéknek nevez, megkönnyítve az integrációt, a párhuzamosítást és az adatok megosztását.
A vállalat szerint új keretrendszerének célja, hogy egységesítse a pipeline munkafolyamatokat több platformon anélkül, hogy az adattudósoknak új munkafolyamat-nyelvet kellene megtanulniuk.
A CodeFlare pipeline-ok az IBM új, szerver nélküli platformján, az IBM Cloud Code Engine-en és a Red Hat OpenShift-en futnak. Ez lehetővé teszi a felhasználók számára, hogy a CodeFlare-t szinte bárhol telepítsék, kiterjesztve a szervernélküliség előnyeit az adattudósokra és az AI-kutatókra - közölte a Big Blue. Ez megkönnyíti az integrációt és a hídépítést más felhő-natív ökoszisztémákkal is, mivel adaptereket ad az olyan eseményindítókhoz, mint például egy új fájl érkezése, valamint az adatok betöltéséhez és particionálásához a források széles köréből, például felhőalapú objektumtárolókból, adattavakból és elosztott fájlrendszerekből.
"A CodeFlare túllép az elszigetelt feladatokon, hogy zökkenőmentesen integrálja és skálázza a végponttól végpontig tartó csővezetékeket egy adattudósok számára barátságos felülettel, például Pythonnal a konténerek használata helyett. A CodeFlare egyszerűbb módot adhat a teljes pipelinok integrálására és skálázására, miközben egységes futási időt és programozási felületet kínál" - mondta Priya Nagpurkar, az IBM Research hibrid felhőplatformért felelős igazgatója.
Az eddigi tapasztalatok szerint a technológia hatalmas időmegtakarítást eredményez számos területen, például a gyógyszerkutatásban vagy az elektronika tervezésében. Az IBM egy technikai ismertetőt is közzétesz, a nyílt forráskódú megoldás támogatására.