Hirdetés
. Hirdetés

Egy évszázados differenciálási probléma megoldásával kitágult az út az MI számítások előtt

|

A matematikusok 1907 óta nem tudtak ezzel mit kezdeni.

Hirdetés

Tavaly az MIT kifejlesztett egy olyan MI/ML algoritmust, amely képes tanulni és alkalmazkodni az új információkhoz munka közben, nem csak a kezdeti képzési fázisban. Ez pedig komoly előrelépést hozhat a mesterséges intelligencia fejlődésében, ha megoldódik az ehhez szükséges adatátvitel.

Ezek a "folyékony" neurális hálózatok szó szerint 4D-sakkot játszanak - modelljeik működéséhez idősoros adatokra van szükségük -, ami ideálissá teszi őket az olyan időérzékeny feladatokban való felhasználásra, mint a pacemaker monitorozása, az időjárás-előrejelzés, a befektetési előrejelzés vagy az autonóm járműirányítás. A probléma azonban az, hogy az adatátvitel szűk keresztmetszet lett, és e rendszerek skálázása számítási szempontból megfizethetetlenül drágává vált.

Az MIT kutatói bejelentették, hogy megoldást találtak e korlát lebontására egy olyan differenciálegyenlet megoldásával, amellyel a matematikusok 1907 óta nem tudtak mit kezdeni. Konkrétan megoldották, hogy "a két neuron szinapszisokon keresztüli kölcsönhatása mögött álló differenciálegyenletet... új típusú, gyors és hatékony mesterséges intelligencia algoritmusokat szabadítson fel".

Hirdetés

"Az új gépi tanulási modellek, amelyeket CfC-nek (closed-form Continuous-time) nevezünk, a neuron számítását meghatározó differenciálegyenletet egy zárt formájú közelítéssel helyettesítik, megőrizve a folyékony hálózatok gyönyörű tulajdonságait, numerikus integráció nélkül. A CfC-modellek ok-okozatiak, kompaktak, magyarázhatóak, hatékonyan képezhetőek és előrejelezhetőek. Megnyitják az utat a megbízható gépi tanulás előtt a biztonságkritikus alkalmazások számára" - írta Daniela Rus, az MIT professzora az egyetem közleményben.

Ez magyarul azt jelenti, hogy a differenciálegyenletek olyan formulák, amelyek egy rendszer állapotát írhatják le a folyamat különböző diszkrét pontjain vagy lépéseiben. Például, ha van egy robotkarunk, amely A pontból B pontba mozog, akkor egy differenciálegyenlet segítségével megtudhatjuk, hogy a folyamat bármelyik adott lépésénél hol van a két pont között a térben. Ezeknek az egyenleteknek a megoldása azonban minden egyes lépésnél gyorsan számítási költségessé válik. Az MIT "zárt formátumú" megoldása ezt a problémát úgy kerüli meg, hogy egyetlen számítási lépésben funkcionálisan modellezi a rendszer teljes leírását - írja az Engdget.

Az MIT csapata ezt a következőképpen magyarázza: "Képzeljük el, hogy van egy végponttól végpontig működő neurális hálózatunk, amely egy autóra szerelt kamerától kapja a vezetési inputot. A hálózatot úgy képezzük ki, hogy kimeneteket generáljon, például az autó kormányszögét. 2020-ban a csapat ezt úgy oldotta meg, hogy 19 csomópontot tartalmazó folyékony neurális hálózatokat használt, így 19 neuron plusz egy kis érzékelési modul képes vezetni egy autót. E rendszer minden egyes csomópontját egy differenciálegyenlet írja le. Ha zárt formátumú megoldással dolgoznánk ezen a hálózaton belül, akkor az megadná a pontos viselkedést, mivel ez egy jó közelítése a rendszer tényleges dinamikájának. Így kevesebb neuronszámmal is megoldható a feladat, ami azt jelenti, hogy gyorsabb lenne és kevésbé számításigényes."

Az egyenlet neuron-szintű megoldásával a csapat abban bízik, hogy képesek lesznek az emberi agy olyan modelljeit megalkotni, amelyek az idegkapcsolatok millióiban mérnek, ami ma még nem lehetséges. A csapat azt is megjegyzi, hogy ez a CfC modell képes lehet arra, hogy az egyik környezetben megtanult vizuális tréninget további munka nélkül egy teljesen új szituációban is alkalmazza, ezt nevezik out-of-distribution generalizációnak (elosztáson kívüli általánosításnak). Erre a jelenlegi generációs modellek nem igazán képesek, és ez jelentős lépés lenne a jövő általánosított mesterséges intelligencia rendszerei felé.

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.computertrends.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.