A ChatGPT megjelenése globálisan a modern AI-korszak születését jelezte. Miután a Microsoft bejelentette, hogy az AI nyelvi modellt integrálja a Bingbe, más vállalatok, például a Google is elkezdte megosztani a technológia körül forgó saját munkáit. Egy maroknyi kínai cégről is jelentették, hogy saját ChatGPT-szerű projekteket kutatnak és fejlesztenek. Ezzel a Microsoft felismerte, hogy csak úgy maradhat a csúcson, ha továbblép és a ChatGPT-t más területeken is alkalmazza, például a robotikában.
A Microsoft Autonomous Systems and Robotics Research Group által megosztott munkában a ChatGPT különböző feladatokat kapott különböző platformok segítségével. A tesztek különböző tervezési elveket is tartalmaztak, beleértve a speciális felszólító struktúrákat, a magas szintű API-kat és az emberi visszajelzést szövegeken keresztül. A csoport arról számolt be, hogy bár a technológiának "még mindig szüksége van némi segítségre", a projekt eredményei bebizonyították, hogy "a ChatGPT önmagában is sok mindenre képes".
"A tervezési elveinket követve a ChatGPT képes kódot generálni robotikai forgatókönyvekhez. Mindenféle finomhangolás nélkül kihasználjuk az LLM (nagy nyelvi modell) tudását, hogy különböző robotok formavilágát különböző feladatokhoz társítsuk" - osztotta meg a csoport.
A projektben végrehajtott egyik teszt során a ChatGPT-t egy drón és a Microsoft AirSim szimulátor irányítására szólították fel. A megosztott videók közül néhányban a ChatGPT képes volt végrehajtani parancsokat az ital keresésétől kezdve az ital azonosításán át a leírás alapján történő azonosításig, és az "egészséges opció" felajánlásáig. Sikeresen követte azt a szöveges parancsot is, hogy szelfit készítsen egy fényvisszaverő felület előtt, és megvizsgáljon egy polcot fűnyírómintát követve. Amikor egy szimulált ipari ellenőrzési forgatókönyvben használták, a kutatók kedvező eredményekről számoltak be a légi akadályelkerülési tesztben, és hozzátették, hogy "képes volt hatékonyan elemezni a felhasználó magas szintű szándékát és a geometriai jeleket, hogy pontosan irányítsa a drónt".
Egy hihetetlenebb forgatókönyv szerint a ChatGPT átment a manipulációs teszten, amikor blokkokat rakott egymásra, és tudásbázisának segítségével létrehozta a Microsoft négyszínű logóját.
"Beszélgetéses visszajelzést használtunk, hogy megtanítsuk a modellt arra, hogyan állítsa össze az eredetileg megadott API-kat összetettebb, magas szintű funkciókká: ezt a ChatGPT saját maga kódolta. ...A modell lenyűgöző példát mutatott a szöveges és a fizikai tartományok áthidalására, amikor a Microsoft logójának fakockákból való megépítésével bízták meg. Nemcsak arra volt képes, hogy felidézze a logót a belső tudásbázisából, hanem arra is, hogy lerajzolja a logót (SVG-kódként), majd a fent tanult készségeket felhasználva kitalálja, hogy a meglévő robotműveletek közül melyekkel lehet összeállítani a fizikai formáját" - magyarázta a csoport.
Bár a projekt eredményei ígéretesnek tűnnek, a Microsoft hangsúlyozta, hogy a munka "csak egy kis töredéke" annak, amit a nagyméretű nyelvi modellek robotokon való alkalmazásával el lehet érni. Emellett a vállalat emlékeztetett arra, hogy a ChatGPT még nem teljesen kész arra, hogy segítse a robotokat a feladatok végrehajtásában, és arra figyelmeztette a rajongókat és más kutatókat, hogy "mindig tegyék meg a szükséges biztonsági óvintézkedéseket" - számolt be az MS Poweruser.