A mesterséges intelligencia és a programozás összege egyenlő a nyereséggel? - tette fel a kérdést nyitó előadásában Arató Bence, a BI Consulting ügyvezető igazgatója a Budapest Data+ML Fórum negyedik napján. A tanácsadó cég idén júniusban a két konferencia történetében először kettő az egyben eseményt szervezett, és a keynote prezentáció témaválasztása is az adattechnológiai területek között tapasztalható összefonódásra utal, amelyet a mesterséges intelligencia gyors fejlődése húz egyre szorosabbra.
Vezető technológiai szállítók egymást érő bejelentései mellett a rohamtempót érzékelteti a világ egyik legnagyobb startup-gyorsító vállalatának számító, amerikai Y Combinator W23-as, azaz idei téli áttekintése is a generatív AI technológiákat fejlesztő, induló cégekről, amelyben egyedül mérnöki - közöttük szoftverfejlesztési - területeken mintegy 30 cég szerepel, üzleti területeken pedig még ennél is jóval több.
Az Omniscien Technologies idén januárban közreadott elemzésében az alapmodellektől kezdve a természetes nyelvi feldolgozáson át a dokumentum-kivonatolásig szintén vagy három tucat AI technológia szerepel az érettségi görbe különböző szakaszaiban. Egy részük 2-5, többségük 5-10 éven belül érheti el a széles körű, gyakorlati alkalmazást - a termelékenység fennsíkját -, és közéjük tartozik a ma még a kezdeti, innovációs emelkedőn felfelé kapaszkodó kódgenerálás is, emelte ki előadásában Arató Bence.
Kódasszisztensek menetelése
A GitHub Copilot, a fejlesztők munkáját automatikus kódkiegészítéssel segítő mesterséges intelligencia 2021 júniusában debütált. Az előfizetéses modellben működő, felhőalapú Copilot az OpenAI GPT-3 nyelvi modelljére - annak egy speciális verziójára, a Codexre - épül, amelyet a Microsoft, a GitHub anyavállalata licencel.
A GitHub tavaly őszi felmérése szerint a fejlesztők rendkívül elégedettek a Copilot közreműködésével. Túlnyomó többségük (88 százalékuk) mondta, hogy a kódgeneráló digitális asszisztens támogatásával hatékonyabban tud dolgozni, és szinte mindegyikük (96 százalékuk) kiemelte, hogy az ismétlődő feladatokkal különösen gyorsan végez, mintegy háromnegyedük (77-73 százalékuk) pedig megerősítette, hogy a kevesebb keresésnek köszönhetően jobban elmélyedhet a munkában.
Érthető, hogy az első fecskét hamarosan újabb kódasszisztensek követték - mint például a tavaly nyáron bejelentett és idén áprilistól általánosan elérhető Amazon CodeWhisperer, valamint testvére, a CodeGuru. Utóbbit a fejlesztők meglévő munkafolyamataikban is használhatják a szoftverkód minőségének automatikus ellenőrzésére, kapott javaslatok alapján történő javítására, valamint a készülő alkalmazás teljesítményének és költségének optimalizálására. A Huggingface idén májusban jelentette be StarCoder és StarCoderBase kódíró nagy nyelvi modelljeit (LLM), míg a CodeComplete programozó AI asszisztensét - amely jelenleg zártkörű béta változatban próbálható ki - a vállalatok a fokozott biztonság érdekében saját felhőjükben vagy helyi adatközpontjukban vezethetik be, és képességeit szintén saját kódbázisukon finomhangolhatják.
Sorra jelennek meg az egy-egy fejlesztői feladat automatizálására szolgáló digitális asszisztensek is. A CodiumAI például teszteket generál, a Buildt pedig a nagy kódbázisok gyors keresését és megértését segíti - így különösen hasznos támogatást ad az újonnan belépő fejlesztőknek a munka felvételéhez. Hasonló célt szolgál a Bloop is, amely természetes nyelven megfogalmazott kérdésekre emberi nyelven összefoglalja és elmagyarázza a szoftverkód működését, ezáltal a megértésen túl segíti a kiértékelést és a további tervezést is. A Grit másodpilótája a kódmigrációt és a függőségek frissítését automatizálja, míg a Google DIDACT kutatási projektjében újszerű módszerrel a kész kód helyett a szoftverfejlesztés folyamatán tanítja masszív AI modelljét a szoftvermérnöki munka intelligens támogatásához.
Minden AI támogatás és automatizálás mellett sem dőlhetnek hátra azonban a fejlesztők, többek között azért sem, mert az asszisztensek használatán túl újabb programozási nyelvekkel, interfészekkel, környezetekkel és módszerekkel kell megismerkedniük.
A Pandas AI például egy Python-könyvtár, amely generatív mesterséges intelligencia képességekkel egészíti ki a Pandast, a népszerű adatelemző és -manipulációs eszközt, amelyet nem vált ki, azzal együtt használható. A JupyterLab kiegészítéseként elérhető Jupyter AI segítségével pedig a fejlesztők a generatív mesterséges intelligencia modellek lehetőségeit aknázhatják ki a notebookokban felhasználóbarát, hatékony módon, így növelhetik a JupyterLab, illetve a Jupyter Notebook termelékenységét.
Természetes nyelvi feldolgozással segítik az adatkutatók munkáját az olyan integrált, kollaboratív data science notebookok is, mint a ChatGPT bővítménnyel gyarapodó Noteable, és a nyilvános béta változatban elérhető Hex Magic. A Mito AI pedig - amelyet a nagy pénzügyi intézetek például már világszerte használnak - chatbotjával és táblázatkezelőjével Python kódot generál az Excel jelentések és az adatelemzések automatizálásához.
Az új programnyelvek között az LMQL a természetes nyelven adott utasítások előnyeit a Python kifejező erejével ötvözi, hogy hatékonyabbá tegye az LLM-ekkel végzett munkát, míg a Mojo programozási nyelv a Python használhatóságát kombinálja a C nyelv teljesítményével minden AI fejlesztő számára.
Mint kiderült, maga a ChatGPT is utasítható arra, hogy adatbázis-kiszolgálónak képzelje magát, és Microsoft SQL Serverként a parancsokra információk és leírások helyett a lekérdezések eredményével válaszoljon. Izgalmasabb azonban ennél, hogy a nyilvános felhőben elérhető LLM-eket használó fejlesztők érzékeny szoftverkódot vihetnek a vállalati hálózaton kívülre, és ezzel alááshatják a biztonságot. A problémára a GitHubon elérhető, nyílt forráskódú DB-GPT kísérleti projekt kínál megoldást olyan lokalizált nagy nyelvi modellekkel, amelyeket a vállalatok száz százalékban saját, biztonságos adat- és informatikai környezetükön belül használhatnak.
A biztonságot növeli az Atlan AI másodpilótája is, amely az adatirányításban segíti az érintett vállalati csapatok együttműködését és a dokumentációk maradéktalan elkészítését, míg a Lume mesterséges intelligenciája az adatsémák automatikus átalakításával egyszerűsíti az adatintegrációt. A spektrum másik végén pedig a Stemma AI Discover Assistant adatfeltáró képességeivel az üzleti felhasználók számára teszi könnyebbé a trendek megértését, legyen szó a bevétel ingadozásáról, az ügyfelek megtartásáról vagy a szolgáltatásoptimalizálás lehetőségeiről bármely iparágban.
Fókuszban a biztonság
Arató Bence a Budapest Data+ML Fórum 2023 zárónapján egy további előadásban a mesterséges intelligencia területét jelenleg meghatározó trendekről is rövid áttekintést adott. Az általa idézett egyik szállítói jelentés (Scale 2023 AI Readiness Report) szerint a generatív modellek tavaly tapasztalt, jelentős fejlődése rendkívüli mértékben hatott a vállalatok AI stratégiájára is. A Scale ügyfeleinek 65 százaléka mondta, hogy a trend következtében felgyorsította meglévő stratégiájának megvalósítását, vagy első ízben ilyen fejlesztési tervet dolgozott ki. De míg a válaszadók 60 százaléka kísérletezik generatív modellekkel - vagy a következő 12 hónapban erre készül -, addig csupán ötödük (21 százalékuk) használ már jelenleg is ilyen modelleket éles környezetben.
Mindinkább fókuszba kerül a biztonság a vezető AI laboratóriumokban, amelyekben egy év alatt több mint háromszorosára emelkedett a területen dolgozó kutatók száma, állapította meg a befektetői oldalon készülő State of AI Report 2022-es kiadása. A jelentés rámutat arra is, hogy a kínai kutatóközpontok 2010 óta négy és félszer annyi tudományos munkát adtak ki, mint a hasonló amerikai, indiai, angliai és német intézmények együttvéve. Kína ráadásul olyan kutatási területeken vezet, mint a videómegfigyelés, a tárgyészlelés, a helyzetértelmezés és az önvezérlés, ami nemcsak a biztonságra, hanem a geopolitikai viszonyokra is hatással lehet.
A Stanford Egyetem éves jelentésében (2023 AI Index) sok más trend - például az akadémiai szektor versenyszféra mögötti lemaradása - mellett szintén a biztonsági kockázatokra hívja fel a figyelmet. Idézi többek között az IPSOS tavalyi felmérésének eredményét, amely szerint éppen a kínai polgárok körében a legmagasabb azok aránya (78 százalék), akik pozitívan vélekednek az AI termékekről és szolgáltatásokról, míg az Egyesült Államokban a megkérdezettek csupán 35 százaléka mondta, hogy a technológia előnyei nagyobbak, mint a hátrányai. Az egyetem 127 ország törvényalkotási gyakorlatát vizsgálva azt is megállapította, hogy a mesterséges intelligenciát említő törvények száma 2016 óta egyről 37-re emelkedett, és a technológia már 81 ország parlamentjében került napirendre. Tekintettel az Európai Unió készülő AI törvényére - amelytől sokan a GDPR-hoz hasonló hatást várnak -, ezek a számok a közeljövőben jelentősen növekedhetnek.
Idén februárban a Forbes magazinnak adott interjúban Bill Gates az AI elmúlt 12 hónapját ugyanolyan fontos mérföldkőnek nevezete a digitális technológia történetében, mint a PC, a grafikus kezelőfelület és az internet megjelenését.
Ne feledjük azonban, mit írt Sam Altman az OpenAI vezérigazgatója két hónappal korábbi Twitter-bejegyzésében: a ChatGPT hihetetlenül korlátozott, de bizonyos dolgokban mégis elég jó ahhoz, hogy félrevezető módon a nagyszerűség benyomását keltse. Most még hiba lenne rá támaszkodni bármilyen fontos kérdésben. A fejlődés irányát mutatja; megbízhatóságán és igazmondásán rengeteget kell még dolgoznunk.