A mesterséges intelligencia történetének mérföldkövéhez érkeztünk: először történt meg, hogy egy MI-rendszer hivatalosan is teljesítette a híres Turing-tesztet - azaz olyan meggyőzően tudott viselkedni, mint egy ember, hogy azt a beszélgetőpartnerei nem tudták megkülönböztetni egy valódi embertől.
A Kaliforniai Egyetem (University of California San Diego - UCSD) kutatói nemrégiben publikálták tanulmányukat, amelyben több MI-modellt is alávetettek a klasszikus Turing-tesztnek. A legújabb, GPT-4.5 nevű modell a vizsgálatok során az esetek 73%-ában meggyőzte a beszélgetőpartnereit arról, hogy emberrel beszélnek. Ez magasabb arány, mint maguké az embereké, ami azt jelenti, hogy a teszt során gyakrabban hitték azt a résztvevők a gépről hogy ember, mint a valódi emberről.
A tesztet Alan Turing brit matematikus és kódtörő javasolta még 1950-ben. Lényege, hogy ha egy ember nem tudja eldönteni, hogy egy adott válasz egy másik embertől vagy egy géptől származik-e, akkor a gép átment a teszten - vagyis elérte az emberi intelligencia szintjét egy adott kontextusban.
A UCSD kutatói 126 egyetemi hallgatót és 158 online résztvevőt kértek fel arra, hogy öt perces, online beszélgetéseket folytassanak párhuzamosan egy emberrel és egy MI-rendszerrel - anélkül, hogy tudnák, melyik melyik. Az MI-ket arra utasították, hogy próbáljanak meg emberi személyiséget felvenni.
A vizsgálatban szereplő modellek között volt a GPT-4.5, a GPT-4o, a Meta fejlesztette LLaMa-3.1, valamint egy klasszikus, 1960-as évekbeli program, az ELIZA. Az eredmények szerint:
- GPT-4.5: az esetek 73%-ában hitték róla, hogy ember - ez egyértelmű "Turing-teszt győzelem".
- LLaMa-3.1: 56%-ban választották őt emberként - ez szintén megfelel a teszt követelményeinek.
- GPT-4o és ELIZA: jelentősen alulmaradtak, 21-23%-os eredménnyel.
A siker kulcsa a promptolás
Fontos megjegyezni, hogy az MI-rendszerek leginkább akkor teljesítettek jól, amikor előzetesen pontos utasításokat kaptak arra, hogy emberként viselkedjenek. Amikor ilyen "prompt" nélkül kerültek be a beszélgetésbe, az eredményeik jelentősen visszaestek. Ez azt mutatja, hogy a mesterséges intelligencia teljesítménye erősen függ a megfelelő instrukcióktól.
Cameron Jones, a tanulmány vezető szerzője szerint ettől függetlenül is indokolt kijelenteni, hogy ezek az MI-k teljesítették a Turing-tesztet. "Valójában bármelyiket finomhangolni lehetne úgy, hogy prompt nélkül is megfelelően működjön - tehát a képességük megvan hozzá" - mondta.