A Time magazin 2009 októberében arról számolt be, hogy plágiumkereső szoftver segítségével lepleztek le egy több száz éves csalást, s kiderült, hogy a III. Edward uralkodása (The Reign of Edward III.) című drámát a hányatott sorsú, de jelentős drámaíróként számon tartott Thomas Kyd (1558. november 3. – 1594. július 16.) jelentős részben William Shakespeare-től plagizálta. A darab szerzőjének kilétéről – hiszen sok stíluselem az avoni hattyú kezére utalt, míg számos más vonása a mesemondó bárdok hagyományait idézte – jó ideje komoly vita folyt. Volt olyan szakértő is, aki gondos elemzés után a mű előállításában Kyd és Shakespeare együttműködését tételezte fel. Sir Brian Vickers, a University of London irodalomprofesszora a Pl@giarism nevű plágiumkereső program segítségével végül felderítette az idegen tollakat. „Ezzel a módszerrel láthatjuk, ahogy a szerző használja a nyelvet, s alkalmaz bizonyos kifejezéseket és metaforákat, míg másokat elkerül. E jellemzők, mint egy szövet foszlányai kerülnek a kezünkbe. Ha elég van belőlük, akkor azonosítható a szövet például skót tweedként vagy másfajta sima szürke szövetként” – mondta Vickers. A professzor végül megállapította, hogy a III. Edward 60 százalékát Kyd írta, a maradék negyvenet viszont Shakespeare. És az is kiderült Vickers és a Pl@giarism munkája nyomán, hogy négy olyan darabot is Kyd írt, amelyiknek eddig ismeretlen volt a szerzője.
Látható, hogy a plagizálókra évszázadok távolából is rásülhet a csalás bélyege a korszerű technológia használatával. Kyd a maga idején joggal gondolhatta, hogy a nagy kortársától elhappolt gondolatokra, verssorokra, fordulatokra senki sem jön rá, s ha mégis, kit is érdekelne? Ma azonban – bár más szellemi termékének eltulajdonítására a késztetés és vonzalom mit sem csökkent – a kockázat lényegesen nagyobb. A plágiumok terjedése a bukás kockázatának növekedése ellenére is gyorsul, mert az interneten könnyen hozzáférhető forrásanyagok nagyon csábítóak, s alkalom szüli a tolvajt. Az alkalmak száma pedig szinte végtelen a weben.
A plágium sokfelé megjelenik. Az oktatásban, a diákok munkáiban, a tudományos publikációkban, a szépirodalomban, sőt műszaki területen, a szabadalmakban vagy a programkódokban is. De mi is a plágium, és mit is keres egy plágiumdetektáló szoftver?
A Magyar értelmező kéziszótár elintézi annyival, hogy a plágium szellemi alkotás eltulajdonítása. A plagiarism.org meghatározásából kiindulva azonban mások szellemi termékét engedély és a forrás feltüntetése nélkül használni az irodalmi lopás kategóriájába esik. Illetve plágium az is, ha valaki újnak és eredetinek tüntet fel elképzeléseket vagy termékeket, amelyeknek pedig már ismert a forrásuk. A plagizálás ezért a lopás és csalás egy formája.
Lehet-e szavakat és gondolatokat lopni?
A fejlett jogrendekben nyilvánvalóan nem, mégis megteszik! Az eredeti gondolatok szellemi javaknak számítanak, amelyeket a szerzői, a szabadalmi és egy sor más jog véd. Az elképzelések kifejezésének majdnem minden formája „copyrightos” a könyvektől, a zenei partitúrákon és rajzokon át a számítógépes fájlokig, függetlenül a gondolat rögzítésének módjától.
Ezek alapján a következők mind a plágium kategóriájába tartoznak:
– Valaki más munkáját sajátként bemutatni
– Lemásolni más szavait, kifejezéseit vagy gondolatait annak engedélye nélkül
– Idézetet használni annak megjelölése nélkül
– Valótlan információt közölni az idézet származási helyéről
– Átmásolni a mondat szerkezetét, de megváltoztatni a szavakat a forrás engedélye nélkül
– Annyi szót és gondolatot átmásolni egy forrásból, ami már többséget képez az újonnan készülő munkában függetlenül attól, hogy ezt a forrás engedélyezte-e vagy sem.
Miért plagizálnak?
Ha a plágium tulajdonképpen közönséges lopás, miért követi el ezt a vétséget sok olyan ember, akinek eszébe sem jutna akár csak egy skatulya gyufát is fizetés nélkül zsebre tenni? Habár Kyd és Shakespeare példája mutatja, hogy a plágium nem mai találmány, a felgyorsult információáramlás révén a szellemi javakat egyre könnyebb eltulajdonítani, a plagizálásra való csábítás nő, ami a jelenséget igen komoly devianciává növesztette.
A plagizálás egyik legvalószínűbb oka, hogy sokan nem tudják pontosan, mit jelent a szellemi alkotás eltulajdonítása, vagy nem érzik ennek a súlyát. Egy skatulya gyufának megvan a pontos ára, de egy verssornak ugyan mi volna? Bár a plágiumról az elkövetők legtöbbje nyilván már hallott valamit harangozni, de fel sem merül bennük a törvénysértés gondolata, jelentéktelennek vélik a kihágást. Ilyesmi a diákoknál gyakrabban előfordul, ahogy az üzleti életben is, amikor vállalkozások ismert grafikákat, jogdíjas fotókat vagy irodalmi idézeteket használnak például reklámanyagaik vagy prezentációik hatásosságának fokozására.
Sokan pedig azért plagizálnak, mert fogalmuk sincs róla, hogy miképpen kell helyesen idézni. Vagy éppen értelmetlennek és zavarónak látják (például egy reklámszövegben) a szerző nevét, az idézett mű címét közölni. De előfordul, hogy nagyon szorít a határidő, s gyorsabb kész gondolatokból építkezni, mint sajátokon töprengeni. S vannak, akik csak egyszerűen abban bíznak, hogy úgysem kapják el őket. Végül előfordulhat, hogy egyes cselekedetek megítélése idővel változik, aminek például politikusok eshetnek áldozatául, akikkel szemben sokkal érzékenyebben reagál a közösség a korábban elkövetett, de később napvilágra került bűnök esetében is.
Plágiumdetektálás
Az esetek túlnyomó többségében el lehet kerülni a plágiumot a forrás korrekt feltüntetésével. Azaz csak el kell ismerni, hogy az anyag egy része máshonnan származik. A plágiumkereső szoftverek feladata ott kezdődik, ahol ezt az egyszerű kötelességet elmulasztják. Úgy is lehetne mondani, hogy a plágiumkeresés – hajsza az elmaradt forrásmegjelölések után.
A plágiumkeresés folyhat hagyományos „kézi” eszközökkel és számítógépes módszerekkel is. A hagyományos megoldás, ha túl sok dokumentumot kell áttekinteni szinte sziszifuszi munka. Komoly rendszerezettséget, s a kutatást végző személyektől nagy tárgyi ismeretet és kiemelkedő memóriát kíván. Ha pedig az eredeti dokumentum sincs meg az összehasonlításhoz, a feladat a lehetetlen vállalkozások közé sorolódhat. A számítógépes plágiumvadászat az elvégezhető összehasonlítások nagy száma és a folyamat sebessége miatt sokkal több sikerrel kecsegtet.
Számítógépes módszer
A számítógépes plágiumvadászat (vagy angol elnevezése – Computer-assisted plagiarism detection – után CaPD) lényege, hogy a gyanús dokumentumot összehasonlítják olyanokkal, amelyeket eredetinek ismernek el. Az úgynevezett külső összehasonlításkor egy előre meghatározott egyezési kritériumkészlet alapján dolgoznak. Ezzel szűrik át a vizsgálni kívánt szöveget, s a rostán fennakadt részeket kilistázzák.
Az úgynevezett belső vizsgálatkor pedig a referenciákkal való összehasonlítás nélkül csak a szöveg belső összefüggéseit elemzik. Itt azt figyelik, hogy a szöveg egyes részei elütnek-e attól, amit a szerző egyéni stílusaként határoznak meg. Ezek a változások utalhatnak a plágiumra.
Annak eldöntésére, hogy történt-e plagizálás vagy sem, a számítógépes rendszerek nem alkalmasak emberi közreműködés nélkül. A keresőmodellek ugyanis hibásan is jelezhetnek találatokat. Azaz minden esetben szükség van az eredmény emberi értékelésére is.
Az ujjlenyomat modell
Bár számos plágiumkereső modell létezik, a legszélesebb körben használt számítógéppel támogatott plágiumdetektáló megoldás az ujjlenyomat módszer. A folyamat a szövegben lévő úgynevezett n-gramok elemzésén alapul. Az n-gram a nyelvészetben egyszerűen n darab egymást követő szót jelent, de jelenthet n darab egymást követő szótagot vagy szóelemet is. Ezek egy-egy szerző esetében olyan egyedi jellegzetességeket mutatnak, mint az ujjlenyomatok. Ezeket az egyedi mintázatokat ismerik minutiae vagy magyarosan minucia néven, amelyek a biológiában is az ujjlenyomat barázdáinak jellegzetes mintáit jelentik. Azokat a helyeket pedig minuciapontoknak nevezik, ahol a bőr fodorszálai véget érnek, elágaznak, illetve összefutnak. A szövegben is ilyen egyedi jellegzetességeket keres a modell, azaz a szerző ujjlenyomatának jeleit, a minuciákat kutatja. Ennek a megoldásnak az a jelentősége, hogy viszonylag nagy számú és összességében igen kiterjedt szöveget vizsgálhat át. Például e minták után már az interneten is érdemes kutakodni. A találatokat pedig további – például tartalmi – szűrők beiktatásával aztán már sokkal könnyebb finomítani.
A legtöbb plágiumdetektáló rendszer nagy belső adatbázisokat használ, vagy hozzáférése van más forrásokhoz, amelyek igen széles összehasonlítást tesznek lehetővé. A szolgáltatások legnagyobb része ingyenesen használható webes felületeken keresztül. Ilyenek például az Iparadigms, Ithenticate, Turnitin, Plagiarismdetect, Chimpsky, CitePlag, eTBLAST, Plagium, SeeSources, The Plagiarism Checker, Plagiarism Detect, Copyscape, DupliChecker, PlagScan, DocCop, PlagiarismFinder, SafeAssignment, ScanMyEssay, Veriguide stb.
KOPI, a magyar megoldás
A magyar piacon a SZTAKI által fejlesztett KOPI ingyenesen használható plágiumkereső szoftver gyakorlatilag egyeduralkodó. A 2003 óta tartó fejlesztés eredményeként először a zárt rendszer alakult ki, amely az adatbázisába feltöltött forrásanyagot hasonlította össze a vizsgált dokumentumokkal. Tavaly decemberben elindult fordítási plágiumkeresőjük is, az idei év végére pedig már a webes keresőjük is működni fog. Az internetes kereső kissé más lesz, mint a hagyományos zárt rendszer. Ezzel elsősorban az a cél, hogy az internetes publikációk mások általi átvételéről tájékoztassák a jogtulajdonosokat, például az online szerkesztőségeket.
A rendszernek jelenleg 20 ezer felhasználója van, s éves szinten 30 ezer dokumentumot ellenőriznek. Ám Pataki Máté, a KOPI-projekt vezetője szerint a felhasználói szám bővülésére számítanak az internetes plágiumkeresés megindulása után. Bővítheti a KOPI-felhasználók körét, hogy az egyetemek felismerték: fontos, hogy az intézmények berkeiben születő dolgozatok, diplomamunkák, cikkek, tanulmányok, könyvek ne tartalmazzanak plagizált részeket, mert a publikációk minősége egyre fontosabb presztízskérdés az intézmények számára. Jelenleg körülbelül 2000 keresést rögzítenek egy hónapban, de ez szezonálisan változik. A vizsgaidőszakok idején az érdeklődés jellemzően felélénkül. Pillanatnyilag a Wikipédiával való összehasonlításra vonatkozik a legtöbb kérés.
Az akadémiai és oktatási területen viszonylag egyszerűbb a helyzet, de a szabadalomsértéseket már nem olyan könnyű megkeresni, mint a plagizált szövegeket. Pataki Máté szerint a szabadalmak kidolgozására sokkal nagyobb energiát fordítanak. Egy-egy szabadalmat nem pusztán lemásolnak, hanem úgy alakítják át, hogy ne szúrjon szemet, sem a szoftveres keresésnek, se a szabadalmat felülvizsgáló szakértőnek. Itt az emberi tényező szerepe még mindig nagyon fontos marad. De a KOPI arra alkalmas lehet, hogy hasonló szabadalmakat előkeressenek vele.
A szolgáltatásokat úgy is bővítik, hogy a rendszer kap egy olyan programozói felületet (API), amelyen keresztül lehetővé tudják tenni, hogy más szoftverek is használják a KOPI-t. Az első verzió lapállásában nem fogja támogatni a védett keresést, amikor olyan dokumentumok ellenőrzését végzik el, amelyeknek tartalmát csak az arra illetékesek ismerhetik meg, tehát felhatalmazás hiányában még az ellenőrzést végző személyek sem. E funkció kifejlesztésére azonban készen állnak, a munka megkezdése csak a megrendelői igényektől függ.