A több százmillió felhasználóval rendelkező web2.0 szolgáltatások és egyéb, világhálón zajló tranzakciók rövid idő alatt is az ember számára már felfoghatatlan információmennyiséget generálnak. A tavalyi év eredményei szerint az internetes oldalakról, e-mailekből, videómegosztó portálokról és más forrásokból származó adatok mennyisége csaknem ötszáz milliárd gigabájtra rúgott. Ennek hasznosítása ugyanakkor vállalati növekedést eredményezhet, banki csalásokat fedhet fel, illetve bűnözői kapcsolathálózatok leleplezésére is szolgálhat. A lehetőség tehát hatalmas, technológiailag azonban egyik sem könnyű feladat. Az adatbányászati szoftverek mára olyan magas szintet értek el, amellyel képesek a mélyen megbúvó, egészen összetett információk, kapcsolatok és jövőbeli trendek kimutatására is. A banki csalások és a pénzmosások feltárásán túl ezért hatékonyan alkalmazhatóak többek között üzletfejlesztési és marketing célokra. Az úgynevezett társadalmihálózat-elemzések (social-network analysis) segítségével az e-mail népszerűségét leköröző online közösségeken, például az IWIW-en, a Facebookon, a Twitteren, valamint a blogokon és a fórumokon viselkedési minták egész sora, illetve kapcsolathálók azonosíthatók be. Ezek az információk nyilvánosak és bárki által elérhetők, az itt zajló véleménycserék pedig az egyénszintű összefüggéseken túl tükrözik a fogyasztók szokásait, érzéseit, termékhez való viszonyukat is. A publikus online megnyilvánulások tehát segítenek megtalálni a rejtett vásárlói igényeket, így a vevők jobb megismeréséhez vezetnek. Ez pedig sok vállalat számára komoly értéket képvisel. Elég lehet a konkrét személyekhez nem kötődő termékértékeléseket vagy hozzászólásokat megvizsgálni ahhoz, hogy a marketingesek kulcsfontosságú információkra tegyenek szert például egy szolgáltatás elvárt fejlesztési irányairól. „A szövegbányászatra és a természetes nyelvfeldolgozásra épülő üzleti analitikai megoldások könnyebbé teszik a véleményvezérek és a hozzájuk kapcsolódó közösségek elérését, ugyanakkor az érzékeny szoftver képes a termékről írt pozitív, negatív és a vegyes állítások szövegbeli kiértékelésére is.” – fogalmazott Musza István, a nemrég piacra dobott Social Network Analysis szoftvert szállító SAS magyarországi cégvezetője, majd hozzátette: „Azoknak a szervezeteknek, melyek képesek a világhálón rendelkezésre álló adatok kiaknázására, biztosított a túlélés és a piaci növekedés.” Az interneten megbújó adatok elemzése azonban nemcsak a vállalatok, de a nemzetbiztonsági, rendfenntartási szervek számára is rejtett kapcsolatrendszereket fednek fel. Egy-egy gyanús egyén azonosítása után ugyanis szükségessé válik, hogy a nyomozók gyorsan és pontosan felderítsék annak hálózatát is. Az Egyesült Államokban 2001 óta fokozottabban alkalmaznak adatbányászai technológiákat a terrorcsoportok leleplezésére, de a terrorizmus globális jellege miatt más országokban is szükségessé válhat mielőbbi alkalmazásuk. Musza István véleménye szerint a jövőben az analitikus szoftverek segítségével lehetővé válhat a potenciális elkövetők teljes profiljának meghatározása, így a gyanús személyek gyorsabb felderítése.
Leleplező adatbányászat
Kincset érő adatok rejlenek a közösségi oldalak mélyén.