Nagyon népszerűvé váltak az elmúlt években azok a nyilvános adatelemzési versenyek, amelyeken különböző cégek teszik elérhetővé saját adataikat, hogy azokban bárki újszerű, érdekes és hasznos összefüggéseket kereshessen. A műfaj egyik legismertebb példája a 2006-ban kiírt Netflix Prize, amelyen a versenyzőknek a videostreaming cég saját ajánlóalgoritmusánál kellett jobbat készíteni. Ehhez a Netflix közzétett egy 100 millió filmértékelésből álló mintaadatbázist, amelynek alapján a pályázók próbálták előre jelezni, hogy a nézőknek melyik film tetszene a leginkább. A verseny iránti érdeklődést fokozta az egymillió dolláros fődíj, amelyet végül a Bellkor csapata nyert. Érdekesség, hogy ezen a megmérettetésen a hazai csapatok is nagyon jól szerepeltek.
Az adatbányászati versenyek kiszolgálására azóta külön infrastruktúra épült, amelynek vezető szereplője a Kaggle.com. Ezen a platformon az elmúlt öt évben 200-nál több versenyt bonyolítottak le, a felhasználók száma pedig túllépte a félmilliót, és számos nagy cég használja toborzási célokra is.
Itthon is megjelentek az első fecskék
A magyar szakemberek sokáig csak versenyzőként vettek részt ezeken a viadalokon, mostanára azonban itthon is megjelentek az első ilyen kezdeményezések mind az adatbányászat, mind az adatvizualizáció területén. A tudományos világban a CEU Data Stories néven rendez évente vizualizációs kiállítást, ahová főleg a kutatási szférából érkeznek a különböző eredményeket megjelenítő alkotások.
Az üzleti szférából vette adatait a SZTAKI közreműködésével tavaly lebonyolított MOL BUBI Challenge, ezen a résztvevőknek a budapesti közbringa-rendszer adataira alapozva kellett két előrejelzési feladatot megoldaniuk. Az elsőnél a legnépszerűbb útvonalakat (állomáspárokat) kellett modellezni, a másodiknál pedig az egyes állomásokon jelentkező keresletet. Mindkét feladatnál egy jó előrejelző modell nagyban megkönnyíti a BUBI üzemeltetését, hiszen folytonos feladat a bicajokat oda vinni, ahol leginkább szükség van rájuk.
Ennek a folyamatnak újabb lépése a Budapest BI Fórum konferencia és az ingatlan.com kooperációjában kiírt vizualizációs verseny, amely a hazai ingatlanpiac dinamikájába enged betekintést.
Ingatlanok az adatok tükrében
A hazai ingatlanpiaccal előbb-utóbb szinte mindenki kapcsolatba kerül, akár vevőként, akár eladóként, akár kiadó lakásra vadászva. Így a versenyhez készült elemzési adatbázis széles körű érdeklődésre tarthat számot. Az adatbázis fő részét az a közel 400 000 hirdetés adja, amely az elmúlt 18 hónapban az ingatlan.com-on megjelent, 70 négyzetméternél kisebb ingatlanok adatait tartalmazza. A jellemzők között megtalálható többek között a hely, a lakás állapota és felszereltsége, valamint a hirdetett ár és a megtekintések száma.
A hirdetési adatbázis alapvetően a kínálati oldalt jeleníti meg, míg a keresletet az ingatlan.com felhasználói által beállított hirdetésfigyelők képezik le. Ebből a 82 000 tételt tartalmazó adatbázisból látható, milyen jellegű ingatlanokat keresnek a legtöbben.
Az adatvizualizációs versenyre a dataviz.hu oldalon lehet jelentkezni. A legjobb pályamunkák bekerülnek az október 27-i, kiállítással egybekötött élő döntőbe. A verseny 100 000 forint értékű fődíját az ingatlan.com ajánlotta fel.