Komoly előnyöket kínál az információbiztonsági szakma számára a gépi tanulás, amely definíciója szerint a számítógépek képessége a tanulásra erre való kifejezett programozás nélkül. Ez a terjedőben lévő technológia segítheti a biztonsági elemzőket a rosszindulatú programok és a naplófájlok analizálásában, lehetővé téve a sebezhetőségek minden eddiginél korábbi azonosítását és megszüntetését. Javíthatja továbbá a végpont-biztonságot, automatizálhatja az ismétlődő feladatok végrehajtását és megakadályozhatja az adatlopással járó támadásokat. A probléma az, hogy a kiberbűnözők ugyancsak jó hasznát vehetik a mesterséges intelligenciának és a gépi tanulásnak, melyek segítségével hatékony támadások indítására alkalmas eszközöket készíthetnek.
A gépi tanulás egyik leginkább kézenfekvő rosszindulatú alkalmazása olyan szöveget beszéddé alakító, beszédfelismerő és természetes nyelvű feldolgozási algoritmusok használata, amelyek hatékonyabbá teszik a hackerek fontos fegyvereit, a pszichológiai trükköket. Neurális hálózatok felhasználásával ezek a szoftverek megtaníthatók különféle írási stílusokra, melynek eredményeképpen rafináltabb és hihetőbb adathalász levelek készíthetők, továbbá a gépi tanulás réven automatizálható a komoly beosztású célszemélyeknek szánt célzott adathalász e-mailek elkészítése és kiküldése. Számítógépes rendszerek ugyanis megtaníthatók eredetinek és vonzó tartalmúnak tűnő elektronikus levelek írására.
A McAfee Labs 2017-es kiberbiztonsági előrejelzésében azt olvashatjuk, hogy a kiberbűnözők egyre kiterjedtebben használják majd a gépi tanulást a nagy mennyiségű lopott adatrekord elemzésére annak érdekében, hogy potenciális áldozatokat kutassanak fel és olyan hihető tartalmú adathalász leveleket tudjanak létrehozni, amelyekkel hatékonyan át tudják verni ezeket a célszemélyeket.
Mi több, a Black Hat USA 2016 konferencián John Seymour és Philip Tully egy olyan neurális hálózatot prezentált, amely képes megtanulni adathalász üzenetek tweetelését a potenciális áldozatoknak. Az üzenetek tartalmát az intelligens hálózat a célszemélyek által a közösségi weboldalakon közzétett nyilvános bejegyzések alapján állítja össze.
A biztonsági szakértők által bemutatott rendszer rendkívül hatékonynak bizonyult: a 90 felhasználót tartalmazó teszt során a sikeres támadások aránya 30 és 60 százzlék között mozgott, ami hatalmas mértékű előrelépést jelent a manuálisan végrehajtott célzott adathalász támadásokhoz képest.