Az NVIDIA új architektúrát mutatott be,a mely GPU-nak és CPU-nak is egyaránt alkalmas és a szuperszámítógép piacon is szerepet játszik majd.
GPGPU vajon mi?
Az NVIDIA Fermi architektúrája egy általánosan alkalmazható GPU (General Purpose Graphics Processing Unit - Általános Célú Grafikai Feldolgozó Egység). Ha a koncepció ismerősnek hat, az egyáltalán nem véletlen, az Intel régóta emlegetett Larrabee kódnevű, ős-Pentium magokból felépülő GPU-ját már évek óta emlegetik a szakmán belül. Szemlátomást az NVIDIA is ebbe az irányba mozdul el.
Az NVIDIA vezérigazgatója, Jen-Hsun Huang a cégnek a kaliforniai San Jose-ban tartott technológiai konferenciáján egy grafikus kártya prototípus képében mutatta be az architektúrát. Arról azonban nem hangzott el semmi, hogy a Fermi mikor és milyen formában kerül kereskedelmi forgalomba. Huanghoz a színpadon csatlakozott Jeffrey Nichols az Oak Ridge National Laboratory munkatársa és arról beszélt, hogy laboratórium Fermi chipekből felépülő szuperszámítógépet fog használni olyan tudományos feladatokra, mint éghajlati modellezés. A laboratóriumnak jelenleg Cray XT5 Jaguar szuperszámítógépe van, amely AMD Opteron processzorokra épül.
Paraméterek
Huang ismertetése szerint a Fermi hárommilliárd tranzisztorból épül fel és 512 CUDA processzormagot tartalmaz. (Csak az összehasonlítás végett: az AMD hatmagos Opteron 2400-as processzora 904 millió tranzisztorból áll, az Intel hatmagos Xeon 7400-asa 1,9 milliárdból, a négymagos Core i7 pedig 731 millióból.) Ha a processzor blokkdiagrammjára tekintünk, akkor egy 16 magos processzort látunk. Ezeken a magokon belül található egyenként 16 CUDA mag, ami egy-egy 32 bites ALU-t és FPU-t - egész- és lebegőpontos egységet - tartalmaz. (8 x 4 x 16 = 512) A szörnyetegben egy GigaThread 3.0 nevű technológia menedzseli az egy időben futó párhuzamos feldolgozások ezreit. A Fermi memória sávszélessége a duplája a jelenleg rendelkezésre álló architektúrákénak, melyet GDDR5 DRAM használatával érnek el. A maximális támogatott memóriaméret 1 terabájt. (A Fermi részletes ismertetése innen tölthető le PDF formátumban.)
A Fermi blokkdiagramja
Az architektúra támogatja a dupla-pontosságú lebegőpontos számításokat is, ami az NVIDIA szerint akár nyolcszoros teljesítménynövekedést is jelenthet egyes tudományos és matematikai feladatoknál. Az evidens, hogy a Fermi kompatibilis az NVIDIA CUDA fejlesztőkörnyezetével, de az már sokkal inkább említésre méltó, hogy a cég jelenlegi termékeivel szemben már C++-ban is programozható. Mindezek tetejébe az NVIDIA a Microsofttal közösen azt is bejelentette, hogy NEXUS néven a Visual Studioval integrált fejlesztői környezetet is kifejlesztett. A Fermi a DirectX 11-es API-t és az OpenCL-t is támogatja.
Mikor, miben?
Sajnos a gyártó számos kérdést nyitva hagyott a Fermivel kapcsolatban. Az biztos, hogy a gyártás a TSMC 40 nanométeres technológián alapul majd, de a chip és a memória órajeleiről, fogyasztásáról, illetve a számítási teljesítményről semmit sem tudni.