Hirdetés
. Hirdetés

Elérhetővé teszi az IBM új szuperszámítógépe az AI-alapmodelleket

|

A Vela rendszer valójában már 2022 májusa óta különböző kapacitásokban működik.

Hirdetés

Az alapmodellek megváltoztatják a mesterséges intelligencia (AI) és a gépi tanulás (ML) felhasználásának módját. Mindennek a teljesítménynek azonban ára van, mivel az AI alapmodellek létrehozása erőforrás-igényes feladat.

Az IBM bejelentette, hogy kiépítette saját AI-szuperszámítógépét, amely szó szerint az alapmodell-képzési kutatás-fejlesztési kezdeményezések alapjául szolgál. A Vela nevű rendszert felhő-natív rendszerként tervezték, amely iparági szabványos hardvereket használ, többek között x86-os szilíciumot, Nvidia GPU-kat és ethernet-alapú hálózatot.

Az alapmodell-képzést lehetővé tevő szoftverköteg egy sor nyílt forráskódú technológiát használ, köztük a Kubernetes-t, a PyTorch-ot és a Rayt. Bár az IBM csak most tárta fel hivatalosan a Vela rendszer létezését, az valójában már 2022 májusa óta különböző kapacitásokban online működik.

Tényleg úgy gondoljuk, hogy ez az alapmodellek (foundation model) körüli technológiai koncepciónak hatalmas diszruptív potenciálja van. Ezért részlegként és vállalatként is komolyan befektetünk ebbe a technológiába" - mondta a VentureBeatnek Talia Gershon, az IBM hibrid felhőinfrastruktúra-kutatási igazgatója.

Az IBM számára nem idegen a nagy teljesítményű számítástechnika (HPC) és a szuperszámítógépek világa. A világ egyik leggyorsabb szuperszámítógépe ma az IBM által épített Summit, amelyet jelenleg az Oak Ridge Nemzeti Laboratóriumban telepítenek.

Hirdetés

A Vela azonban nem olyan, mint az IBM által eddig épített többi szuperszámítógépes rendszer. Először is a mesterséges intelligenciára van optimalizálva, és x86-os alaphardvert használ, szemben a HPC-rendszerekben jellemzően egzotikusabb (és drágább) berendezésekkel.

A Summit rendszerrel ellentétben, amely IBM Power processzorral dolgozik, a Vela minden egyes csomópontja egy pár Intel Xeon Scalable processzort kapott. Az IBM Nvidia chipeket is használ: a szuperszámítógép minden egyes csomópontja nyolc darab 80 GB-os A100 GPU-val van felszerelve. Ami a csatlakoztathatóságot illeti, a számítási csomópontok mindegyike több 100 gigabit/másodperc sebességű Ethernet hálózati interfészen keresztül kapcsolódik.

A Vela emellett kifejezetten felhő-natívra épült, vagyis Kubernetes és konténerek futnak rajta, hogy lehetővé tegyék az alkalmazásmunkaterhelést. Pontosabban a Vela a Red Hat OpenShiftre támaszkodik, amely a Red Hat Kubernetes platformja. A Velát emellett optimalizálták a PyTorch futtatására az ML képzéshez, és a Rayt használja a munkaterhelések skálázásának segítésére.

Az IBM egy új munkaterhelés-ütemező rendszert is kiépített az új felhő-natív szuperszámítógépéhez. A cég számos HPC-rendszere esetében már régóta a saját Spectrum LSF (load-sharing facility) rendszerét használja ütemezésre, de az új Vela szuperszámítógépnél a cég új, MCAD (multicluster app dispatcher) nevű ütemezőt fejlesztett ki az alapmodell AI-képzés felhő-natív feladatütemezésének kezelésére.

Mindazt a hardvert és szoftvert, amelyet az IBM a Vela számára állított össze, már az IBM alapmodellekre irányuló erőfeszítéseinek támogatására használják. "Az összes alapmodellünk kutatási és fejlesztési munkái mind felhő-natív módon futnak ezen a vermen a Vela rendszeren és az IBM Cloudon" - mondta Gershon.

Éppen a múlt héten jelentette be az IBM, hogy partnerséget kötött a NASA-val az éghajlati tudományok alapmodelljeinek kialakításában. Az IBM az élettudományok számára egy MoLFormer-XL nevű alapmodellen is dolgozik, amely a jövőben új molekulák létrehozásában segíthet.

Az alapmodell-munka a vállalati informatikára is kiterjed a 2022 októberében bejelentett Project Wisdom nevű erőfeszítéssel. A Project Wisdom a Red Hat Ansible IT-konfigurációs technológia támogatására készül. Az IT-rendszerek konfigurálása általában bonyolult feladat lehet, amelynek megfelelő elvégzéséhez szakterületi ismeretekre van szükség. A Project Wisdom célja, hogy természetes nyelvi felületet hozzon az Ansible-hoz, amelynek segítségével a felhasználók egyszerűen beírják, hogy mit szeretnének, az alapmodell pedig megérti, majd segít végrehajtani a kívánt feladatot.

Gershon utalt egy új, a kiberbiztonságra vonatkozó IBM alapmodellre is, amelyet még nem részleteztek nyilvánosan, és amelyet a Vela szuperszámítógép segítségével fejlesztenek. "Külsőleg nem sokat beszéltünk róla, azt hiszem, szándékosan" - mondta a szakember. "Hiszünk abban, hogy ez a technológia átalakító lesz a fenyegetések felderítése szempontjából" - tette hozzá.

Bár az IBM alapmodellek portfólióját építi ki, nem áll szándékában közvetlenül versenyezni néhány jól ismert általános alapmodellel, például az OpenAI GPT-3-mal. "Mi nem feltétlenül az általános mesterséges intelligencia létrehozására összpontosítunk, míg más szereplők talán inkább ezt tűzik ki célul. Azért érdekelnek minket az alapmodellek, mert úgy gondoljuk, hogy ez óriási üzleti értéket képvisel a vállalati felhasználási esetekben" - mondta Gershon a VentureBeat szerint.

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.computertrends.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.