A Colossus nevű gépezet Musk elmondása szerint a legerőteljesebb rendszer a világon, amit mesterséges intelligencia tréningezésére hoztak létre.
A Colossus (Kolosszus) számítógép neve az 1970-es amerikai tudományos-fantasztikus filmből, a Colossus: The Forbin Projectből, vagy a film alapjául szolgáló 1966-os regényből lehet ismerős, ahol a szigorúan titkos program keretében megépített szuperszámítógép öntudatára ébred és elkezdi egy kicsit máshogy értelmezni eredeti feladatát (a nukleáris arzenál kezelését), mint ahogy tervezője azt korábban elképzelte. Az Elon Musk által tavaly alapított xAI cég nem hárít ugyan saját Colossusára ekkora felelősséget, de a számítógép fontos, sőt központi szerepet játszik a vállalat életében, mivel a mesterséges intelligencia rendszerek tréningezésére hozták létre.
Az xAI-t azzal a céllal indította el Musk, hogy olyan prominens cégek egykori munkatársaival együttműködésben, mint amilyen az OpenAI, a Google Research, a Microsoft Research és a DeepMind, MI-alapú alkalmazásokat fejlesszenek és elősegítsék az univerzum megértését. Első termékük, a Grok egy chatbot, ami szakít a hagyományokkal és a hozzá intézett kérdéseket humorral válaszolja meg, a mindig naprakész információkhoz való azonnali hozzáférést az X (korábban Twitter) platformmal való kapcsolata biztosítja. A chatbot alapját adó Grok-1 LLM-t (nagy nyelvi modell) tavaly nyáron kezdte fejleszteni az xAI és a tesztek alatt a ChatGPT 3.5-nél jobb eredményeket ért el a különféle feladatok megoldásában, többek között 59%-osan teljesítette a 2023-as magyar matematika érettségi feladatait is.
A Colossus többek között az idei év végére ígért Grok-3 tréningezését végzi, mivel az egyre fejlettebb modellek tanítása rendkívüli GPU kapacitást igényel, amit csak a jelentős méretű GPU-klaszterek tudnak kiszolgálni. A Colossus a Nvidia eszközeivel működik, százezer H100 Tensor Core GPU-t tartalmaz és ezzel, az xAI alapítójának elmondása szerint, a legfejlettebb MI tréningrendszer a világon, de néhány hónap alatt megduplázzák a kapacitását ötvenezer H200-as processzor alkalmazásával. A két hete beüzemelt gépet 122 nap alatt készítették el és Memphis városának ipari körzetében lévő létesítményben fejlesztik. A területen számos gyár található, így közel sem ez az egyetlen épület, ami a környék légszennyezéshez hozzájárulhat, de az NPR hírei szerint a helyi közösség a mesterséges intelligencia rendszerek fejlesztése és a szuperszámítógép működtetése miatti nagy energiaigény, valamint az esetleges légszennyezési problémák miatt nem fogadta egyértelmű örömmel az újabb üzem jelenlétét.
A Grok első változatai, köztük az augusztusban megjelent Grok-2 és Grok-2 mini béta verziója az X közösségi oldal használatát segítették elő, de a Colossussal fejlesztett Grok-3 lehetséges, hogy ennél több feladatot is kap és akár a Tesla Optimus robotjának részét is képezheti majd a jövőben.