Az Nvidia 26 milliárd dollárt költ nyílt mesterséges intelligencia modellek fejlesztésére

Ez a lépés lehetővé teheti a mesterséges intelligencia infrastruktúra cégóriás számára, hogy gyorsan versenyre keljen az OpenAI-val, az Anthropic-kal és a DeepSeekkel.

Az Nvidia egy 2025-ös pénzügyi bejelentés szerint 26 milliárd dollárt fog költeni nyílt forráskódú mesterséges intelligencia modellek fejlesztésére a következő öt évben. A vezetők a WIRED-nek adott interjúkban megerősítették a hírt.

A jelentős befektetésnek köszönhetően az Nvidia egy lenyűgöző szoftvercsomaggal rendelkező chipgyártóból egy igazi, határokon átívelő laboratóriummá fejlődhet, amely képes versenyre kelni az OpenAI-val és a DeepSeekkel . Ez egy stratégiai lépés, amely tovább erősítheti az Nvidia helyét AI világvezető chipgyártójaként, mivel a modellek a vállalat hardveréhez vannak hangolva.

A nyílt forráskódú modellek olyan modellek, amelyekben a súlyok vagy a modell viselkedését meghatározó paraméterek nyilvánosan elérhetők – néha az architektúra és a betanítás részleteivel együtt. Ez lehetővé teszi bárki számára, hogy letöltse és futtassa a saját gépén vagy a felhőben. Az Nvidia esetében a vállalat a modellek felépítésében és betanításában alkalmazott technikai újításokat is felfedi, megkönnyítve a startupok és a kutatók számára a vállalat innovációinak módosítását és felhasználását.

Szerdán az Nvidia bemutatta a Nemotron 3 Supert, a mai napig legképesebb, nyitott súlyú mesterséges intelligencia modelljét. Az új modell 128 milliárd paraméterrel rendelkezik (a modell méretének és összetettségének mértéke), így nagyjából megegyezik az OpenAI GPT-OSS legnagyobb verziójával, bár a cég azt állítja, hogy több benchmarkban is felülmúlja a GPT-OSS-t és más modelleket.

Konkrétan az Nvidia azt állítja, hogy a Nemotron 3 Super 37 pontot kapott a Mesterséges Intelligencia Indexen, amely 10 különböző benchmark alapján értékeli a modelleket. A GPT-OSS 33 pontot ért el – de számos kínai modell magasabb pontszámot ért el. Az Nvidia szerint a Nemotron 3 Supert titokban tesztelték a PinchBench-en, egy új benchmarkon, amely a modell OpenClaw vezérlésére való képességét méri, és az első helyen áll ezen a teszten.

Az Nvidia számos technikai trükköt is bemutatott, amelyeket a Nemotron 3 betanításához használt. Ezek közé tartoznak az építészeti és betanítási technikák , amelyek javítják a modell érvelési képességeit, hosszú kontextusú kezelését és a megerősítéses tanulásra való reagálóképességet.

„Az Nvidia sokkal komolyabban veszi a nyílt modellfejlesztést” – mondja Bryan Catanzaro, az Nvidia alkalmazott mélytanulási kutatásokért felelős alelnöke. „És sokat haladunk előre.”

Nyílt Határ
A Meta volt az első nagy mesterséges intelligencia fejlesztő cég, amely 2023-ban kiadott egy nyílt modellt , a Llamát. Mark Zuckerberg vezérigazgató azonban nemrég újraindította a vállalat AI-al kapcsolatos erőfeszítéseit, és jelezte, hogy a jövőbeli modellek esetleg nem lesznek teljesen nyíltak. Az OpenAI egy nyílt súlyú modellt, a GPT-oss-t kínálja , de ez gyengébb a vállalat legjobb saját fejlesztésű ajánlatainál, és nem igazán alkalmas a módosításra.

A legjobb amerikai modellek, mint például az OpenAI, az Anthropic és a Google, csak a felhőn vagy egy chatfelületen keresztül érhetők el. Ezzel szemben számos kínai vezető modell, mint például a DeepSeek, az Alibaba, a Moonshot AI, a Z.ai és a MiniMax súlyozása nyilvánosan és ingyenesen elérhető. Ennek eredményeként világszerte számos startup és kutató építkezik jelenleg kínai modellekre.

„A mi érdekünkben áll, hogy segítsük az ökoszisztéma fejlődését” – mondja Catanzaro, aki 2011-ben csatlakozott az Nvidiához, és élen járult a vállalat átállásában a játékokhoz használt grafikus kártyák gyártásáról az AI-hoz használt szilíciumgyártásra. Az Nvidia 2023 novemberében adta ki az első Nemotron modellt. Hozzáteszi, hogy az Nvidia nemrégiben fejezte be egy 550 milliárd paraméteres modell előtanítását. (Az előtanítás hatalmas mennyiségű adat betanítását jelenti egy olyan modellbe, amely számos, párhuzamosan futó, speciális chipen terjed.) Az Nvidia azóta számos olyan modellt adott ki, amelyek kifejezetten olyan területeken való használatra készültek, mint a robotika, az éghajlatmodellezés és a fehérjehajtogatás.

Kari Briski, a vállalati generatív AI-szoftverek alelnöke szerint az Nvidia jövőbeli AI-modelljei nemcsak a chipek, hanem az általuk épített szuperszámítógép-méretű adatközpontok fejlesztésében is segítenek a vállalatnak. „Azért építjük őket, hogy kiterjesszük rendszereinket, és ne csak a számítási, hanem a tárolási és hálózatépítési kapacitást is teszteljük, és hogy valahogy kidolgozzuk a hardverarchitektúra ütemtervét” – mondja.

A modellek nyílt kiadása hosszú távú stratégiai előnyökkel is járhat az Nvidia számára. A vállalat chipjei továbbra is az aranystandardnak számítanak a nagyméretű AI-modellek betanításában, az ügyfelek milliárdokat költenek a vállalat hardvereinek beszerzésére adatközpontjaik számára. A kínai nyílt modellek térnyerése azonban valamikor alááshatja az Nvidia pozícióját, ha ezek a modellek drámai javulást mutatnának a versenytársak hardvereihez képest.

2025 januárjában a DeepSeek kiadott egy élvonalbeli, nyílt modellt, amely egy hatékonyabb megközelítést alkalmazott, ami sokkal olcsóbbá tette a képzést. De számos más kínai modell is népszerűvé vált Nyugaton, olyan nagyvállalatoktól, mint az Alibaba, valamint olyan startupoktól, mint a Moonshot AI , a Z.ai és a MiniMax . Az Alibaba Qwen modelljét , amely könnyen használható és módosítható, valamint jól karbantartható, széles körben használják kutatók és startupok .

Egy új DeepSeek modell, amely várhatóan hamarosan megjelenik, a pletykák szerint kizárólag a kínai Huawei vállalat által gyártott chipeken tanították, amely vállalat amerikai kormányzati szankciók hatálya alatt áll. Ha ez igaz, a megjelenés több startupot és kutatót is arra ösztönözhet, hogy kipróbálják a Huawei hardvereit, különösen Kínában.

Ebben a tekintetben az Nvidia segíthet alakítani az Egyesült Államok és Kína közötti mesterséges intelligencia versenyt azáltal, hogy amerikai gyártmányú alternatívát kínál a kínai nyitott súlyú modellekhez képest.

„Amerikai vállalat vagyunk, de világszerte együttműködünk vállalatokkal” – mondja Catanzaro. „Érdekünkben áll, hogy az ökoszisztéma mindenhol változatos és erős legyen.”

Néhány iparági szakértő arra figyelmeztetett, hogy a nyílt innováció világ másik felére való átterelése hosszú távon rosszat tehet az Egyesült Államoknak.

„Óriási Nemotron-rajongó vagyok” – mondja Nathan Lambert, az Allen Institute for AI (Ai2) mesterséges intelligencia kutatója, aki az ATOM (American Truly Open Models) projektet vezeti. Lambert hozzáteszi, hogy az Egyesült Államok kormányának is finanszíroznia kellene a nyílt modelleket.

Andy Konwinski, a mesterséges intelligencia nyitottságának előmozdítására összpontosító Laude Intézet informatikus és vállalkozó szerint az Nvidia befektetése rendkívül jelentős, mivel a vállalat AI kutatásának középpontjában áll. „Számos nyílt és zárt mesterséges intelligencia-fejlesztés élén állnak” – mondja Konwinski. „Ez példa nélküli jele a nyitottságba vetett hitüknek.”

Tovább a cikkre: wired.com (Will Knight)

Post Views: 157

Related Posts