A technológiai óriások dollármilliárdokat költöttek arra a feltevésre, hogy a mesterséges intelligencia területén a nagyobb a jobb. A DeepSeek áttörése azt mutatja, hogy a kisebb is lehet ugyanolyan jó.
A kínai vállalatnak a mesterséges intelligenciát fejlesztő cégek élvonalába való berobbanása heves vitákat váltott ki a Szilícium-völgyben a DeepSeek által alkalmazott úgynevezett desztillációról, amelynek során egy új rendszer több százezer kérdés feltevésével és a válaszok elemzésével egy meglévő rendszerből tanul. „Olyan ez, mintha kapnál pár órát Einsteinnel, és úgy sétálnál ki, hogy majdnem olyan tudással rendelkezel, mint ő a fizikában” – mondta Ali Ghodsi, a Databricks adatkezelő cég vezérigazgatója.
Az olyan cégek, mint az OpenAI és az Anthropic vezető mesterséges intelligenciái lényegében az alapoktól tanítják magukat hatalmas mennyiségű nyers adatból. Ez a folyamat jellemzően sok hónapot és több tízmillió dollárt vagy annál is többet vesz igénybe. Az ilyen munka eredményeire támaszkodva a desztilláció hetek vagy akár napok alatt, lényegesen kevesebb pénzért létrehozhat egy majdnem ugyanolyan jó modellt. Az OpenAI közölte, hogy a DeepSeek a ChatGPT-t működtető modellekből desztillált anyagokat használt a rendszere felépítéséhez. Az OpenAI szolgáltatási feltételei tiltják, hogy az AI-t rivális termékek fejlesztésére használják fel.
A desztilláció nem új ötlet, de a DeepSeek sikere új kétségeket ébreszt a technológiai óriások és startupok üzleti modelljével kapcsolatban, amelyek milliárdokat költenek a legfejlettebb mesterséges intelligencia kifejlesztésére, beleértve a Google-t, az OpenAI-t, az Anthropicot és Elon Musk xAI-ját. Az OpenAI éppen a múlt héten jelentette be, hogy a SoftBankkal és másokkal partnerséget kötött, hogy a következő öt évben 500 milliárd dollárt fektessenek be az AI-infrastruktúrába. Ha ezek a beruházások nem nyújtanak a vállalatoknak verhetetlen előnyt, hanem inkább az olcsóbb riválisok számára szolgálnak ugródeszkaként, akkor nehéz lesz igazolni őket. A DeepSeek nyomán a Szilícium-völgy vezetői és befektetői felülvizsgálják üzleti modelljeiket, és megkérdőjelezik, hogy még mindig megéri-e iparági vezetőnek lenni. „Vajon gazdaságilag gyümölcsöző-e az élvonalban lenni, ha ez nyolcszor annyiba kerül, mint egy követőnek?” – mondta Mike Volpi, veterán technológiai vezető és kockázati tőkebefektető, a Hanabi Capital általános partnere.
Az OpenAI vezérigazgatója, Sam Altman az X-en a DeepSeek legújabb kiadását „lenyűgöző modellnek nevezte” és hozzátette: „izgatottan várjuk a kutatási ütemtervünk további végrehajtását”. Az Anthropic vezérigazgatója, Dario Amodei a blogján azt írta, hogy a DeepSeek zászlóshajó modellje „nem olyan egyedülálló áttörés, ami alapvetően megváltoztatja a fejlett AI-rendszerek gazdaságosságát”, hanem inkább „egy várható esemény a folyamatos költségcsökkentési görbén”. A technológiai vezetők arra számítanak, hogy hamarosan több magas színvonalú AI-alkalmazás készül majd desztillációval. A Hugging Face nevű AI-vállalat kutatói a múlt héten kezdtek el próbálkozni egy a DeepSeekéhez hasonló modell megalkotásával. „A legkönnyebben a desztillációs folyamatot lehet lemásolni” – mondta Lewis Tunstall vezető kutató.
Az OpenAI és a Google AI-modellei továbbra is megelőzik a DeepSeek-et a Szilícium-völgyben leggyakrabban használt ranglistán. A technológiai óriások valószínűleg azért tartják meg előnyüket a legfejlettebb rendszereknél, mert ők végzik a legtöbb eredeti kutatást. Sok fogyasztó és vállalkozás azonban szívesen használ olyan technológiát, amely egy kicsit rosszabb, de sokkal kevesebbe kerül. Trump elnök mesterséges intelligencia cárja, David Sacks a Fox News műsorában azt mondta, hogy elvárja az amerikai vállalatoktól, hogy nehezebbé tegyék a modelljeik desztillálását.
A DeepSeek elmondta, hogy korábban a Meta Platforms és az Alibaba által kiadott nyílt forráskódú mesterséges intelligenciákon használt desztillációt, valamint az egyik modelljéből egy másikat épített. A nyílt forráskódú mesterséges intelligencia fejlesztői általában engedélyezik a másolást, ha elismerést kapnak. A DeepSeek saját modelljei nyílt forráskódúak. A NovaSky, a Berkeley-i Kaliforniai Egyetem kutatólaboratóriuma ebben a hónapban tett közzé egy olyan modellt, amelyről azt állítják, hogy egyenrangú az OpenAI által nemrég kiadott modellel. A NovaSky tudósai 450 dollárért építették meg a kínai Alibaba cég nyílt forráskódú modelljének desztillálásával.
A Berkeley kutatói a modellt nyílt forráskódú szoftverként adták ki, és máris használják egy még olcsóbb mesterséges intelligencia-technológia kifejlesztéséhez. Az egyik startup, a Bespoke Labs arra használta, hogy a DeepSeek technológiáját egy új modellé desztillálja, amely szerinte jól teljesített a kódolási és matematikai feladatokban. „A desztilláció mint technika nagyon hatékony abban, hogy új képességeket adjunk hozzá egy meglévő modellhez” – mondta Ion Stoica, a Berkeley Egyetem informatika professzora.
A mesterséges intelligencia iparágában már most is éles a verseny, és a legtöbb vállalat veszteséges, miközben a piaci részesedésért harcol. A DeepSeek és más desztillációt alkalmazó cégek belépése tovább nyomhatja lefelé az árakat, és olyan visszacsatolási hurkot hozhat létre, amelyben egyre nehezebb lesz igazolni, hogy hatalmas összegeket költsenek a fejlett kutatásra. Az OpenAI és mások AI-modelljeihez hozzáférő szoftverfejlesztők árai az elmúlt évben drasztikusan csökkentek. A nyílt forráskódú mesterséges intelligencia, mint például a DeepSeeké, a technológiai vezetők szerint csak további költségcsökkentést ígér. „Nehezebb lesz igazolni a nagyon magas árréseket” – mondta Vipul Ved Prakash, a Together AI vezérigazgatója, amely számítási szolgáltatásokat értékesít az MI-alkalmazások fejlesztői számára.