Ismered ezeket az AI kifejezéseket, és használod is őket? – javítsuk ki a jelentésüket!

A mesterséges intelligencia megváltoztatja a világot, és egyidejűleg egy teljesen új nyelvet talál fel annak leírására, hogyan működik. Tölts öt percet a mesterséges intelligenciáról való olvasással, és belefuthatsz az LLM-ekbe, RAG-ba, RLHF-be és egy tucatnyi más kifejezésbe, amelyek még a tech világ nagyon okos embereit is bizonytalanná tehetik. Ez a szószedet a mi kísérletünk arra, hogy ezt orvosoljuk. Rendszeresen frissítjük, ahogy a terület fejlődik, ezért tekints rá élő dokumentumként, akárcsak az általa leírt mesterséges intelligencia rendszerekre.

AGI
A mesterséges általános intelligencia, vagy AGI, egy homályos kifejezés. De általában olyan MI-re utal, amely sok, ha nem a legtöbb feladatban képesebb, mint egy átlagos ember. Sam Altman, az OpenAI vezérigazgatója egyszer az AGI-t úgy írta le, mint „egy átlagos ember megfelelőjét, akit munkatársként felvehetnénk ”. Eközben az OpenAI alapító okirata az AGI-t úgy határozza meg, mint „nagyon autonóm rendszereket, amelyek a legtöbb gazdaságilag értékes munkában felülmúlják az embereket”. A Google DeepMind felfogása kissé eltér e két definíciótól; a laboratórium az AGI-t olyan MI-ként tekinti, „amely a legtöbb kognitív feladatban legalább annyira képes, mint az ember”. Összezavarodott? Ne aggódjon – a mesterséges intelligencia-kutatás élvonalában lévő szakértők is.

MI-ügynök (AI-agent)
Az MI-ügynök egy olyan eszköz, amely MI-technológiákat használ egy sor feladat elvégzésére a felhasználó nevében – azon túl, amit egy alapvető MI-csevegőbot el tudna végezni –, például költségek benyújtására, jegy- vagy asztalfoglalásra egy étteremben, vagy akár kód írására és karbantartására. Azonban, ahogy korábban már kifejtettük , sok mozgó alkatrész van ebben az újonnan megjelenő területen, így az „MI-ügynök” kifejezés különböző dolgokat jelenthet mindenkinek. Az infrastruktúra kiépítése is folyamatban van, hogy a tervezett képességeit kiaknázhassa. Az alapkoncepció azonban egy autonóm rendszert feltételez, amely több MI-rendszerre támaszkodhat a többlépéses feladatok végrehajtásához.

API végpontok (API endpoints)
Gondolj az API-végpontokra úgy, mint egy szoftver hátulján található „gombokra”, amelyeket más programok megnyomhatnak, hogy műveleteket hajtsanak végre rajta. A fejlesztők ezeket a felületeket integrációk építésére használják – például lehetővé teszik, hogy egy alkalmazás adatokat kérjen le egy másikból, vagy lehetővé teszik egy MI-ügynök számára, hogy közvetlenül vezérelje a harmadik féltől származó szolgáltatásokat anélkül, hogy egy ember manuálisan kezelné az egyes felületeket. A legtöbb okosotthoni eszköz és csatlakoztatott platform rendelkezik ezekkel a rejtett gombokkal, még akkor is, ha a hétköznapi felhasználók soha nem látják vagy nem lépnek kapcsolatba velük. Ahogy a MI-ügynökök egyre képességesebbek lesznek, egyre inkább képesek önállóan megtalálni és használni ezeket a végpontokat, ami erőteljes – és néha váratlan – lehetőségeket nyit meg az automatizálás számára.

Gondolatlánc (Chain of thought)
Egy egyszerű kérdésre az emberi agy gondolkodás nélkül képes válaszolni – például: „melyik állat magasabb, a zsiráf vagy a macska?”. Sok esetben azonban tollra és papírra van szükség a helyes válasz megtalálásához, mivel vannak köztes lépések. Például, ha egy gazdának csirkéi és tehenei vannak, és összesen 40 fejük és 120 lábuk van, akkor lehet, hogy egy egyszerű egyenletet kell leírnunk a válaszhoz (20 csirke és 20 tehén).

Egy mesterséges intelligencia kontextusában a nagy nyelvi modellek esetében a gondolatlánc-gondolkodás azt jelenti, hogy egy problémát kisebb, köztes lépésekre bontunk le a végeredmény minőségének javítása érdekében. Általában tovább tart a válasz megszerzése, de a válasz nagyobb valószínűséggel helyes, különösen logikai vagy kódolási kontextusban. Az érvelési modelleket a hagyományos nagy nyelvi modellekből fejlesztik, és a megerősítéses tanulásnak köszönhetően optimalizálják a gondolatlánc-gondolkodásra.

(Lásd: Nagy nyelvi modell )

Kódoló ügynökök (Coding agents)
Ez egy konkrétabb fogalom, mint az „AI-ügynök”, ami egy olyan programot jelent, amely lépésről lépésre önállóan képes műveleteket végrehajtani egy cél elérése érdekében. A kódolóügynök egy speciális, szoftverfejlesztésben alkalmazott változat. Ahelyett, hogy egyszerűen csak javasolna kódot egy embernek, aki átnézi és beilleszti, a kódolóügynök önállóan írhat, tesztelhet és hibakereshet kódot, kezelve azt az iteratív, próbálkozáson és hibán alapuló munkát, amely jellemzően egy fejlesztő napját felemészti. Ezek az ügynökök teljes kódbázisokon képesek működni, hibákat észlelni, teszteket futtatni és javításokat kiadni minimális emberi felügyelet mellett. Képzeljük el úgy, mintha egy nagyon gyors gyakornokot vennénk fel, aki soha nem alszik és soha nem veszíti el a fókuszt – bár, mint minden gyakornok esetében, egy embernek továbbra is át kell tekintenie a munkát.

Számítás (Compute)
Bár némileg többértelmű kifejezés, a „számítás” általában arra a létfontosságú számítási teljesítményre utal , amely lehetővé teszi a mesterséges intelligencia modellek működését. Ez a fajta feldolgozás táplálja a mesterséges intelligencia iparágat, lehetővé téve számára a nagy teljesítményű modellek betanítását és telepítését. A kifejezés gyakran rövidített elnevezése azoknak a hardvereknek, amelyek a számítási teljesítményt biztosítják – például GPU-knak, CPU-knak, TPU-knak és más, a modern mesterséges intelligencia iparág alapját képező infrastruktúra-formáknak.

Mély tanulás (Deep learning)
Az önfejlesztő gépi tanulás egy részhalmaza, amelyben a mesterséges intelligencia algoritmusait többrétegű, mesterséges neurális hálózati (ANN) struktúrával tervezik. Ez lehetővé teszi számukra, hogy összetettebb korrelációkat hozzanak létre az egyszerűbb gépi tanuláson alapuló rendszerekhez, például a lineáris modellekhez vagy a döntési fákhoz képest. A mélytanuló algoritmusok szerkezete az emberi agy neuronjainak összekapcsolódó útvonalaiból merít ihletet.

A mélytanuló MI-modellek képesek maguk azonosítani az adatok fontos jellemzőit, ahelyett, hogy emberi mérnökökre lenne szükségük ezen jellemzők meghatározásához. A struktúra olyan algoritmusokat is támogat, amelyek képesek tanulni a hibákból, és ismétlés és beállítás révén javítani saját kimeneteiket. A mélytanuló rendszereknek azonban sok adatpontra van szükségük a jó eredmények eléréséhez (milliók vagy több). Betanításuk jellemzően tovább tart az egyszerűbb gépi tanulási algoritmusokhoz képest – így a fejlesztési költségek általában magasabbak.

(Lásd: Neurális hálózat )

Diffúzió (Diffusion)
A diffúzió számos művészeti, zenei és szöveggeneráló MI-modell középpontjában álló technológia. A fizika ihlette diffúziós rendszerek lassan „elpusztítják” az adatok – például fényképek, dalok stb. – szerkezetét azáltal, hogy zajt adnak hozzájuk, amíg semmi sem marad belőlük. A fizikában a diffúzió spontán és visszafordíthatatlan – a kávéban diffundált cukor nem állítható vissza kocka formába. A mesterséges intelligencia diffúziós rendszerei azonban egyfajta „fordított diffúziós” folyamatot céloznak meg a megsemmisített adatok helyreállítására, képessé téve az adatokat a zajból visszanyerni.

Lepárlás (Distillation)
A desztilláció egy olyan technika, amelyet egy nagyméretű, „tanár-diák” modellen alapuló AI-modellből tudás kinyerésére használnak. A fejlesztők kéréseket küldenek a tanári modellnek, és rögzítik a kimeneteket. A válaszokat néha összehasonlítják egy adathalmazzal, hogy megállapítsák azok pontosságát. Ezeket a kimeneteket ezután a diákmodell betanítására használják, amelyet a tanár viselkedésének közelítésére képeznek ki.

A desztilláció segítségével egy nagyobb modell alapján kisebb, hatékonyabb modell hozható létre, minimális desztillációs veszteséggel. Valószínűleg így fejlesztette ki az OpenAI a GPT-4 Turbót, a GPT-4 gyorsabb verzióját.

Bár minden MI-cég belsőleg használ lepárlást, előfordulhat, hogy egyes MI-cégek a határokon átívelő modellek utolérésére is használták. A versenytársaktól származó lepárlás általában sérti az MI API és a chat asszisztensek szolgáltatási feltételeit.

Finomhangolás (Fine-tuning)
Ez egy mesterséges intelligencia modell további betanítására utal, hogy optimalizálja a teljesítményt egy konkrétabb feladathoz vagy területhez, mint ami korábban a betanítás fókuszában állt – jellemzően új, specializált (azaz feladatorientált) adatok betáplálásával.

Sok mesterséges intelligencia startup nagy nyelvi modelleket vesz kiindulópontként egy kereskedelmi termék fejlesztéséhez, de egy célszektor vagy feladat hasznosságának fokozásáért versengenek azáltal, hogy a korábbi betanítási ciklusokat a saját területspecifikus ismereteik és szakértelmük alapján finomhangolják.

(Lásd: Nagy nyelvi modell [LLM] )

GAN
A GAN, vagyis a Generatív Ellenfélhálózat (Genarative Adversarial Network) egy olyan gépi tanulási keretrendszer, amely a generatív mesterséges intelligencia néhány fontos fejlesztésének alapját képezi a realisztikus adatok előállítása terén – beleértve (de nem csak) a deepfake eszközöket. A GAN-ok két neurális hálózat használatát foglalják magukban, amelyek közül az egyik a saját betanítási adatait felhasználva generál egy kimenetet, amelyet átad a másik modellnek kiértékelésre.

A két modell lényegében úgy van programozva, hogy megpróbálják felülmúlni egymást. A generátor megpróbálja a kimenetét a diszkriminátoron túlra juttatni, míg a diszkriminátor a mesterségesen generált adatok kiszűrésén dolgozik. Ez a strukturált verseny optimalizálhatja a mesterséges intelligencia kimeneteit, hogy realisztikusabbak legyenek további emberi beavatkozás nélkül. A GAN-ok azonban szűkebb alkalmazásokhoz (például realisztikus fotók vagy videók készítéséhez) működnek a legjobban, mint az általános célú mesterséges intelligencia.

Hallucináció (Hallucination)
A hallucináció a mesterséges intelligencia iparág által előnyben részesített kifejezés azokra a mesterséges intelligencia modellekre, amelyek kitalálnak dolgokat – szó szerint helytelen információkat generálnak. Nyilvánvalóan ez hatalmas probléma a mesterséges intelligencia minősége szempontjából.

A hallucinációk olyan GenAI-kimeneteket hoznak létre, amelyek félrevezetőek lehetnek, sőt akár valós kockázatokhoz is vezethetnek – potenciálisan veszélyes következményekkel (gondoljunk egy egészségügyi lekérdezésre, amely káros orvosi tanácsot ad vissza).

Az információkon alapuló mesterséges intelligencia problémája feltehetően a betanítási adatok hiányosságaiból ered. A hallucinációk hozzájárulnak az egyre specializáltabb és/vagy vertikálisabb MI-modellek – azaz szűkebb szakértelmet igénylő, területspecifikus MI-k – felé való elmozduláshoz, hogy csökkentsék a tudásbeli hiányosságok valószínűségét és a dezinformációs kockázatokat.

Következtetés (Inference)
A következtetés egy mesterséges intelligencia által létrehozott modell futtatásának folyamata. Ez egy modell felszabadítása, hogy előrejelzéseket tegyen vagy következtetéseket vonjon le a korábban látott adatokból. A félreértések elkerülése végett, a következtetés nem történhet meg betanítás nélkül; egy modellnek meg kell tanulnia a mintákat egy adathalmazban, mielőtt hatékonyan extrapolálhatna ezekből a betanítási adatokból.

Sokféle hardver képes következtetésre, az okostelefon-processzoroktól a nagy teljesítményű GPU-kon át az egyedi tervezésű MI-gyorsítókig. De nem mindegyik képes egyformán jól futtatni a modelleket. A nagyon nagy modelleknek egy napokba telne előrejelzéseket készíteni például egy laptopon vagy egy csúcskategóriás MI-chipekkel felszerelt felhőszerveren.

[Lásd: Edzés ]

Nagy nyelvi modell (LLM) (Large language model (LLM)
A nagy nyelvi modellek, vagy LLM-ek, olyan népszerű MI-asszisztensek által használt AI-modellek, mint a ChatGPT , Claude , a Google Gemini , a Meta AI Llama , a Microsoft Copilot vagy a Mistral Le Chat . Amikor egy AI-asszisztenssel beszélgetsz, egy nagy nyelvi modellel kommunikálsz, amely közvetlenül vagy különböző elérhető eszközök, például webböngészés vagy kódértelmezők segítségével dolgozza fel a kérésedet.

Az LLM-ek mély neurális hálózatok, amelyek milliárdnyi numerikus paraméterből ( vagy súlyozásból, lásd alább ) állnak, és megtanulják a szavak és kifejezések közötti kapcsolatokat, és létrehozzák a nyelv reprezentációját, a szavak egyfajta többdimenziós térképét.

Ezek a modellek könyvek, cikkek és átiratok milliárdjaiban található minták kódolásából jönnek létre. Amikor LLM-et kérünk, a modell a legvalószínűbb mintát generálja, amely illik a kérdéshez.

(Lásd: Neurális hálózat )

Memória gyorsítótár (Memory cache)
A memória-gyorsítótár egy fontos folyamat, amely fokozza a következtetést (ami az a folyamat, amelynek során a mesterséges intelligencia választ generál a felhasználói lekérdezésre). Lényegében a gyorsítótárazás egy optimalizálási technika, amelynek célja a következtetés hatékonyabbá tétele. A mesterséges intelligenciát nyilvánvalóan nagy oktánszámú matematikai számítások vezérlik, és minden alkalommal, amikor ezek a számítások elvégzésre kerülnek, több energiát fogyasztanak. A gyorsítótárazás célja, hogy csökkentse a modell által futtatandó számítások számát azáltal, hogy bizonyos számításokat elment a jövőbeli felhasználói lekérdezésekre és műveletekre. Különböző típusú memória-gyorsítótárolás létezik, bár az egyik legismertebb a KV (vagy kulcsérték) gyorsítótárazás . A KV-gyorsítótárazás transzformátor alapú modellekben működik, és növeli a hatékonyságot, gyorsabb eredményeket eredményez azáltal, hogy csökkenti a felhasználói kérdésekre adott válaszok generálásához szükséges időt (és algoritmikus munkát).

(Lásd: Következtetés )

Neurális hálózat (Neural network)
A neurális hálózat a mélytanulás – és tágabb értelemben a generatív mesterséges intelligenciaeszközök fellendülésének a nagy nyelvi modellek megjelenését követően – alapját képező többrétegű algoritmikus struktúrára utal.

Bár az az elképzelés, hogy az emberi agy sűrűn összekapcsolódó útvonalaiból inspirációt merítsenek az adatfeldolgozó algoritmusok tervezési struktúrájaként, egészen az 1940-es évekig nyúlik vissza, a grafikus feldolgozó hardverek (GPU-k) sokkal újabb keletű – a videojáték-iparon keresztüli – térnyerése tette igazán nyilvánvalóvá ennek az elméletnek az erejét. Ezek a chipek sokkal alkalmasabbnak bizonyultak az algoritmusok sokkal több rétegű betanítására, mint a korábbi korszakokban – lehetővé téve a neurális hálózatokon alapuló mesterséges intelligenciarendszerek számára, hogy sokkal jobb teljesítményt érjenek el számos területen, beleértve a hangfelismerést, az autonóm navigációt és a gyógyszerkutatást.

(Lásd: Nagy nyelvi modell [LLM] )

Nyílt forráskódú (Open source)
A nyílt forráskód olyan szoftverekre – vagy egyre inkább MI-modellekre – utal, amelyek mögöttes kódja nyilvánosan elérhető bárki számára, hogy felhasználhassa, megvizsgálhassa vagy módosíthassa. A MI világában a Meta Llama modellcsaládja kiemelkedő példa erre; a Linux a híres történelmi párhuzam az operációs rendszerek terén. A nyílt forráskódú megközelítések lehetővé teszik a kutatók, fejlesztők és vállalatok számára világszerte, hogy egymás munkájára építsenek, felgyorsítva a fejlődést és lehetővé téve a független biztonsági auditokat, amelyeket a zárt rendszerek nem tudnak könnyen biztosítani. A zárt forráskód azt jelenti, hogy a kód privát – használhatod a terméket, de nem láthatod, hogyan működik, ahogyan az OpenAI GPT-modelljeivel is történik – ez a megkülönböztetés az MI-iparág egyik meghatározó vitájává vált.

Párhuzamosítás (Parallelization)
A párhuzamosítás azt jelenti, hogy sok dolgot kell egyszerre elvégezni, ahelyett, hogy egymás után végeznénk – például 10 alkalmazott dolgozik egyszerre egy projekt különböző részein, ahelyett, hogy egy alkalmazott mindent egymás után csinálna. A mesterséges intelligenciában a párhuzamosítás alapvető fontosságú mind a betanítás, mind a következtetés szempontjából: a modern GPU-kat kifejezetten arra tervezték, hogy több ezer számítást végezzenek párhuzamosan, ami nagyban hozzájárul ahhoz, hogy az iparág hardver gerincévé váltak. Ahogy a mesterséges intelligencia rendszerei egyre összetettebbek és a modellek egyre nagyobbak lesznek, a munka sok chipen és sok gépen történő párhuzamosításának képessége az egyik legfontosabb tényezővé vált annak meghatározásában, hogy milyen gyorsan és költséghatékonyan lehet modelleket építeni és telepíteni. A jobb párhuzamosítási stratégiákkal kapcsolatos kutatás ma már önálló kutatási terület.

RAMageddon
A RAMageddon egy szórakoztató új kifejezés egy kevésbé szórakoztató trendre, amely végigsöpör a tech iparon: a véletlen hozzáférésű memória, vagyis a RAM chipek egyre növekvő hiánya, amelyek gyakorlatilag az összes mindennapi életünkben használt tech terméket működtetik. Ahogy a mesterséges intelligencia iparág virágzott, a legnagyobb tech cégek és MI laboratóriumok – mindannyian azért versengenek, hogy a legerősebb és leghatékonyabb MI-t birtokolják – annyi RAM-ot vásárolnak adatközpontjaik működtetésére, hogy a többieknek már nem sok marad. Ez az ellátási szűk keresztmetszet pedig azt jelenti, hogy ami megmarad, az egyre drágább lesz.

Ez magában foglalja az olyan iparágakat, mint a játékipar (ahol a nagyvállalatoknak emelniük kellett a konzolok árait, mert nehezebb memóriachipeket találni az eszközeikhez), a szórakoztatóelektronika (ahol a memóriahiány több mint egy évtizede a legnagyobb visszaesést okozhatja az okostelefon-szállításokban ), és az általános vállalati számítástechnika (mivel ezek a vállalatok nem tudnak elegendő RAM-ot beszerezni a saját adatközpontjaik számára). Az áremelkedés várhatóan csak a rettegett hiány megszűnése után áll meg, de sajnos nincs sok jel arra, hogy ez a közeljövőben bekövetkezne.

Rekurzív önfejlesztés (Recursive self-improvement)
Az AGI-hoz hasonlóan a rekurzív önfejlesztés is küszöbértéket jelent arra vonatkozóan, hogy mennyire lehet okos a mesterséges intelligencia, és mennyire kevéssé támaszkodhat az emberekre. Az RSI forgatókönyvben a mesterséges intelligencia modellek emberi beavatkozás nélkül kezdik fejleszteni magukat, ami a képességek és az autonómia hatalmas felgyorsulásához vezet. Egyesek szerint ez egy katasztrofális pillanat lenne, hasonlóan a szingularitáshoz, egy olyan pillanat, amikor a mesterséges intelligencia modellek immunissá válnak a külső beavatkozásra. De az RSI egy alapvető képességet is leír – képes-e egy mesterséges intelligencia modell megtervezni a saját utódját? –, ami sokkal könnyebbé teszi a mérnökök számára a megépítését. Számos újabb mesterséges intelligencia startup vállalkozott rekurzívan önfejlesztő modellek építésére, de a legtöbbjük elveti az apokaliptikus következményeket, és az RSI-t egyszerűen a kutatás következő határterületeként mutatja be.

Megerősítéses tanulás (Reinforcement learning)
A megerősítéses tanulás a mesterséges intelligencia képzésének egy olyan módja, ahol a rendszer úgy tanul, hogy kipróbál dolgokat, és jutalmat kap a helyes válaszokért – például amikor jutalomfalatokkal tanítjuk a szeretett háziállatunkat, azzal a különbséggel, hogy ebben a forgatókönyvben a „háziállat” egy neurális hálózat, a „jutalomfalat” pedig egy matematikai jel, amely a sikert jelzi. A felügyelt tanulással ellentétben, ahol egy modellt egy rögzített, címkézett példákból álló adathalmazon tanítanak, a megerősítéses tanulás lehetővé teszi a modell számára, hogy felfedezze a környezetét, cselekedjen, és folyamatosan frissítse viselkedését a kapott visszajelzések alapján. Ez a megközelítés különösen hatékonynak bizonyult a mesterséges intelligencia játékokra, robotok irányítására és – újabban – nagy nyelvi modellek érvelési képességének élesítésére való betanításában. Az olyan technikák, mint az emberi visszajelzésből történő megerősítéses tanulás, vagy RLHF, ma már központi szerepet játszanak abban, hogy a vezető mesterséges intelligencia laboratóriumok hogyan finomhangolják modelljeiket, hogy hasznosabbak, pontosabbak és biztonságosabbak legyenek.

Token
Az ember és gép közötti kommunikáció terén vannak nyilvánvaló kihívások – az emberek emberi nyelven kommunikálnak, míg a mesterséges intelligencia programjai összetett algoritmikus folyamatokon keresztül, adatokon alapulva hajtják végre a feladatokat. A tokenek hidalják át ezt a szakadékot: ezek az ember és a mesterséges intelligencia közötti kommunikáció alapvető építőkövei, amelyek az LLM által feldolgozott vagy előállított különálló adatszegmenseket képviselik. Egy tokenizációnak nevezett folyamattal jönnek létre, amely a nyers szöveget falatnyi méretű egységekre bontja, amelyeket egy nyelvi modell képes feldolgozni, hasonlóan ahhoz, ahogyan egy fordítóprogram az emberi nyelvet bináris kóddá alakítja, amelyet a számítógép megért. Vállalati környezetben a tokenek a költségeket is meghatározzák – a legtöbb mesterséges intelligenciával foglalkozó vállalat tokenenként számít fel díjat az LLM használatáért, ami azt jelenti, hogy minél többet használ egy vállalkozás, annál többet fizet.

Token átviteli sebesség (Token throughput)
Tehát ismét, a tokenek a szöveg apró darabjai – gyakran szavak részei, nem pedig egészek –, amelyekre a mesterséges intelligencia nyelvi modelljei a nyelvet a feldolgozás előtt bontják; ezek nagyjából a „szavakhoz” hasonlíthatók a mesterséges intelligencia által végrehajtott munkaterhelések megértése szempontjából. Az átviteli sebesség arra utal, hogy mennyi adatot lehet feldolgozni egy adott idő alatt, tehát a tokenek átviteli sebessége lényegében azt méri, hogy egy rendszer mennyi mesterséges intelligencia által végzett munkát képes egyszerre kezelni. A magas tokenek átviteli sebessége kulcsfontosságú cél a mesterséges intelligencia infrastruktúra-csapatok számára, mivel ez határozza meg, hogy egy modell hány felhasználót tud egyszerre kiszolgálni, és milyen gyorsan kap választ mindegyikük. Andrej Karpathy, a mesterséges intelligencia kutatója leírta, hogy szorongást érez, amikor a mesterséges intelligencia-előfizetései tétlenül állnak – ami visszhangozza azt az érzést, amit posztgraduális hallgatóként érzett, amikor a drága számítógépes hardvereket nem használták ki teljes mértékben –, ez az érzés jól megragadja, hogy miért vált a tokenek átviteli sebességének maximalizálása a területen szinte megszállottsággá.

Edzés (Training)
A gépi tanuláson alapuló mesterséges intelligencia fejlesztése egy betanításnak nevezett folyamatot foglal magában. Egyszerűen fogalmazva, ez az adatok betáplálására utal, hogy a modell tanulhasson a mintákból és hasznos kimeneteket generálhasson. Lényegében ez az a folyamat, amelynek során a rendszer reagál az adatokban található jellemzőkre, és ezáltal a kimeneteket a kívánt célhoz igazítja – legyen szó akár macskák képeinek azonosításáról, akár igény szerinti haiku készítéséről.

A képzés költséges lehet, mivel sok bemenetet igényel , és a szükséges mennyiségek folyamatosan növekednek – ezért a hibrid megközelítések, mint például a szabályokon alapuló mesterséges intelligencia finomhangolása célzott adatokkal, segíthetnek a költségek kezelésében anélkül, hogy teljesen a nulláról kellene kezdeni.

[Lásd: Következtetés ]

Transzfertanulás (Transfer learning)
Egy olyan technika, amelyben egy korábban betanított MI-modellt használnak kiindulópontként egy új modell fejlesztéséhez egy másik, de jellemzően kapcsolódó feladathoz – lehetővé téve a korábbi betanítási ciklusokban szerzett ismeretek újbóli alkalmazását.

A transzfertanulás hatékonyságnövelést eredményezhet a modellfejlesztés lerövidítésével. Akkor is hasznos lehet, ha a modell fejlesztéséhez szükséges feladathoz rendelkezésre álló adatok némileg korlátozottak. Fontos azonban megjegyezni, hogy a megközelítésnek vannak korlátai. Azok a modellek, amelyek az általánosított képességek megszerzéséhez transzfertanulásra támaszkodnak, valószínűleg további adatokon való betanításra szorulnak ahhoz, hogy jól teljesítsenek a fókuszterületükön.

(Lásd: Finomhangolás )

Hitelesítési veszteség (Validation loss)
A validációs veszteség egy olyan szám, amely megmutatja, hogy egy MI-modell mennyire jól tanul a betanítás során – és minél alacsonyabb, annál jobb. A kutatók szorosan nyomon követik ezt a számot, mint egyfajta valós idejű jelentést, és ennek alapján döntik el, hogy mikor kell leállítani a betanítást, mikor kell módosítani a hiperparamétereket, vagy mikor kell kivizsgálni egy potenciális problémát. Az egyik legfontosabb probléma, amelyet segít jelezni, a túlilleszkedés, egy olyan állapot, amelyben a modell memorizálja a betanítási adatait, ahelyett, hogy valóban olyan mintákat tanulna meg, amelyeket új helyzetekre általánosíthat. Gondoljunk erre úgy, mint a különbségre egy olyan diák között, aki valóban megérti az anyagot, és egy olyan között, aki csak kívülről tanulta a tavalyi vizsgát – a validációs veszteség segít feltárni, hogy melyikké válik a modellünk.

Súlyok (Weights)
A súlyok alapvető fontosságúak a mesterséges intelligencia betanításában, mivel ezek határozzák meg, hogy a rendszer betanításához használt adatokban a különböző jellemzőknek (vagy bemeneti változóknak) mekkora fontosságot (vagy súlyt) tulajdonítanak – ezáltal alakítva a mesterséges intelligencia modell kimenetét.

Másképp fogalmazva, a súlyok numerikus paraméterek, amelyek meghatározzák, hogy mi a legkiemelkedőbb egy adathalmazban az adott betanítási feladathoz. Funkciójukat a bemenetek szorzásával érik el. A modell betanítása jellemzően véletlenszerűen hozzárendelt súlyokkal kezdődik, de a folyamat során a súlyok módosulnak, ahogy a modell olyan kimenetet igyekszik elérni, amely jobban megfelel a célnak.

Például egy mesterséges intelligencia alapú, lakásárak előrejelzésére szolgáló modell, amelyet egy célhelyszín korábbi ingatlanadatai alapján képeznek ki, súlyokat adhat olyan jellemzőkhöz, mint a hálószobák és fürdőszobák száma, hogy az ingatlan különálló vagy ikerház jellegű-e, van-e parkolója, garázsa stb.

Végső soron a modell által az egyes bemenetekhez rendelt súlyok tükrözik, hogy mennyire befolyásolják egy tulajdonság értékét az adott adathalmaz alapján.

Tovább a cikkre: techcrunch.com (Natasha Lomas, Romain Dillet, Kyle Wiggers, Lucas Ropek)

Post Views: 141

Related Posts