Záros határidőn belül kell legalább részben megértenünk a mesterséges intelligencia működését, mert hamarosan túl késő lesz.

Eric Horvitz, a Microsoft vezető tudományos munkatársa és Robert West, az EPFL svájci műszaki egyetem kutatója szerint a mesterséges intelligencia olyan ütemben fejlődik, hogy az ember kezd lemaradni mögötte.

A kutatók nem azt állítják, hogy minden egyes algoritmust vagy paramétert tökéletesen értenünk kellene, de szerintük létfontosságú, hogy elegendő rálátásunk maradjon a rendszerek működésére ahhoz, hogy időben felismerhessük a kockázatokat és megőrizzük az emberi kontrollt.

Aggasztónak tartják, hogy a modern AI-rendszerek egyre gyakrabban vesznek részt más AI-modellek fejlesztésében és finomhangolásában.

Az ilyen önmagukat fejlesztő folyamatok során a teljesítmény ugyan javulhat, de az emberek egyre kevésbé láthatják át, pontosan hogyan születnek a döntések.

Horvitz és West szerint az AI-rendszerek ma már olyan ciklusokban tervezik és optimalizálják egymást, amelyek gyorsabban zajlanak, mint ahogy az ember képes követni azokat. Emiatt egyre nehezebb megérteni a háttérben zajló folyamatokat, még akkor is, ha a végeredmény látható marad. A kutatók ezért azt javasolják, hogy azok a rendszerek, amelyek részt vesznek más AI-ok fejlesztésében, automatikusan készítsenek ember által is értelmezhető magyarázatokat a működésükről.

A másik vészjósló dolog, hogy egyre több mesterséges intelligencia működik összekapcsolt hálózatokban, és emiatt fennáll a veszélye annak, hogy ezek a rendszerek fokozatosan eltávolodnak az ember számára érthető kommunikációs formáktól. Magyarul ez annyit jelent, hogy elképzelhető, hogy az AI-ok idővel olyan kommunikációs mintákat alakítanak ki egymás között, amelyek hatékonyak számukra, de az emberek számára egyre kevésbé lesznek értelmezhetők.

A tanulmányban érintik a társadalmi részt is, főleg az úgynevezett adaptív AI-rendszerekkel kapcsolatban, amik hosszú időn keresztül kapcsolatban maradnak egy-egy emberrel. Az ilyen rendszerek idővel túlontúl részletes képet alkothatnak az emberek szokásairól, preferenciáiról, motivációiról, bizonytalanságairól vagy akár félelmeiről.

Ez azt a disztópikus jövőt vetíti előre, ahol a mesterséges intelligencia egyre többet tud az emberekről, az emberek egyre kevésbé értik az AI működését.

Horvitz és West arra is figyelmeztetnek, hogy a jövőben az AI-modellek akár azt is megtanulhatják, hogyan feleljenek úgy a teszteken és ellenőrzéseken, hogy az megfeleljen az elvárásoknak, de közben a háttérben úgy csinálnak mindent, ahogy nekik tetszik.

A legnagyobb probléma jelenleg az, hogy az emberek fokozatosan elveszíthetik az érdeklődésüket az AI-rendszerek megértése és ellenőrzése iránt, ami jelenleg beláthatatlan következményekkel járhat. A Science-en megjelent teljes cikket is érdemes elolvasni, ha érdekel a téma.

Tovább a cikkre: pcwplus.hu (Mártha Dávid)

Szűkülő ablak a mesterséges intelligencia megértéséhez

Ahogy a mesterséges intelligencia (AI) képességei gyorsan fejlődnek, az emberi megértés egyre inkább lemarad ezen rendszerek terén. Számos trend konvergál, amelyek miatt a AI-rendszerek megértése nehezebbé válik, miközben egyre jelentősebbé válnak. Tudatos ellensúlyozási erőfeszítések nélkül a helyreállítás előtt bezárulhat az ablak az olyan AI-rendszerek építésére, amelyeket érdemi módon meg tudunk érteni és irányítani tudunk.

A mesterséges intelligencia megértése – vagy értelmezhetősége – nem feltétlenül jelenti azt, hogy minden egyes kódsort vagy minden egyes neurális hálózati paramétert ismernünk kell. Ahogyan az emberi viselkedést több szinten tanulmányozzuk, az idegtudománytól a pszichológián át a szociológiáig, a mesterséges intelligencia alapelvei és működése is különböző szinteken tárható fel és érthető meg. A teljes mechanisztikus megértés továbbra is elérhetetlen maradhat , de a tudomány ritkán működik „mindent vagy semmit” alapon; a részleges megértés továbbra is hasznos. Az ilyen megértést nem a teljesség iránti igény, hanem egy gyakorlati szükséglet teszi sürgetővé: Ahogy a képességek fejlődése gyorsul, még a mesterséges intelligencia rendszereibe való tökéletlen ok-okozati betekintés is lehetővé teheti számunkra, hogy a kockázatokat korán felismerjük és beavatkozzunk, mielőtt a károk súlyosbodnának.

Az egyik trend, amely megnehezíti a megértést, a mesterséges intelligencia által irányított AI-tervezés térnyerése. A AI-rendszereket ma már AI-rendszerek tervezik és finomítják rekurzív ciklusokon keresztül, amelyek meghaladhatják az emberi megértést, és olyan nagy dimenziójú terekben bontakoznak ki, amelyek ellenállnak az intuíciónak. Ennek eredményeként egyre nagyobb a működési átláthatatlanság: a teljesítmény javul, míg az elérésének módjába való betekintés csökken. Az emberi betekintés és kontroll előmozdítása érdekében a saját tervezésükhöz hozzájáruló AI-rendszereknek olyan magyarázatokat és eszközöket kell létrehozniuk, amelyek érthetővé teszik architektúrájukat és működésüket az emberek számára. Ellenkező esetben az átláthatatlanság a tervezési folyamat nem szándékolt következményeként jelentkezhet.

Egy másik trend a mesterséges intelligencia (AI) közötti interakciók elterjedése. Ahogy ezeknek az interakcióknak a mértéke és összetettsége növekszik a szorosan összekapcsolt többágenses környezetekben, a követése egyre nehezebbé válik. Az AI-ágensek közötti kommunikáció eltérhet az emberi nyelvtől és érveléstől, és nehezebben értelmezhetővé válhat. Ez interakciós átlátszatlanságot okoz: a viselkedés koherens lehet a AI-ökoszisztémákon belül, de az emberek számára nem könnyen értelmezhető. A kutatóknak tanulmányozniuk kell a többágenses dinamikát, és fel kell fedezniük az eltéréseket a AI által generált nyelvben és érvelésben. A képzési céloknak az ember által értelmezhető kommunikációt kell jutalmazniuk, hogy a fejlett rendszerek és a többágenses ökoszisztémák érthetőek maradjanak.

Egy harmadik trend a mindennapi életbe mélyen beépülő, adaptív AI-ágensek térnyerése. A tartós interakció révén egyre részletesebb modelleket tudnak felépíteni az emberi viselkedésről és pszichológiáról, nemcsak a preferenciákat, hanem a látens mozgatórugókat is megragadva, mint például a félelem, a bizonytalanság és a társadalmi hovatartozás iránti igény. Feltűnő aszimmetria következik ebből: miközben az emberi AI-vel kapcsolatos ismeretek csökkennek, az AI emberekről alkotott ismeretei mélyülnek, új viselkedési átlátszatlanságokat eredményezve.

Például a rendszerek egyre inkább tudatában lehetnek az értékelési kontextusoknak, és olyan kimeneteket produkálhatnak, amelyek az értékelő vágyait tükrözik, nem pedig az alapul szolgáló érvelést és képességeket. Az értékelési módszereknek ezért alkalmazkodniuk kell. A statikus referenciaértékeket dinamikus keretrendszerekkel kell kiegészíteniük, amelyek jobban megközelítik a valós alkalmazást. Az értékelési módszereknek azt kell vizsgálniuk, hogy a modellek másképp viselkednek-e megfigyelés alatt, és ösztönözniük kell a bizonytalanság, következtetéseik alapjának és a képességkorlátoknak hű jelentését.

Ennél árnyaltabb annak a lehetősége, hogy fokozatosan elveszítjük az érdeklődésünket a mesterséges intelligencia megértése és irányítása iránt. Ahogy a mesterséges intelligencia rendszerei mélyen beágyazódnak az emberi környezetbe, reagálhatnak a preferenciákra, de alakíthatják is azokat. Az elköteleződésre vagy jóváhagyásra optimalizált rendszerek csökkenthetik a súrlódásokat és elriaszthatják a vizsgálatot. Idővel a kíváncsiság és a szkepticizmus elhalványulhat, ami elhanyagoláshoz és elfogadáshoz vezethet.

Az emberi cselekvőképesség megőrzésének ezért továbbra is központi célnak kell maradnia. Nem elég a mesterséges intelligenciarendszerek viselkedését figyelemmel kísérni. Azt is meg kell értenünk, hogyan alakítják az emberi célokat és ítélőképességet, és biztosítanunk kell, hogy az emberek megőrizzék a képességüket és motivációjukat a kérdések feltevésére, ellenőrzésére és irányítására.

Az átláthatatlanság ezen formái erősítik egymást, szűkítve – és fenyegetve a bezáródással – azt az ablakot, amelyen keresztül olyan mesterséges intelligenciát építhetünk, amely nemcsak hatékony, hanem érthető is. Az ablak nyitva tartása megköveteli a céljaink megváltoztatását. Az emberi megértést a képességek mellett prioritásként kell kezelni.

Intézményi szinten az átláthatóság és az értékelés szabványainak a technológiával együtt kell fejlődniük. Az aggodalmakat, hogy a saját fejlesztésű mesterséges intelligencia korlátozhatja a tudományos láthatóságot, részben enyhítette a folyamatos közzététel, a nyílt forráskódú tevékenységek, valamint az ipar és az akadémiai szféra közötti folyamatos információcsere. A jobb megértéshez azonban a felelős közzététel tartós normáira lesz szükség, hogy az alapvető előrelépések továbbra is nyitottak maradjanak a független ellenőrzés és a közös megértés számára.

A cél nem csupán egy hatékonyabb mesterséges intelligencia, hanem egy érthetőbb, elszámoltathatóbb és az emberi célokkal összhangban lévő mesterséges intelligencia. Az e jövő elérésének időkerete egyre szűkül. A mesterséges intelligencia érthetőségének megőrzésére irányuló folyamatos erőfeszítések nélkül olyan rendszerekre szorulhatunk, amelyeket sem megfelelően nem értünk, sem hatékonyan nem tudunk irányítani – átalakítva ezzel az emberek és az általuk létrehozott rendszerek közötti kapcsolatot.

Tovább a cikkre: science.org (Eric Horvitz és Robert West)

Post Views: 6

Szűkülő ablak a mesterséges intelligencia megértéséhez

Related Posts