Így etesd a nyelvi rendszereket!

A nagy nyelvi rendszerek vállalati alkalmazása abban különbözik a Chat GPT általános felhasználásától, hogy a rendszer nem a globális internetről nyeri a tudását, hanem a vállalat által feltöltött dokumentumokból. Ez kiváló szövegfeldolgozási képességeket (például adatok kinyerése, szintetizálás, értelmezés, válaszok előállítása) eredményezhet, de a rendszert jól irányzott kérdések formájában érdemes felkészíteni a rendelkezésre álló vállalti tapasztalatok hasznosítására is.

A gépi tanulás, illetve annak egy még szűkebb fajtája, a nagy nyelvi rendszerek hatékonyan segítik a vállalatok munkáját, ha nem célként, hanem eszközként tekintünk rájuk. A gépi tanulás és nagy nyelvi rendszerek alkalmazásával képesek lehetünk dokumentumok tömegéből kinyerni a számunkra lényeges információt, válaszokat tudunk generálni a feltett kérdésekre, lényegre törő összefoglalót tudunk készíteni egy problémáról, és mindezt meg is tudjuk fogalmazni anélkül, hogy emberi kéznek kellene beavatkoznia a folyamatba. Ezek rendkívül vonzó lehetőségek, de ismernünk kell a módszer korlátait ahhoz, hogy ezek a megoldások az elvárásainknak megfelelően dolgozzanak.

A gépi tanulás és a nagy nyelvi rendszerek nem fogják maguktól megoldani a problémáinkat, főleg nem azok 100 százalékát, de ha jól definiáljuk számukra a problémát, akkor közelíthetik ezt az arány, és rendkívül gyorsan, az emberi munkaidő ráfordítás töredéke alatt érnek el olyan eredményeket, amelyek kiindulási alapnak tökéletesek a számunkra. Sokan játszanak ma már ezekkel a lehetőségekkel, amiből az látszik, hogy egy lentről-felfelé (vagy még inkább kintről befelé) építkező folyamat vezet majd el a legjobb vállalati alkalmazásokig, addig is érdemes azonban számba venni a lehetőségeket.

A vállalati környezetleginkább abban különbözik a ChatGPT-vel megoldott házi feladatoktól, hogy nem a modellek saját nyilvános interneten alapuló tudásbázisát kívánják használni, hanem saját adataikból szeretnének a nagy nyelvi modellek felhasználásával olyan eszközt fejleszteni, ami segíti megoldani az üzleti problémájukat. Ez egyúttal azt is eredményezi, hogy a feldolgozandó dokumentáció általában rendelkezik valamilyen közös tulajdonsággal, azonos típusú információk egy körével, vagy valamilyen rendezőelvvel (szerződések, ajánlatok, mérési eredmények, beszámolók), ami miatt számunkra fontos a tartalmuk, összevetése, szintetizálása, elemzése.

A KPMG saját fejlesztésű dokumentum feldolgozó rendszere ezen közös tulajdonságok alapján már képes saját maga is nagy számú releváns kérdést megfogalmazni a dokumentumok kívánatos feldolgozásához. Az ilyen rendszerek hatékony alkalmazásának alapja márpedig a jól feltett kérdés, mert a gépi tanulással felkészített rendszerek képesek csaknem 100 százalékban jó válaszokat adni a jól feltett kérdésekre, de rossz kérdésre – az emberhez hasonlóan – a nagy nyelvi rendszerek is csak rossz válaszokat adnak.

A KPMG saját rendszerét pénzügyi beszámolókon futtatva azt tapasztaltuk, hogy a gép által feltett kérdések zöme releváns, és az ezekre adott válaszok is azok. Elemezve a hasonló emberi munkafolyamatokat azt láttuk, hogy a 80-85 százalékos használati értékű elemzést adott a bevitt információkból ahhoz képest, mint amire két kolléga ennél nagyobb hatékonysággal, de körülbelül két nap alatt képes lett volna. Az első futtatás tehát nem ad tökéletes eredményt, de olyan alapot igen, ami ugyancsak töredék idő alatt emberi beavatkozással 100 százalékra emelhető, vagyis a munkatársaknak rengeteg idejük szabadul fel arra, hogy más feladatokkal foglalkozzanak.

A rendszerek hatékonysága a maguk által feltett kérdések szűrésével és javításával tovább fokozható. A KPMG rendszerén lefuttatva egy ilyen – akár több ezer dokumentumból álló – információ tömeget az alkalmazott nyelvi rendszer akár 1000-nél több kérdést is megfogalmaz, amiből érdemes a számunkra lényegteleneket törölni, a lényegeseket pedig az általunk ismert szabályok szerint pontosítani. Maradva a pénzügyi beszámolók példájánál: e szabályok egy része írott, és jól dokumentálható, mások inkább tapasztalati úton állnak az ezekkel a dokumentumokkal foglalkozók rendelkezésére: írott szabály, hogy bank tőkemegfelelési mutatójának mennyinek kell lennie, de tapasztalati elem, hogy a mutató számításának alapjait jellemzően hol találjuk meg a dokumentumban a szükséges ellenőrzéshez.

A pénzügyi beszámolókon történt futtatás alapján azt mondhatjuk, hogy a rendszer által feltett kérdések szűrése, pontosítása, kiegészítése felkészült és tapasztalt munkatársak több napos munkájának eredményeként válik pontossá.

A gépi tanulás és a nagy nyelvi rendszerek alkalmazása számos vállalati feladatra remekül alkalmazható, és hatékonyan alkalmazva sok emberi munkát szabadít fel más feladatok elvégzéséhez. Ez az álom azonban csak akkor teljesül, ha pontosan definiáljuk a bevitt dokumentumok körét, az elvégzendő feladatokat, meghatározzuk a megkívánt válaszok elvárt tartalmi elemeit és pontosságát és az adott problémával foglalkozó szakértők tapasztalatit is felhasználva segítjük a rendszert abban, amiben ő a legjobb, a nagy mennyiségű szöveges információ feldolgozásában.