Teljesen felforgatott egy területet a Google új fejlesztése: valahol már most látványos a hatás

A ChatGPT debütálása óta időről időre – jellemzően egyre gyakrabban – jelennek meg olyan AI-eszközök, amelyek időszakosan hatalmas figyelmet kapnak a nyilvánosságban és dominálják az internetezők figyelmét. A Google nemrégiben a Nano Banana névre keresztelt képgeneráló modelljének új, Pro változatával állt elő, amelyet ráadásul ingyenesen elérhetővé tett a nagyközönség számára. Az egyik legnépszerűbb, és sokak által az egyik legjobbnak tartott képgenerátor az internetes keresésekben iránti érdeklődés az internetes keresésekben is meglátszott.

Nagy kihívó érkezett a képgenerálók piacára
A szöveges feladatok elvégzésére képes LLM-ek elterjedését követően az képgeneráló AI-modellek is nagy fókuszt kaptak mind a technológiai vállalatok, mind a felhasználók oldaláról. A képgenerálásra használható mesterségesintelligencia-alkalmazások látványos fejlődésen mentek keresztül az elmúlt években. Az első, szélesebb körben is ismertté vált, 2022 óta elérhető Midjourney elterjedését követően egyre több kisebb gyártó modelljei (mint például az Ideogram, vagy a Stable Diffusion) értek el sikereket a képi AI-megoldások terén.

Ugyan az évekkel ezelőtt megjelenő modellek gyakran vétettek hatalmas hibákat egyes generálások során, a technológia folyamatosan fejlődött és a nagy AI-fejlesztő cégek, így az Elon Musk által vezetett xAI, a Google és az OpenAI is piacra dobták a képgeneráló alkalmazásaikat, gyakran a chatbotok felületére integrálva.

Az OpenAI az idei évben nagy visszhangot keltett a képgeneráló megoldásával, mikor a közösségi médiát szabályosan elárasztották a hagyományos fotók AI segítségével módosított japán anime stílusú változatai. A közösségi médiaplatformokon terjedő trend annyira népszerű volt, hogy a ChatGPT heti felhasználói száma rögtön rekordmagasra ugrott a következőkben.

Az elmúlt hetekben a Google képgenerélü modellje, a Nano Banana modell kapott nagyobb visszhangot. Ennek oka, hogy a szeptemberben debütáló képgenerátort a gyártó november végétől az új nagy nyelvi modelljével (a Gemini 3 és Gemini 3 Pro) együtt ingyenesen is elérhetővé tették, a Gemini alkalmazáson keresztül.

A bejelentés szerint a népszerű képgeneráló modell új verziója az élethűbb képek mellett képes akár komplexebb infografikák elkészítésére is, valamint az generátorok egyik Achilles-sarkának tekintett, képre helyezett szövegek pontosabb generálására is.

Tovább a cikkre: portfolio.hu és Nano Banana