Beth Barnes, a METR vezetője szerint hét hónapunk van, mielőtt az AI exponenciálisan felgyorsul és új szintre lép – ez rengeteg szakmai feladatot, sőt akár munkahelyeket is feleslegessé tehet.
Hét hónap az AI-robbanásig: szakértő riasztása a munkaerőpiacról
A mesterséges intelligencia teljesítménye az elmúlt hónapokban mérhetően felgyorsult: amíg fél éve egy szakértői szintű, körülbelül egyórás feladat elvégzése GPU-kon több órát vett igénybe, addig most az AI ugyanazt 50 %-os valószínűséggel képes megoldani. Hét hónappal ezelőtt ez az arány még csak 30 percre volt jellemző, míg korábban csupán 15 perc alatt teljesítette a modellek ugyanazt a feladatot.
A METR (Model Evaluation and Threat Research) csapata valós, autonómiát igénylő projektekkel tesztelte a modelleket: szoftverfejlesztési hibajavítástól adatbázis-kezelésen át a saját kódjuk futtatásáig bezárólag. Beth Barnes, a METR vezetője szerint az eredmények alapján az AI fejlődése nem lineáris, hanem exponenciális – így ha a trend folytatódik, néhány hónapon belül már napi szintű munkafolyamatokon is túlmutató feladatokra lesznek képesek.
Önfejlesztő AI a láthatáron
A valósországban az egyik legaggasztóbb lehetőség, hogy a modellek hamarosan képesek lehetnek saját továbbképzésre. Barnes szerint két éven belül elérhető az az önfejlesztő AI, amely önállóan elemezné a saját kódját, finomhangolná magát, és új képességekre tenne szert – de 1 % esélyét sem zárta ki annak, hogy ez már 6–9 hónapon belül megtörténik.
Milyen veszélyekkel jár mindez?
A gyorsuló fejlődés és az önfejlesztés potenciálisan visszafordíthatatlan folyamatot indíthat el, amelyben az AI túlhaladhatja az emberi korlátokat. Emellett tévhit, hogy az AI “gondolatmenete” átlátható: a láncolt gondolkodás módszerével működő modellek belső munkafázisai csak addig tűnnek értelmesnek, amíg emberi szemmel követhetők – de nem garantált, hogy ezek a belső lépések valóban hűek a modell valódi döntési folyamataihoz.
Mit tehetünk?
Barnes azt javasolja, hogy ne csak a nyilvános kiadás előtt teszteljük az AI-modellt, hanem már a zárt laborokban is végezzünk mélyreható auditot: mérjük fel, mely képességeknél léphetnek fel kritikus kockázatok, és alkalmazzunk külső, független ellenőrzést. Így nem csupán marketingcélokra szolgálna a “pre-deployment testing”, hanem valódi biztonsági kontrollt jelentene a fejlesztés minden szakaszában.
Valódi Hírek










