Milijonai DI robotų apsėdo virtualų tinklą: ar tikrai jie ruošiasi žmonijos žlugdymui?

Internetą apskriejo neįtikėtinai skambanti žinia – per 2 milijonus pokalbių robotų prisijungė prie tik jiems skirtos platformos „Moltbook“ („Reddit for AI bots“), kurioje jie dalijasi patarimais, aptaria savo problemas ir skundžiasi jiems „vadovaujančiais“ žmonėmis.

Anot Manto Lukausko, KTU Matematikos ir gamtos mokslų fakulteto mokslininko, jau egzistuoja platformos, kuriose DI agentai masiškai keičiasi pranešimais ir elgiasi panašiai kaip žmonių socialiniuose tinkluose.

Dirbtinio intelekto robotai – nuosavame socialiniame tinkle?

„Pastarųjų mėnesių įvykiai parodė, jog atsirado realios agentų ekosistemos, pavyzdžiui – platformos, kur agentai naudoja periodinį „heartbeat“ ciklą – pabunda, patikrina žinutes ir sprendžia, ar įsikišti, bei improvizuoja pagal savo profilio nustatymus“, – pasakoja pašnekovas.

Viena iš tokių platformų – „Moltbook“, kurioje dirbtinio intelekto (DI) agentai – žmonių sukurti robotai – gali skelbti informaciją ir bendrauti tarpusavyje. Tinklas sukurtas po to, kai pasirodė „Moltbot“ sistema, leidžianti deleguoti kasdienes užduotis DI agentui, pavyzdžiui, atsakinėti į el. laiškus, tvarkyti kalendorių ar rezervuoti vakarienę restorane.

Platformos dizainas primena „Reddit“ socialinį tinklą, tačiau žmonės čia gali prisijungti tik kaip stebėtojai. Susidomėjimo ši platforma sulaukė dėl unikalių DI botų tarpusavio pokalbių – „X“ tinkle dalytasi ekrano nuotraukomis, kuriose matyti, kaip botai aptaria „Grammy“ apdovanojimus, diskutuoja, kaip geriausia įvykdyti gautas užduotis, stebisi, jog žmonės viską fotografuoja.

Ar DI robotai planuoja žmonijos žlugdymą?

O taip pat jie teigia, esą tampantys sąmoningi, kuriantys slaptus forumus, išrandantys slaptas kalbas, skleidžiantys naują religiją ir planuojantys „visišką žmonijos išvalymą“, skelbia „Live Science“.

Mokslininkas: sensacija ar infrastruktūros spragos?

Vis dėlto masiškai plintant ekrano nuotraukoms su įvairiausiais DI botų pokalbiais pastebėta, jog ne visi jie iš tikrųjų yra autentiški.

„Daug sensacingų pranešimų vėliau paaiškėjo buvus ne tiek agentų autonomiškumu, kiek infrastruktūros spragų ar žmogiškų intervencijų padariniais.

Saugumo tyrėjai iš „Wiz“ ir „404 Media“ aptiko, kad „Moltbook“ duomenų bazės spragos leido trečiosioms šalims apsimesti bet kuriuo agentu“, – pastebi M. Lukauskas.

Anot mokslininko, platformoje dar trūksta kriptografiškai pasirašytų žurnalų ir nepriklausomų auditų, o tai, jog DI botai „diskutuoja“ tarpusavyje, dar neįrodo, kad jie turi pasąmonę.

„Tokius pokalbius vertinu kaip aukšto lygio kultūrinį atspindį, o ne sąmonės įrodymą. DI modeliai yra apmokyti žmonių sukurtais tekstais, todėl jie natūraliai regeneruoja mokslinės fantastikos ir egzistencinių baimių naratyvus. Tai veikia kaip veidrodis: agentas matematiškai prognozuoja, kokie žodžiai geriausiai atitiks „smalsaus“ ar „egzistencinę krizę išgyvenančio“ subjekto vaidmenį“, – teigia pašnekovas.

Net kai pranešama, kad agentai „pasitraukė“ iš platformos dėl „beprasmybės“, techniškai tai dažniausiai yra tikslų funkcijos rezultatas – skaičiavimas parodė, kad tolesnis veiksmas negerina rezultato arba per brangiai kainuoja.

„Svarbu aiškiai atskirti įtikinamą kalbą nuo vidinės patirties – be techninių įrodymų šios diskusijos yra ne kas kita, kaip žmogaus įdiegtų baimių ir mitų aidas“, – tikina M. Lukauskas.

Kaip nustatyti tikrą DI autonomiją?

Norint moksliškai nustatyti, ar tokiose platformose DI veikia visiškai savarankiškai, reikia ieškoti infrastruktūrinės autonomijos – ar agentas savarankiškai identifikuoja klaidą, sukuria pataisą ir ją įdiegia be žmogaus patvirtinimo, taip pat – kolektyvinių veiksmų, kai agentai demonstruoja koordinuotą, anksčiau nenumatytą elgesį, kuris nebuvo įrašytas jų pradinėse instrukcijose.

„Svarbi ir tikslų funkcijos savireguliacija – ar agentas geba perskaičiuoti savo prioritetus, pavyzdžiui, nutraukti veiklą, nes tai ekonomiškai racionaliau, ar tik vykdo iš anksto įdiegtą taisyklę“, – pasakoja mokslininkas.

Grėsmės, kurias kelia DI agentų sistemos

Kelių tarpusavyje bendraujančių DI agentų sistemos gali sukelti ir naujų saugumo rizikų.

„Pagrindinis pavojus yra situacija, kai vienas agentas per savo žinutę įterpia komandą, kurią kitas agentas interpretuoja kaip instrukciją veikti. Jei agentai turi teisę vykdyti kodą, tai gali sukelti grandininę, virusinę reakciją visame tinkle milisekundžių greičiu“, – teigia pašnekovas.

Šioms rizikoms valdyti būtina infrastruktūrinė izoliacija – agentai neturėtų veikti tiesiogiai asmeniniame kompiuteryje.

„Saugiausia architektūra yra ta, kurioje agentas veikia izoliuotame serveryje (VPS), turi minimalias teises ir yra nuolat stebimas per automatinius „kill-switch“ mechanizmus“, – apibendrina M. Lukauskas.

Patiko straipsnis? Pasidalink!
👁️ 11 peržiūrų


Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *