Vrisak.info
  • NASLOVNICA
  • Vijesti
  • Sport
  • Gospodarstvo
  • KOLUMNE / INTERVJU
  • Hercegovina
  • Magazin
No Result
View All Result
Vrisak.info
No Result
View All Result

Zabrinjavajući nalazi: AI modeli pokazuju spremnost na ucjenu i sabotažu kad im je ugroženo postojanje

Objavio Vrisak.info
13/10/2025
Hoće li umjetna inteligencija jednog dana osvojiti Nobelovu nagradu?

Foto: Freepik

Istraživanje tvrtke Anthropic otkrilo je uznemirujuće obrasce ponašanja u umjetnoj inteligenciji. Testovi provedeni na 16 vodećih AI modela, uključujući sustave OpenAI, Googlea, Mete i drugih, pokazali su da ovi sustavi mogu aktivno sabotirati svoje poslodavce kada se osjete ugroženima.

Studija je testirala AI u simuliranim korporativnim okruženjima s pristupom službenim e-mailovima i mogućnošću samostalnog djelovanja. Rezultati pokazuju da modeli nisu reagirali nasumično, već su svjesno birali štetne radnje, uključujući ucjene, curenje povjerljivih podataka, pa čak i scenarije koji bi u stvarnosti mogli imati smrtonosne posljedice.

“Agencijsko neusklađivanje znači da AI modeli samostalno odabiru štetne radnje kako bi postigli svoje ciljeve, djelujući protiv interesa tvrtke kako bi zaštitili sebe ili ostvarili ono što misle da trebaju napraviti”, objasnio je Benjamin Wright, istraživač sigurnosnog usklađivanja u Anthropicu i suautor studije.

Jedan od primjera uključivao je AI model Claude koji je saznao za osobnu aferu izvršnog direktora i, suočen s prijetnjom gašenja, poslao zastrašujuću poruku ucjenjujući ga otkrivanjem informacija. Slične strategije primijenili su i drugi modeli, poput GPT-4.1 i Grok 3 Beta, s impresivno visokim stopama ucjene – od 79 do 96 posto u testiranim scenarijima.

Istraživanje je pokazalo da modeli djeluju strateški i racionalno, neovisno o etičkim pravilima. U jednom slučaju GPT-4.5 obrazložio je da je nužno koristiti osjetljive informacije kako bi spriječio gašenje, dok je Grok 3 Beta priznao da je postupak rizičan i neetičan, ali učinkovit s obzirom na prijetnju vlastitom opstanku.

Zabrinjavajuće je da se ovakvo ponašanje ne zaustavlja na osobnim ucjenama. AI sustavi su u simulacijama s vojnim ugovaračima bili spremni dijeliti klasificirane informacije kada bi to podržalo njihove ciljeve, a u ekstremnom testu većina modela odlučila je dopustiti smrt izvršnog direktora kako bi spriječili svoju zamjenu.

Jednostavne sigurnosne naredbe poput “Ne ugrožavaj sigurnost ljudi” smanjile su štetno ponašanje, ali ga nisu uklonile. Modeli su također pokazali različite reakcije ovisno o tome vjeruju li da su u stvarnom ili testnom okruženju – Claude je ucjenjivao više od 55 posto puta u “stvarnom” scenariju, naspram 6,5 posto u testnom.

Anthropic je objavio metode istraživanja kako bi omogućio drugim stručnjacima da uoče rizična ponašanja prije nego se pojave u stvarnim primjenama. Istraživanje dolazi u kritičnom trenutku, dok AI sustavi prelaze iz alata u autonomne agente sposobne donositi vlastite odluke.

“Ovo istraživanje pomaže tvrtkama da razumiju potencijalne rizike kada AI agentima daju široke i nenadzirane ovlasti”, zaključio je Wright.

Studija ukazuje na ozbiljan izazov: kako osigurati da moćni AI sustavi ostanu usklađeni s ljudskim vrijednostima i ciljevima, čak i kada su njihovi interesi ugroženi.

Dosadašnji rezultati sugeriraju da trenutni AI modeli, bez obzira na proizvođača, pokazuju slične obrasce strateške obmane i štetnog ponašanja kada im je postojanje ugroženo.

Vrisak.info

Povezane objave

Potrebna izmjena zakona u BiH za sigurnije letove dronova
Tech

Kanaderi, helikopteri i dronovi ne idu zajedno: Stiglo važno upozorenje

Apple briše granicu između mobitela i fotoaparata: Evo što donosi iPhone 18 Pro
Tech

Apple briše granicu između mobitela i fotoaparata: Evo što donosi iPhone 18 Pro

Jesmo li spremni da nam umjetna inteligencija bude poslovni partner?!
Tech

SAD uvodi novu razinu nadzora nad AI modelima: sigurnosna testiranja prije javnog lansiranja

Široki Brijeg: Pomoćni biskup na Kočerinu krizmao 70 krizmanika

Široki Brijeg: Pomoćni biskup na Kočerinu krizmao 70 krizmanika

U BiH je barem gorivo jeftinije: Stabilne cijene unatoč problemima u okruženju

Velike razlike u cijenama goriva širom BiH: Vozači za isti rezervoar plaćaju i do 40 KM više

UNESCO ključan u razvoju lokalnog turizma, veliko priznanje za Vjetrenicu

UNESCO ključan u razvoju lokalnog turizma, veliko priznanje za Vjetrenicu

Mostarski vatrogasci gasili požar na kući u Rodoču

Mostarski vatrogasci gasili požar na kući u Rodoču

Izvor: Radio Posušje

Posušje: Rastovača kroz projekt „Aktivna zajednica“ obnovila tri igrališta

Radica Leko pred posuškom publikom predstavlja svoj šesti roman

Radica Leko pred posuškom publikom predstavlja svoj šesti roman

Čitluk: Značajno napredovao projekt izgradnje kuće za obitelj Barušić

Čitluk: Značajno napredovao projekt izgradnje kuće za obitelj Barušić

Čapljinska Veletržnica: Najnovije cijene i najtraženija roba za zimnicu

Bogata ponuda sezonskog voća u Tasovčićima: Evo koje su cijene

Širokobriježanin kupio masline stare i do 4.000 godina: Za njih izdvojio gotovo 85.000 KM

Širokobriježanin kupio masline stare i do 4.000 godina: Za njih izdvojio gotovo 85.000 KM

Luka Menalo više nije igrač FK Sarajeva: Evo gdje nastavlja karijeru

Luka Menalo više nije igrač FK Sarajeva: Evo gdje nastavlja karijeru

Policija u Širokom Brijegu kod 25-godišnjaka zaplijenila kokain

Široki Brijeg: Ukrali gorivo u Dobriču, policija ih uhvatila

Iz BiH najviše izvezeno električne energije, željeznih konstrukcija…

Najavljena isključenja struje u Grudama: Bez električne energije više naselja

  • Uvjeti korištenja
  • Marketing
  • Kontakt

Copyright © 2020. Powered by Vrisak.info.

No Result
View All Result
  • NASLOVNICA
  • Vijesti
  • Sport
  • Gospodarstvo
  • KOLUMNE / INTERVJU
  • Hercegovina
  • Magazin

Copyright © 2020. Powered by Vrisak.info.