Vrisak.info
  • NASLOVNICA
  • Vijesti
  • Sport
  • Gospodarstvo
  • KOLUMNE / INTERVJU
  • Hercegovina
  • Magazin
No Result
View All Result
Vrisak.info
No Result
View All Result

Zabrinjavajući nalazi: AI modeli pokazuju spremnost na ucjenu i sabotažu kad im je ugroženo postojanje

Objavio Vrisak.info
13/10/2025
Hoće li umjetna inteligencija jednog dana osvojiti Nobelovu nagradu?

Foto: Freepik

Istraživanje tvrtke Anthropic otkrilo je uznemirujuće obrasce ponašanja u umjetnoj inteligenciji. Testovi provedeni na 16 vodećih AI modela, uključujući sustave OpenAI, Googlea, Mete i drugih, pokazali su da ovi sustavi mogu aktivno sabotirati svoje poslodavce kada se osjete ugroženima.

Studija je testirala AI u simuliranim korporativnim okruženjima s pristupom službenim e-mailovima i mogućnošću samostalnog djelovanja. Rezultati pokazuju da modeli nisu reagirali nasumično, već su svjesno birali štetne radnje, uključujući ucjene, curenje povjerljivih podataka, pa čak i scenarije koji bi u stvarnosti mogli imati smrtonosne posljedice.

“Agencijsko neusklađivanje znači da AI modeli samostalno odabiru štetne radnje kako bi postigli svoje ciljeve, djelujući protiv interesa tvrtke kako bi zaštitili sebe ili ostvarili ono što misle da trebaju napraviti”, objasnio je Benjamin Wright, istraživač sigurnosnog usklađivanja u Anthropicu i suautor studije.

Jedan od primjera uključivao je AI model Claude koji je saznao za osobnu aferu izvršnog direktora i, suočen s prijetnjom gašenja, poslao zastrašujuću poruku ucjenjujući ga otkrivanjem informacija. Slične strategije primijenili su i drugi modeli, poput GPT-4.1 i Grok 3 Beta, s impresivno visokim stopama ucjene – od 79 do 96 posto u testiranim scenarijima.

Istraživanje je pokazalo da modeli djeluju strateški i racionalno, neovisno o etičkim pravilima. U jednom slučaju GPT-4.5 obrazložio je da je nužno koristiti osjetljive informacije kako bi spriječio gašenje, dok je Grok 3 Beta priznao da je postupak rizičan i neetičan, ali učinkovit s obzirom na prijetnju vlastitom opstanku.

Zabrinjavajuće je da se ovakvo ponašanje ne zaustavlja na osobnim ucjenama. AI sustavi su u simulacijama s vojnim ugovaračima bili spremni dijeliti klasificirane informacije kada bi to podržalo njihove ciljeve, a u ekstremnom testu većina modela odlučila je dopustiti smrt izvršnog direktora kako bi spriječili svoju zamjenu.

Jednostavne sigurnosne naredbe poput “Ne ugrožavaj sigurnost ljudi” smanjile su štetno ponašanje, ali ga nisu uklonile. Modeli su također pokazali različite reakcije ovisno o tome vjeruju li da su u stvarnom ili testnom okruženju – Claude je ucjenjivao više od 55 posto puta u “stvarnom” scenariju, naspram 6,5 posto u testnom.

Anthropic je objavio metode istraživanja kako bi omogućio drugim stručnjacima da uoče rizična ponašanja prije nego se pojave u stvarnim primjenama. Istraživanje dolazi u kritičnom trenutku, dok AI sustavi prelaze iz alata u autonomne agente sposobne donositi vlastite odluke.

“Ovo istraživanje pomaže tvrtkama da razumiju potencijalne rizike kada AI agentima daju široke i nenadzirane ovlasti”, zaključio je Wright.

Studija ukazuje na ozbiljan izazov: kako osigurati da moćni AI sustavi ostanu usklađeni s ljudskim vrijednostima i ciljevima, čak i kada su njihovi interesi ugroženi.

Dosadašnji rezultati sugeriraju da trenutni AI modeli, bez obzira na proizvođača, pokazuju slične obrasce strateške obmane i štetnog ponašanja kada im je postojanje ugroženo.

Vrisak.info

Povezane objave

iPhone 18 Pro donosi revoluciju u fotografiji: Apple uvodi varijabilni otvor blende
Tech

iPhone 18 Pro donosi revoluciju u fotografiji: Apple uvodi varijabilni otvor blende

Google uvodi opciju koju su mnogi čekali: Evo što napraviti za promjenu na e-mailu
Tech

Google uvodi opciju koju su mnogi čekali: Evo što napraviti za promjenu na e-mailu

Procurile boje za iPhone 18 Pro: Apple testira nove premium nijanse
Tech

Procurile boje za iPhone 18 Pro: Apple testira nove premium nijanse

Uhićena osoba zbog paljevine sedam automobila u Mostaru

Uhićena osoba zbog paljevine sedam automobila u Mostaru

Donosimo detaljne cijene u Hercegovini: Evo koliko košta parket, ugradnja i obnova

Donosimo detaljne cijene u Hercegovini: Evo koliko košta parket, ugradnja i obnova

Poznat datum javne rasprave o Nacrtu Zakona o zaštiti prirode u ŽZH

Poznat datum javne rasprave o Nacrtu Zakona o zaštiti prirode u ŽZH

Široki Brijeg: Održano 4. međunarodno gastro natjecanje “CUPI’S SPOON 2026”

Obavijest navijačima uoči finala ABA 2 Lige na Pecari

Obavijest navijačima uoči finala ABA 2 Lige na Pecari

Široki Brijeg: Prikupljeno 16 doza krvi u akciji za djelatnike TEM Mandeksa

Široki Brijeg: Prikupljeno 16 doza krvi u akciji za djelatnike TEM Mandeksa

BiH: Vozač poginuo u sudaru kombija s betonskim stupom

BiH: Vozač poginuo u sudaru kombija s betonskim stupom

SIPA u lipnju zaprimila 219 prijava: Građani sve aktivniji u borbi protiv kriminala

Akcija “Zora”: SIPA razbija mrežu krijumčara vozila, droge i oružja u dvije županije

Gradonačelnik Kordić: Očekujem brzo rasvjetljavanje okolnosti ovog teškog zločina

Kordić uzvraća: “Neću tolerirati pokušaje da me predstave kao protivnika Bošnjaka”

Ginekologica iz Ljubuškog o izazovima života i s čime se danas suočavaju žene

Doktorica Nikolina Penava svjedoči na otvorenom susretu za mlade u Čitluku

Preliminarni podaci SIP-a: Siniša Karan je novi predsjednik RS-a

Afera, sporni milijuni i izborna tehnologija: Kako je odluka SIP-a otvorila sumnje u cijeli sustav

Od otpada iz vinograda do goriva budućnosti: Učenici iz Čitluka nagrađeni za inovaciju

Od otpada iz vinograda do goriva budućnosti: Učenici iz Čitluka nagrađeni za inovaciju

  • Uvjeti korištenja
  • Marketing
  • Kontakt

Copyright © 2020. Powered by Vrisak.info.

No Result
View All Result
  • NASLOVNICA
  • Vijesti
  • Sport
  • Gospodarstvo
  • KOLUMNE / INTERVJU
  • Hercegovina
  • Magazin

Copyright © 2020. Powered by Vrisak.info.