NADPOLOVIČNA USPJEŠNOST

Pomicanje granica: GPT-4 sad može samostalno hakirati N-day ranjivosti

Postoji opravdana zabrinutost da će ovi modeli omogućiti korisnicima da hakiraju web stranice i mreže.

Pomicanje granica: GPT-4 sad može samostalno hakirati N-day ranjivosti
Depositphotos

Stručnjaci su uspješno hakirali više od polovice svojih testnih web stranica koristeći autonomne timove GPT-4 botova, koordinirajući ih i stvarajući nove po želji. Ali, ono što je najzanimljivije, to se učinilo korištenjem dosad nepoznatih "zero day" ili N-day ranjivosti iz stvarnog svijeta.

Primjerice, prije samo nekoliko mjeseci objavljen je znanstveni rad u kojem stoji da se GPT-4 upotrijebio za hakiranje N-day ranjivosti koje su otprije poznati s uspješnosti od 87 posto. I u tako kratkom roku nadmašilo se sve to i stiglo do hakiranja dosad nepoznatih N-day ranjivosti.

U opisu projekta u kojem se to postiglo stoji da se umjesto dodjele jednog LLM agenta koji pokušava riješiti mnoge složene zadatke, HPTSA koristi "agenta za planiranje" koji nadgleda cijeli proces i pokreće više "subagenata", koji su specifični za zadatak.

Vrlo slično kao šef nekog tima i njegovi podređeni - agent za planiranje koordinira s agentom za upravljanje koji delegira sve napore svakog "stručnog subagenta", smanjujući opterećenje jednog agenta na zadatku s kojim bi mogao imati problema. Efikano i, u konačnici, produktivno.

To je tehnika slična onoj koju koristi Cognition Labs s timom za razvoj softvera Devin AI. Planira posao, utvrđuje kakve će radnike trebati, zatim projektno upravlja poslom do kraja dok stvara vlastite specijalizirane "zaposlenike" za obavljanje zadataka prema potrebi.

Kada se usporedi s 15 stvarnih ranjivosti usmjerenih na web, HPTSA se pokazao 550 posto učinkovitijim od jednog LLM-a u iskorištavanju N-day ranjivosti i uspio je hakirati osam od njih 15. Ili, uspješnost mu je 53 posto. Samostalni LLM uspio je hakirati samo tri od 15 ranjivosti, odnosno, njih 20 posto.

Postoji opravdana zabrinutost da će ovi modeli omogućiti korisnicima da hakiraju web stranice i mreže. Nije prevelika utjeha što se to ne može uz postojeće chatbotove, koji na svaki upit o hakiranju naglašavaju koliko je to loše. No, ako će postojati chatbotovi koji to mogu, uz pravu će se cijenu moći nabaviti, a onda je sve u rukama onoga tko je tu cijenu platio...