NOVI ISKORAK

OpenAI predstavio Operator: Može surfati web stranicama umjesto korisnika

Kao i kod ranijih istraživačkih verzija, OpenAI upozorava da je Operator još uvijek u ranoj fazi i ima ograničenja te da neće uvijek pouzdano funkcionirati u svim scenarijima.

OpenAI predstavio Operator: Može surfati web stranicama umjesto korisnika
Depositphotos

OpenAI je započeo s predstavljanjem novog alata nazvanog Operator, koji može navigirati unutar browsera. Softver pokreće ono što kompanija naziva agentom za korištenje računala (Computer-Using Agent).

"CUA je obučen za interakciju s grafičkim korisničkim sučeljima (GUI) - izbornicima i tekstualnim poljima koje ljudi vide na ekranu - baš kao što to rade ljudi. To mu daje fleksibilnost za obavljanje digitalnih zadataka bez korištenja OS- ili web-specifičnih API-ja", navode u OpenAI-ju.

Trenutna verzija Operatora temelji se na GPT-4o modelu. Kombinira vizualne mogućnosti tog algoritma s naprednim zaključivanjem koje je obučeno putem pojačanog učenja (eng. reinforcement learning). Operator ima sposobnost razlaganja zadataka na više koraka i adaptivnog samoispravljanja kad se pojave izazovi. Prema OpenAI-ju, ta sposobnost predstavlja sljedeću fazu u razvoju umjetne inteligencije.

Kao i kod ranijih istraživačkih verzija, OpenAI upozorava da je Operator još uvijek u ranoj fazi i ima ograničenja te da neće uvijek pouzdano funkcionirati u svim scenarijima. Primjerice, ovisno o složenosti zadatka i sučelja, agent uvelike koristi od toga da korisnik izdvoji nekoliko dodatnih trenutaka za pisanje detaljnijeg uputa. Operator će prepustiti kontrolu korisniku ako zapne na zadatku. Također će prepustiti kontrolu kad god web stranica zatraži osjetljive podatke, uključujući vjerodajnice (eng. credentials) za prijavu. Kompanija navodi da je alat dizajniran tako da odbija štetne zahtjeve i blokira nedopušteni sadržaj.

Operator će u početku biti dostupan pretplatnicima na ChatGPT Pro, koja stoji 200 dolara mjesečno. Također, OpenAI surađuje s kompanijama poput Instacarta kako bi ponudila agenta na njihovim platformama, no i za tu integraciju bit će potrebna ChatGPT Pro pretplata.

Operator se pridružuje sve većem popisu AI agenata koji mogu navigirati browserima ili cijelim operativnim sustavom. Anthropic je prvi ponudio tu mogućnost s izdavanjem svog Claude 3.5 Sonnet modela u listopadu, a nedavno je to učinio i Google s Gemini 2.0 modelom te projektom Mariner.