Link: https://www.ictbusiness.info / vijesti / openai-lansira-jezicni-model-otvorenih-tezina

OpenAI lansira jezični model „otvorenih težina“

08.04.2025.

U nastojanju da poveća angažman s razvojnim programerima, istovremeno balansirajući zabrinutosti oko sigurnosti i pristupačnosti, OpenAI planira lansirati jezični model otvorenih težina. Ovaj potez označava odmak od pristupa zatvorenog koda koji je dosad koristio proizvođač ChatGPT-a.

Za razliku od modela otvorenog koda, koji pružaju puni pristup izvornom kodu i podacima za obuku, modeli otvorenih težina čine dostupnima samo istrenirane parametre, poznate kao "težine". To omogućava razvojnim programerima da eksperimentiraju i usavršavaju mogućnosti AI modela, dok temeljne kodove zadržavaju pod kontrolom OpenAI-ja.

Izvršni direktor Sam Altman najavio je lansiranje u objavi na X-u, izjavivši: "Uzbuđeni smo vidjeti što će razvojni programeri izgraditi i kako će ga velike tvrtke i vlade koristiti tamo gdje preferiraju sami pokretati model." Ovaj potez označava prvi OpenAI-jev jezični model otvorenih težina od izlaska GPT-2 2019. godine.

Tvrtka također planira održati niz događaja za razvojne programere kako bi demonstrirala prototipove i prikupila povratne informacije prije finalizacije razvoja modela. Prvi od tih događaja održat će se u San Franciscu u nadolazećim tjednima, a dodatni sastanci planirani su u Europi i azijsko-pacifičkoj regiji.

Ova najava dolazi nakon eksplozije popularnosti ChatGPT-a, pri čemu je chatbot OpenAI-ja navodno dobio milijun korisnika u jednom satu za svoj model GPT-4o. Altman je na X-u otkrio "biblijsku potražnju" za najnovijim značajkama chatbota, uključujući nove mogućnosti generiranja slika koje korisnicima omogućuju stvaranje i uređivanje slika izravno unutar chatbota.

Popularna upotreba ove značajke dovela je do toga da su korisnici generirali slike u stilu japanske animacijske tvrtke Studio Ghibli, pri čemu su tisuće umjetničkih djela generiranih umjetnom inteligencijom preplavile društvene mreže. Ogromna potražnja navela je OpenAI da uvede privremena ograničenja na generiranje slika. Altman je napomenuo da su GPU resursi tvrtke pod opterećenjem te da su ograničenja brzine bila nužna kako bi se osigurala stabilna izvedba dok tvrtka radi na poboljšanju učinkovitosti.

Pristup otvorenih težina predstavlja kompromis. Omogućuje veću fleksibilnost i inovaciju od strane vanjskih programera u usporedbi s potpuno zatvorenim modelima, ali zadržava ključnu intelektualnu vlasništvo i kontrolu nad temeljnom tehnologijom unutar OpenAI-ja.

Nekoliko je vjerojatnih razloga za ovaj zaokret u strategiji OpenAI-ja jer davanjem pristupa težinama modela, OpenAI se nada potaknuti širu primjenu svoje tehnologije i prikupiti vrijedne povratne informacije od razvojnih programera koji će eksperimentirati s modelom u različitim scenarijima.

Potpuno otvoreni modeli mogu predstavljati veći rizik u pogledu zlouporabe (npr., za generiranje dezinformacija ili zlonamjernog sadržaja). Pristup otvorenih težina omogućuje OpenAI-ju da zadrži kontrolu nad temeljnom arhitekturom i potencijalno implementira sigurnosne mjere na toj razini.

Tržište velikih jezičnih modela postaje sve konkurentnije, s pojavom snažnih modela otvorenog koda (npr., iz Meta AI-ja i drugih istraživačkih grupa). Lansiranje modela otvorenih težina moglo bi biti način da OpenAI ostane relevantan i privuče širi krug korisnika.

OpenAI se nada da će davanjem pristupa svojim modelima potaknuti inovacije u različitim industrijama i primjenama koje oni sami možda nisu predvidjeli.

Ovaj potez OpenAI-ja vjerojatno će imati značajan utjecaj na tržište velikih jezičnih modela jer će se dogoditi demokratizacija pristupa. Modeli otvorenih težina olakšavaju manjim tvrtkama, startupovima i istraživačkim institucijama pristup naprednim AI mogućnostima bez potrebe za ogromnim ulaganjima u obuku vlastitih modela od nule.

Programeri će moći brže prototipirati i razvijati nove aplikacije i usluge koristeći postojeće, visokokvalitetne modele kao temelj. Pristup „težinama“ omogućuje programerima da finetuniraju model na vlastitim, specifičnim skupovima podataka, što može značajno poboljšati performanse u nišnim aplikacijama.

Uz sve to, širi dostupnost moćnih jezičnih modela također postavlja važna pitanja o odgovornosti za generirani sadržaj, potencijalnoj pristranosti modela i etičkim implikacijama njihove upotrebe. OpenAI će vjerojatno morati razviti smjernice i alate za odgovornu upotrebu svojih modela otvorenih težina.

Spominjanje ogromne popularnosti GPT-4o i posebno značajke generiranja slika naglašava rastuću potražnju za multimodalnim AI modelima koji mogu obrađivati i generirati različite vrste sadržaja (tekst, slike, zvuk, video). Privremena ograničenja na generiranje slika ukazuju na značajne računalne resurse potrebne za podršku takvim moćnim modelima i potencijalne izazove u skaliranju infrastrukture kako bi se zadovoljila nagla potražnja korisnika. Studio Ghibli stil generiranja slika postao je popularan primjer kreativne primjene ovih novih mogućnosti.

Ukratko, lansiranje jezičnog modela otvorenih težina od strane OpenAI-ja predstavlja značajan korak prema otvaranju pristupa njihovoj naprednoj AI tehnologiji, uz zadržavanje kontrole nad ključnim aspektima modela. Ovaj potez ima potencijal potaknuti inovacije i širu primjenu LLM-ova, ali također nosi sa sobom važne implikacije za sigurnost, etiku i odgovornost u korištenju umjetne inteligencije.

Odluka OpenAI-ja da lansira jezični model otvorenih težina značajan je korak koji odražava evoluciju u pristupu razvoju i distribuciji velikih jezičnih modela (LLM-ova). Evo nekoliko ključnih aspekata i relevantnih informacija o ovoj temi:

* Otvorene težine: Omogućuju programerima pristup istreniranim numeričkim parametrima modela. Ti parametri predstavljaju naučena znanja modela tijekom procesa obuke na ogromnim količinama podataka. Programeri mogu koristiti te težine za pokretanje modela, finetuning (dodatnu obuku na specifičnim podacima) ili integraciju u vlastite aplikacije. Međutim, arhitektura modela (temeljni kod) i podaci korišteni za obuku ostaju vlasništvo OpenAI-ja.

* Otvoreni kod: Podrazumijeva da je cjelokupni izvorni kod modela, uključujući arhitekturu i često (ali ne uvijek) detalje o podacima za obuku, javno dostupan i može se slobodno koristiti, mijenjati i distribuirati.