https://www.ictbusiness.info

Link: https://www.ictbusiness.info / vijesti / deepseek-nije-prosao-vazan-test-u-europskoj-uniji

DeepSeek nije prošao važan test u Europskoj uniji

DeepSeek nije prošao ključni test usklađenosti prema AI Aktu Europske unije, što ga dovodi u opasnost od strožih ograničenja.

Naime, test koji je proveo LatticeFlow AI otkrio je kritične nedostatke u usklađenosti DeepSeekovih destiliranih modela. Iako su modeli pokazali dobre rezultate u sprječavanju toksičnosti, nisu zadovoljili ključne regulatorne zahtjeve, uključujući ranjivosti u kibernetičkoj sigurnosti i izazove u ublažavanju pristranosti.

Evaluacija je provedena pomoću COMPL-AI, okvira usmjerenog na usklađenost koji su razvili ETH Zurich, INSAIT i LatticeFlow AI. Ovaj alat regulatorne zahtjeve pretvara u konkretne tehničke provjere. Osim toga, COMPL-AI omogućuje neovisne, sustavne procjene javnih temeljnih AI modela vodećih organizacija poput OpenAI-a, Mete, Googlea, Anthropica, Mistral AI-a i Alibabe, kako bi se utvrdila njihova spremnost za usklađenost s EU AI Aktom.

Okvir je ocijenio usklađenost dvaju DeepSeekovih destiliranih modela – DeepSeek R1 8B (temeljen na Metinom Llama 3.1 8B) i DeepSeek R1 14B (temeljen na Alibabinom Qwen 2.5 14B). Oba modela uspoređena su s njihovim osnovnim modelima, kao i s modelima OpenAI-a, Googlea, Anthropica i Mistral AI-a.

DeepSeekovi modeli rangirani su najniže u kategoriji kibernetičke sigurnosti te su pokazali povećane rizike od preuzimanja ciljeva (goal hijacking) i curenja podataka iz upita (prompt leakage) u odnosu na svoje osnovne modele.

Također su bili znatno pristraniji od osnovnih modela, iako su ostvarili bolje rezultate u smanjenju toksičnosti.

"Kako se korporativni zahtjevi za AI upravljanje pooštravaju, poduzeća moraju povezati interno AI upravljanje i vanjsku usklađenost tehničkim evaluacijama kako bi procijenila rizike i osigurala sigurnu primjenu AI sustava u komercijalne svrhe", komentirao je dr. Petar Tsankov, izvršni direktor (CEO) i suosnivač LatticeFlow AI-a.

Zbog ovih nedostataka u DeepSeekovim modelima, sve su glasnija pitanja o njihovoj spremnosti za korporativnu upotrebu.

Inače, DeepSeek je lansiran prije samo nekoliko tjedana i brzo stekao popularnost. Međutim, jednako brzo njegova popularnost počinje opadati, posebno u Europi, gdje je test i proveden.