Umjetna inteligencija još uvijek ne zna razmišljati kao programeri
Novo istraživanje Microsoft Researcha, odjela za istraživanje i razvoj Microsofta, otkriva da modeli, uključujući Anthropicov Claude 3.7 Sonnet i OpenAI-jev o3-mini, ne uspijevaju otkloniti mnoge probleme u referentnom testu za razvoj softvera nazvanom SWE-bench Lite.