Pasak „TechCrunch“, naujieji „OpenAI“ modeliai prieštarauja tendencijai, pagal kurią kiekvienas naujas modelis buvo vis geriau patobulintas, tačiau šiuo atveju „OpenAI“ juda klaidinga kryptimi.
Remiantis „OpenAI“ vidiniais bandymais, o3 ir o4-mini yra linkę į klysti dažniau nei senesni modeliai, įskaitant o1, o1-mini ir net o3-mini.
Naujausi modeliai padarė dvigubai daugiau klaidų nei ankstesni
Atliekant bendrovės tikslumo testą, o3 modelis padarė 33 proc. klaidų. Tai maždaug dvigubai daugiau nei ankstesniuose „OpenAI“ modeliuose.
Tuo tarpu modelis o4-mini pateikė dar blogesnį rezultatą – 48 proc. klaidų.
Dar blogiau tai, kad bendrovės ekspertai, atrodo, iki galo nesupranta problemų priežasčių. Jų techninėje ataskaitoje teigiama, kad „norint suprasti šių klaidų priežastis, reikia atlikti daugiau tyrimų“.
Patiko straipsnis? Užsiprenumeruokite mūsų naujienlaiškį ir gaukite svarbiausias dienos naujienas bei įdomiausius straipsnius kiekvieną darbo dieną 11 val. Tiesiai į Jūsų el. paštą!