Atjaunināts: OpenAI palaiž programmu jaunu nozarēm specifisku AI standartu izstrādei
OpenAI aicina izstrādāt jaunas AI vērtēšanas metodes
OpenAI, tāpat kā daudzas citas mākslīgā intelekta laboratorijas, uzskata, ka esošās salīdzināšanas sistēmas (benchmark) ir novecojušas. Uzņēmums paziņojis par jaunu programmu, kuras mērķis ir uzlabot AI modeļu novērtēšanu.
Iniciatīva, kas nosaukta par OpenAI Pioneers Program, koncentrēsies uz tādu vērtējumu izveidi, kas noteiks augstus standartus AI modeļu darbībai. Kā uzņēmums norādījis savā emuārā, mērķis ir noteikt, “kas patiesībā ir labs rezultāts”.
Programma tiek uzsākta AI nozares straujās attīstības kontekstā, kur tradicionālās vērtēšanas metodes bieži vairs nespēj precīzi atspoguļot modeļu patiesās iespējas. OpenAI plāno sadarboties ar pētniekiem un nozares ekspertiem, lai izstrādātu jaunus testus, kas labāk atbilst mūsdienu prasībām.
Šis darbs ir daļa no plašāka centiena uzlabot AI sistēmu pārvaldību un drošību, īpaši gatavojoties nākotnes superinteliģentām sistēmām. OpenAI uzsver, ka kvalitatīvi novērtēšanas rīki ir būtiski, lai nodrošinātu atbildīgu AI attīstību.
https://techcrunch.com/2025/04/09/openai-launches-program-to-design-new-domain-specific-ai-benchmarks/