AI spriesto modeļu pieaugums padara testēšanu dārgāku
AI “spriešanas” modeļi un to izmaksas
AI laboratorijas, piemēram, OpenAI, apgalvo, ka viņu tā sauktie “spriešanas” AI modeļi, kas spēj “domāt” problēmas soli pa solim, ir spējīgāki nekā to nespeciāli līdzinieki noteiktās jomās, piemēram, fizikā. Tomēr, lai gan tas parasti šķiet patiess, šādu modeļu testēšana ir daudz dārgāka, padarot neatkarīgu novērtējumu veikšanu gandrīz neiespējamu.
Augstās izmaksas ir viens no galvenajiem šķēršļiem, kas kavē pētniekus un neatkarīgus vērtētājus. Lai iegūtu precīzus rezultātus, ir nepieciešams ievērojams skaitļošanas resursu apjoms, kas padara šādus testus pieejamus tikai lielākajiem pētniecības centriem vai uzņēmumiem.
Turklāt pastāv arī jautājumi par to, vai šie modeļi patiešām ir tik “spējīgi”, kā to apgalvo. Daži kritiķi norāda, ka, lai gan šīs sistēmas rada iespaidu ar savu soli pa solim pieeju, tās bieži vien trūkst patiesas izpratnes par problēmu, uz kuru tās reaģē.
Neraugoties uz šiem izaicinājumiem, AI attīstība turpinās, un “spriešanas” modeļi kļūst arvien populārāki. Tomēr, līdz brīdim, kad testēšanas izmaksas kļūs pieņemamākas, neatkarīga validācija paliks ierobežota.
https://techcrunch.com/2025/04/10/the-rise-of-ai-reasoning-models-is-making-benchmarking-more-expensive/