Süni zəka dünyanın 30 ən yaxşı riyaziyyatçısını az qala geridə qoyub
May ayının ortalarında Kaliforniya ştatının Berkli şəhərində 30 tanınmış riyaziyyatçı OpenAI şirkətinə məxsus o4-mini adlı çat-botun riyazi qabiliyyətlərini sınamaq üçün bir araya gəlib. 2 gün ərzində onlar bu süni zəkanı professor səviyyəsində suallarla sınağa çəkiblər və müəyyən ediblər ki, bu süni zəka sistemi son dərəcə çətin riyazi məsələləri həll edə bilir və artıq dünyanın ən yaxşı magistratura tələbələrinin əksəriyyətini qabaqlayır. Böyük dil modelləri (BDM) cümlədə növbəti sözün nə olacağını proqnozlaşdırma qabiliyyətinə malikdirlər.
Lakin bir çox digər BDM-lərlə müqayisədə, o4-mini və onun Gemini 2.5 Flash kimi analoqları daha güclü möhkəmləndirici öyrənmə ilə xüsusi məlumat bazaları üzərində təlimləndirilib. Bu yanaşma çat-botu ənənəvi BDM-lərlə müqayisədə daha mürəkkəb riyazi məsələlərə dərindən nüfuz edə biləcək səviyyəyə çatdırmağa imkan verir.
OpenAI şirkəti o4-mini modelinin inkişaf səviyyəsini ölçmək üçün müstəqil təşkilat olan Epoch AI-ya daha əvvəl heç vaxt dərc olunmamış 300 riyazi məsələdən ibarət bir tapşırıq toplusu hazırlamağı tapşırıb. Müasir böyük dil modelləri artıq mürəkkəb riyazi suallara doğru cavablar verə bilirlər, lakin Epoch AI tərəfindən seçilmiş bu suallar ən qabaqcıl modellər üçün belə çətin olub - onların heç biri 6-dan çox tapşırıq həll edə bilməyib, yəni 2%-lik nəticəni aşa bilməyiblər. Lakin o4-mini tamamilə fərqli, radikal nəticə göstərib. Epoch AI tərəfindən dəvət olunmuş Elliot Glazer-in rəhbərlik etdiyi tədqiqat 2024-cü ilin sentyabrında başlayıb. o4-mini üçün nəzərdə tutulmuş 300 riyazi tapşırıq bakalavriat, magistratura və tədqiqat səviyyəsi olmaqla 3 çətinlik dərəcəsinə bölünüb. 2025-ci ilin aprel ayına qədər Glazer müəyyən edib ki, o4-mini bu tapşırıqların təxminən 20%-ni həll edə bilir.
Dördüncü səviyyə isə hətta riyaziyyat professorları üçün belə çətin olan tapşırıqlardan ibarət olub. Tədqiqatda iştirak etmiş alimlər bu sualların model tərəfindən vaxtından əvvəl öyrənilməsinin və ya təsadüfi sızmanın qarşısını almaq məqsədilə məxfilik sazişi imzalamalı olublar. 17-18 may tarixlərində təcrübənin iştirakçıları Berklidə toplaşıb o4-mini-nin son sual blokuna necə cavab verəcəyini yoxladılar. 30 alim 6 nəfərlik qruplara bölünmüşdü. 2 gün ərzində onlar bir-birilə yarışaraq elə tapşırıqlar hazırlamağa çalışdılar ki, həm özləri onları həll edə bilsinlər, həm də çat-botu çaşdırsınlar. Sonda alimlər çat-botu çıxılmaz vəziyyətə salan 10 sual tapa bilsələr də, süni zəkanın 1 il ərzində nə qədər irəlilədiyi onları heyrətləndirdi. London Riyaziyyat Elmləri İnstitutunun alimi və layihənin iştirakçılarından biri olan Yang Hui He o4-mini-nin səviyyəsini ən azı çox savadlı bir magistrantla müqayisə edib.