Presnejšie odpovede si však berú svoju daň a to v podobe času. OpenAI však svojim zákazníkom dáva na výber z troch nastavení času potrebného na uvažovanie – nízka, stredná alebo vysoká úroveň. Čím dlhší čas na uvažovanie AI dostane, tým presnejšie budú odpovede.

o3 s výsledkami prekračujúce všetky očakávania
Výnimočné atribúty o3 potvrdzujú aj výsledky niekoľkých testov, ktoré dopadli nadmieru pozitívne. Jednou z predností umelej inteligencie od OpenAI je programovanie, čo preukázala na Codeforces s vysokým skóre 2727. Je dôležité si uvedomiť, že skóre 2400 zaraďuje testovaného na 99,2 percentil.
Matematickú olympiádu American Invitational Mathematics Exam 2024 zvládla o3 s úspešnosťou 96,7 %, pričom nesprávne zodpovedala len jednu otázku. Pre porovnanie, jej predchodca o1 dosiahol na tomto teste 83,3 %, čo je vskutku výrazný rozdiel.
Na teste ARC-AGI, ktorý zisťuje, či AI dokáže získavať nové zručnosti na mieste a preveruje všeobecnú inteligenciu, si o3 odnáša takisto úctyhodný výsledok. Oficiálne skóre predstavovalo 75,7 %, no pri použití väčšieho výpočtového výkonu než v oficiálnom skóre dosiahla o3 87,5 %. Ľudská hranica sa pohybuje okolo 84 a 85 %.
Paradoxom je, že sa o3 na ARC-AGI teste trápila najmä s vizuálnymi a jednoduchšími hádankami. V riešení takýchto úloh sa teda značne odlišuje od ľudského zmýšľania. Aj keď má poriadne našliapnuté k povestnej AGI („umelá všeobecná inteligencia“) označujúcu AI, ktorá dokáže vykonávať akúkoľvek úlohu, ktorú dokáže človek, stále má čo robiť, aby túto hranicu dosiahla.