OpenAI yangi sun'iy intellekt modellari - o3 va o3 mini - yanada murakkab vazifalarni hal qila olishini sinovdan o'tkazayotganini e'lon qildi. Yangiliklar haqida sharh kompaniyaning YouTube kanalida mavjud.
OpenAI bosh direktori Sam Altman o3 va o3 mini modellari haqida "juda-juda aqlli" va "ajoyib darajada aqlli" deb ta'rif berdi. Haqiqiy dasturlash vazifalarida (SWE Bench) o3 modeli 71,7% aniqlikka erishdi, bu esa o1 ko'rsatkichlaridan 20 foiz punktga yuqoridir.
Kodlash musobaqalarida (Codeforces) model ELO bahosi 2727 ga ega bo'ldi, bu esa oldingi o1 modelidan (1891) ancha yuqori. Masalan, OpenAI dasturchilari o'rtacha 2500 ball to'playdi, ularning etakchi mutaxassislari esa bir oz ko'proq.
Matematik testda EpochAI Frontier Math o3 modeli 25,2% aniqlikka erishdi, bu esa oldingi modellardan 12 martadan ko'proq yaxshidir.
https://twitter.com/__nmca__/status/1870170098989674833
o3-mini modeli uchta fikrlash darajasini qo'llab-quvvatlaydi: low, medium va high. Model vazifani qayta ishlash uchun qancha ko'p vaqt sarflasa, natija shuncha aniq bo'ladi. Low latency (past kechikish) rejimida o3-mini GPT-4o darajasida tezlik ko'rsatadi, bu esa tezda javob olish imkonini beradi.
Yangi o3 mini modellari 2025 yil yanvar oyining oxiriga qadar chiqarilishi rejalashtirilgan, to'liq o3 versiyasi esa undan keyin paydo bo'ladi. Ushbu modellardan OpenAI mavjud til modellari ustidan ustunlikni qo'lga kiritish, shuningdek yangi foydalanuvchilar va investitsiyalarni jalb qilish umidida.
OpenAI allaqachon yangi modellarning ommaviy chiqarilishidan oldin ularni sinovdan o'tkazish uchun tashqi xavfsizlik tadqiqotchilaridan arizalar qabul qilish jarayonini boshladi. Arizalar qabul qilish 2025 yil 10 yanvarida tugaydi. Modelni sinovdan o'tkazish uchun ariza berish mumkin.
Avvalroq Spot OpenAI matnli so'rovlar asosida video yaratish vositasini ishga tushirganini yozgan edi.