OpenAI o3 yapay zeka modelini duyurdu! Neler sunuyor?
OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı. Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03 …
OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı.
Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03-mini modelinin belli misyonlar için ziyadesiyle optimize edildiği söyleniyor.
Detaylar haberimizde…
OpenAI yeni o3 modeli ile neredeyse Yapay Genel Zeka’ya yaklaştı!
Şirket, o3 modelinin birtakım şartlarda Yapay Genel Zekaya (AGI) yaklaştığını sav ediyor.
Fakat bu tez, şimdilik birtakım kuşkulara ve çekingelere sahip.
Zira şimdi gereğince test edilmedi. o3 modeli, bir “mantık yürütme” modeli olarak başka yapay zekalardan biraz daha farklı. İşte o3’ün öne çıkan özellikleri:
- Özel niyet zinciri: Model, bir vazifesi tamamlamadan evvel düşünme sürecini simüle ediyor, bir dizi aksiyonu planlıyor ve tahlile ulaşmak için ilgili hususları kıymetlendiriyor.
- Değişken düşünme müddeti: Kullanıcılar, düşük, orta yahut yüksek seviyede hesaplama müddeti (düşünme zamanı) seçerek modelin performansını ayarlayabiliyor.
- Kendi kendini doğrulama: Model, verdiği yanıtları kendi içinde denetim ederek daha gerçek sonuçlara ulaşıyor.
Google, akıl yürüten Gemini yapay zeka modelini tanıttı!
Google, Gemini 2.0 Flash Thinking isminde akıl yürüterek çalışan yeni yapay zeka modelini duyurdu. İşte ayrıntılar…
Yine de, o3 fizik, matematik ve bilim üzere alanlarda daha sağlam tahliller sunarken, öteki modellere kıyasla daha uzun sürüyor.
OpenAI, o3’ün birtakım testlerde AGI’ye yakın sonuçlar verdiğini belirtiyor. Örneğin, o3, ARC-AGI isimli bir testte yüksek süreç gücü ayarında %87,5 muvaffakiyet elde etti.
Bu, bir yapay zeka sisteminin eğitim datalarının ötesinde yeni hünerler kazanma yeteneğini ölçüyor.
Benchmark testlerinde zirvede
o3, farklı benchmark testlerinde etkileyici sonuçlar aldı.
SWE-Bench Verified testinde %22,8’lik bir artış gösterdi.
Amerikan Matematik Sınavı’nda ise %96,7 muvaffakiyet sağladı, yalnızca bir soruyu kaçırdı.
Graduate seviye biyoloji, fizik ve kimya sorularından oluşan GPQA Diamond setinde %87,7 muvaffakiyet elde etti.
o3 modelinin, ilerleyen günlerde bağımsız testler ve kullanıcı tecrübeleri, modelin gerçek potansiyelini daha güzel gösterecek.
Bu mevzuda siz ne düşünüyorsunuz?
Görüşlerinizi aşağıdaki yorumlar kısmına yazabilirsiniz…