Claude 4.5 model ailesinin en üst seviye üyesi olan Opus 4.6, selefine kıyasla daha dikkatli planlama yapabiliyor, büyük kod tabanlarında daha güvenilir çalışabiliyor ve kendi hatalarını yakalama konusunda belirgin şekilde daha başarılı. Opus sınıfı modeller arasında ilk kez 1 milyon token bağlam penceresine sahip olan model, uzun belgelerde bilgi kaybı sorununu büyük ölçüde ortadan kaldırıyor.

Claude Opus 4.6 benchmark sonuçlarında rakiplerini geride bıraktı

Yeni model, birçok bağımsız değerlendirmede sektör lideri konumuna yerleşti. Ajansal kodlama testlerinden Terminal-Bench 2.0'da en yüksek skoru alan Opus 4.6, çok disiplinli muhakeme sınavı Humanity's Last Exam'de de tüm rakip modellerin önüne geçti. Ekonomik açıdan değerli bilgi işi görevlerini ölçen GDPval-AA testinde ise OpenAI'ın GPT-5.2 modelini yaklaşık 144 Elo puanı farkla geçti. Ayrıca zor bulunan bilgileri internette arama kapasitesini test eden BrowseComp'ta da en iyi sonucu elde etti.

Claude Opus Yeni

Uzun bağlam performansında devrim niteliğinde gelişme

Opus 4.6'nın en dikkat çekici özelliklerinden biri uzun bağlamlarda bilgi kaybını neredeyse sıfıra indirmesi. MRCR v2 testinin 1 milyon tokenlik versiyonunda Opus 4.6 yüzde 76 başarı oranı yakalarken, Sonnet 4.5 sadece yüzde 18,5'te kaldı. Bu fark, modelin yüz binlerce token boyunca bilgiyi ne kadar tutarlı takip edebildiğini açıkça ortaya koyuyor.

Geliştirici platformuna yeni özellikler eklendi

Anthropic, Opus 4.6 ile birlikte API tarafında da köklü yenilikler getirdi. Uyarlanabilir düşünme (adaptive thinking) özelliği sayesinde model, ne zaman derin muhakemeye ihtiyaç duyduğuna kendisi karar verebiliyor. Bağlam sıkıştırma (compaction) özelliği ise uzun konuşmalarda eski bağlamı otomatik özetleyerek token limitine takılmadan çalışmayı sürdürmeyi mümkün kılıyor. Bunun yanında düşük, orta, yüksek ve maksimum olmak üzere dört farklı çaba seviyesi sunularak geliştiricilere hız, maliyet ve zeka arasında ince ayar yapma imkanı tanındı.

Claude Opus

Claude Code'a takım çalışması özelliği geldi

Claude Code'da artık birden fazla ajanın paralel çalışarak koordineli şekilde görev üstlendiği "ajan takımları" özelliği araştırma önizlemesi olarak kullanıma sunuldu. Ayrıca Claude in Excel güncellendi, Claude in PowerPoint ise araştırma önizlemesi olarak Max, Team ve Enterprise planlarında kullanıma açıldı.

Güvenlik profili sektörün en iyisi

Anthropic, yeni modelin zeka artışının güvenlik pahasına gelmediğini vurguladı. Opus 4.6, otomatik davranış denetimlerinde aldatma, yaltaklanma ve kötüye kullanıma destek gibi hizasız davranışlarda düşük oranlar sergiledi. Zararsız sorguları gereksiz yere reddetme oranı ise Claude modelleri arasındaki en düşük seviyede. Ayrıca modelin güçlü siber güvenlik yetenekleri nedeniyle altı yeni siber güvenlik tespit yöntemi geliştirildi.

Claude Opus 4.6, bugün itibarıyla claude.ai, API ve tüm büyük bulut platformlarında kullanıma hazır. Fiyatlandırma milyon token başına giriş için 5, çıkış için 25 dolar olarak belirlendi.

Kaynak: Haber merkezi