Claude Opus 4.7 neler sunuyor, Opus 4.6'dan ne farkı var, benchmark sonuçları ne diyor? İşte yeni modele dair merak edilen tüm detaylar.
Claude Opus 4.7 ne getiriyor?
Opus 4.7'nin en büyük vaadi kodlama tarafında. SWE-bench Verified skoru yüzde 80.8'den yüzde 87.6'ya fırladı – bu, karmaşık yazılım mühendisliği görevlerinde ciddi bir sıçrama anlamına geliyor. CursorBench'te ise yüzde 58'den yüzde 70'e çıkış yakalandı. Cursor CEO'su Michael Truell, modelin "otonom çalışma ve yaratıcı muhakeme" konusunda belirgin bir ilerleme gösterdiğini söyledi.
Görsel tarafta da büyük yenilik var. Opus 4.7, 2.576 piksel uzun kenara kadar – yaklaşık 3.75 megapiksel – görüntü desteği sunuyor. Opus 4.6'nın sınırı 1.15 megapikseldi. Bu fark özellikle ekran görüntüleri, yoğun tablolar, teknik diyagramlar ve tasarım mockup'larında kendini hissettiriyor. Görsel navigasyon testlerinde doğruluk oranı yüzde 57.7'den yüzde 79.5'e yükseldi.
Bir diğer yenilik ise "xhigh" adlı yeni çaba seviyesi. High ile max arasında bir yere oturan bu mod, muhakeme derinliği ile yanıt hızı arasında daha ince bir kontrol sağlıyor. Claude Code artık varsayılan olarak xhigh seviyesinde çalışıyor.

Opus 4.7 ve Opus 4.6 karşılaştırması
GPQA Diamond'da yüzde 94.2 ile yeni zirve – Opus 4.6'yı geçti. Kodlama, çoklu araç kullanımı ve bilgisayar kullanımı benchmark'larında Opus 4.6'nın önünde. Uzun oturumlarda bağlam kaybı sorunu belirgin şekilde azaldı. Talimat takibinde daha hassas; Opus 4.6'nın adımları atladığı yerlerde Opus 4.7 tam uyum gösteriyor. Buna karşın Terminal-Bench 2.0'da GPT-5.4'ün gerisinde kaldığı ve BrowseComp skorunun Opus 4.6'ya göre düştüğü belirtiliyor.
Replit Başkanı Michele Catasta, modelin aynı kalitede işi daha düşük maliyetle çıkardığını ve teknik tartışmalarda karşı çıkarak daha iyi kararlar alınmasına yardımcı olduğunu söyledi.

Mythos neden hâlâ kapalı?
Anthropic ilginç bir şekilde Opus 4.7'nin kendi en güçlü modeli olmadığını açıkça kabul etti. Şirketin henüz genel kullanıma açmadığı Claude Mythos Preview, tüm benchmark'larda Opus 4.7'nin üzerinde. Mythos'un neden sınırlı kaldığı sorusunun yanıtı ise siber güvenlik endişeleri. Anthropic, geçen hafta duyurduğu Project Glasswing kapsamında Mythos'un siber yeteneklerinin riskli olduğunu belirterek, önce daha az yetenekli modellerde güvenlik önlemleri test edeceğini açıklamıştı. Opus 4.7, bu testlerin yapıldığı ilk model.
Opus 4.7 nereden kullanılır?
Model, claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI ve Microsoft Foundry üzerinden erişime açıldı. GitHub Copilot'ta da kullanılabilir durumda. Model ID'si "claude-opus-4-7" olarak belirlendi.





