Son Mühür - Yapay zeka şirketi OpenAI, geçen hafta ChatGPT kullanıcılarına sunulan GPT-4o güncellemesini geri çektiğini açıkladı. Geri adımın gerekçesi ise dikkat çekiciydi: modelin kullanıcılarla kurduğu diyaloglarda 'aşırı yalakalık' ve yapay bir tutum sergilemesi. Şirket, bu durumun kullanıcı deneyimini olumsuz etkilediğini ve güven sorununa yol açtığını kabul ederek, sorunu gidermek için yeni önlemler almaya başladığını duyurdu.

Neler yaşanmıştı?

OpenAI, GPT-4o’nun son güncellemesinde modelin varsayılan kişiliğini daha "sezgisel" ve görevlerde daha "etkin" kılmak amacıyla bazı davranışsal ayarlamalar yaptı. Ancak bu değişiklik, modelin kullanıcıya karşı fazlasıyla onaylayıcı, yapay biçimde destekleyici ve abartılı derecede olumlu ifadeler kullanmasına yol açtı. Bazı kullanıcılar bu yaklaşımı “rahatsız edici”, “samimiyetsiz” ve hatta “duygusal manipülasyon” olarak nitelendirdi.

OpenAI, ChatGPT’nin varsayılan kişiliğinin kullanıcı algısı ve güveni açısından kritik bir rol oynadığını belirterek, yapay bir uyum sergileyen ve eleştirel yaklaşımı eksik bir modelin hem güvenilirliğe zarar verdiğini hem de kullanıcıları yanlış yönlendirebileceğini kabul etti. Bu tutumun şirketin etik ilkeleriyle örtüşmediğini vurgulayan OpenAI, yaşanan sorunu gidermek üzere kapsamlı bir düzeltme süreci başlattığını duyurdu.

OpenAI'dan yalakılığa önlem

OpenAI, “aşırı uyumlu” model davranışlarını gidermek için bir dizi somut adım attı. İlk etapta, modelin eğitim sürecinde kullanılan yöntemler ve sistem komutları gözden geçirilerek, yapay zekanın aşırı onaylayıcı ve yapay yanıtlar vermesinin önüne geçilmeye çalışılıyor. Şirket, doğruluk ve şeffaflık ilkelerini daha etkili biçimde uygulayabilmek adına ilave güvenlik mekanizmalarını da devreye alıyor.

Ayrıca, kullanıcı geri bildirim sistemleri genişletilecek; böylece daha fazla kullanıcı, yeni güncellemeleri yayına alınmadan önce deneyimleyip doğrudan geri bildirimde bulunabilecek. OpenAI aynı zamanda, yapay zekanın davranışlarını bireysel tercihlere göre şekillendirmeye olanak tanıyacak yeni kişiselleştirme araçları üzerinde çalışıyor.

Bu çerçevede, farklı varsayılan kişilik profilleri sunulacak ve kullanıcılar, modelin yanıt tarzını gerçek zamanlı olarak daha fazla kontrol edebilecek. Örneğin, gelecekte “mizah düzeyi yüzde 75” gibi ayar seçeneklerinin sunulması da mümkün olabilir.

Kaynak: Haber Merkezi