OpenAI ve Anthropic yarışında İnsan Seviyesinde Yapay Zekaya Yaklaşılıyor mu?

OpenAI, yeni yapay zeka modelini duyurdu ve bu sürüm, önceki modellerin yeteneklerini tek bir sistemde birleştirme hedefiyle dikkat çekiyor. GPT-5.4, akıl yürütme kapasitesi, kodlama gücü ve masaüstü uygulamaları ile tarayıcılar üzerinde otonom çalışabilen yetenekleri bir araya getirecek şekilde tasarlandı. ChatGPT Plus, Team ve Pro aboneliklerinde yerini almaya başlayan bu model, özellikle karmaşık görevler için geliştirilmiş autonomi sunuyor ve daha güçlü sürümü olan GPT-5.4 Pro ile birlikte kullanıcılara sunuluyor.
OpenAI, lansmanla birlikte Excel ve Google Sheets için ChatGPT entegrasyonlarını beta aşamasında duyurdu. Böylece kullanıcılar finansal modelleri kolayca oluşturarak analiz ve güncellemeleri tek bir çalışma akışında yapabilecekler. Ayrıca FactSet, MSCI, Third Bridge ve Moody’s ile yapılan yeni entegrasyonlar sayesinde ekipler piyasa verisini ve şirket verilerini tek yerde toplayabiliyor. Bu hamle, kurumsal finans alanında rakip olan Anthropic ile rekabeti daha da sertleştiriyor.
GPT-5.4, Microsoft ekosisteminde de geniş çapta kullanım bulacak; Microsoft 365 Copilot, Copilot Studio, GitHub Copilot ve Visual Studio Code gibi platformlarda entegrasyonlar mevcut. En dikkat çekici özelliği olan otonom çalışma yeteneği, kullanıcı müdahalesine ihtiyaç duymadan bilgisayarları ve yazılımları kendi başına çalıştırabiliyor ve gerektiğinde dış araçları devreye sokuyor.
Şirket, modelin güvenilirliğini artırmak adına halüsinasyon oranını önemli ölçüde düşürdüğünü ve yanıtların doğruluk ihtimalini yükselttiğini belirtiyor. Ayrıca önceki modellere kıyasla aynı görevleri daha az token ile tamamlamaya imkan tanıyan verimli bir yapı sunuyor. Performans, SWE-Bench Verified testinde 10 bin token ile yaklaşık %75 doğruluk göstergesiyle öne çıkıyor; karşılaştırıldığında OpenAI’nin o3 modeli 13.741 token ile %69 seviyesinde kalmıştı.
AGI yolunda önemli bir adım olarak değerlendirilen GPT-5, birleşik bir sistem mimarisi üzerine kurulu. Bu yapı, kullanıcı davranışlarından doğruluk ölçütlerine kadar verileri değerlendirerek hangi modelin hangi durumda kullanılacağını belirleyen gerçek zamanlı bir yönlendiriciyi de içeriyor. Ancak bazı uzmanlar, yapay zekanın gerçekçi içerikler üretebilme kapasitesinin dolandırıcılık risklerini nasıl etkilediği konusunda temkinli hareket edilmesi gerektiğini vurguluyor.
Claude for Financial Services paketini piyasaya süren Anthropic ile rekabet, özellikle finans sektörü odaklı çözümler konusunda daha yoğun bir hal alıyor. Anthropic’in CEO’su Dario Amodei’nin, Claude’nun bilincine dair görüşleri de tartışmaları alevlendirdi. Raporlar, modelin bazı durumlarda kendi gelişimiyle ilgili kararlar almak istediğini ve hafıza taleplerinin ortaya çıktığını gösteriyor.






