Google DeepMind ve OpenAI tarafından geliştirilen en gelişmiş yapay zeka modelleri, bu yıl Uluslararası Matematik Olimpiyatları (IMO) seviyesinde büyük bir başarıya imza attı. Her iki yapay zeka da, yarışmada altın madalya düzeyine ulaşarak insan zekasına bir adım daha yaklaştıklarını gösterdi.
1959’dan bu yana düzenlenen ve dünyanın en prestijli matematik yarışmalarından biri olarak kabul edilen IMO’da katılımcılardan cebir, geometri ve kombinatorik gibi alanlarda altı karmaşık problemi 4,5 saat içinde çözmeleri isteniyor. OpenAI ve DeepMind’ın modelleri bu sorulardan beşini doğru çözerek 42 üzerinden 35 puan aldı. Bu, yalnızca yarışmacıların %8’inin ulaşabildiği altın madalya seviyesine denk geliyor.
DeepMind'ın Gemini Modelinden Tarihi Başarı
Geçtiğimiz yıl gümüş madalya seviyesinde kalan DeepMind, bu kez yeni nesil Gemini Deep Think modeliyle altın madalya düzeyine ulaştı. Bu başarı, modelin klasik doğrusal akıl yürütme yerine paralel düşünme mimarisi kullanmasından kaynaklanıyor.
Model, tek bir çözüm yolu izlemek yerine, birden fazla mantıksal çözüm dalı oluşturuyor ve bu yolları eş zamanlı analiz ederek en tutarlı çözüm yolunu seçiyor. Ayrıca “spekülatif akıl yürütme modülleri” sayesinde alternatif ispat yolları geliştirerek yalnızca doğru cevabı bulmakla kalmıyor, matematiksel ispatların kalitesini de artırıyor.
Gemini, doğal dil girdilerini doğrudan sembolik mantık yapılarına dönüştüren özel bir mekanizmaya da sahip. Bu sayede, klasik modellerde olduğu gibi problem çözümünü programlama dillerine çevirmeye ihtiyaç duymadan doğrudan metinsel açıklamalarla çalışabiliyor.
IMO jürisi, Gemini’ın sunduğu ispatları “insan matematikçilere oldukça yakın, hatta insan tarafından yazılmış izlenimi veren çözümler” olarak değerlendirdi.
OpenAI da Gizli Modeliyle Zirvede
OpenAI da kamuya henüz sunulmayan deneysel bir modeliyle benzer başarıya ulaştı. Bu model, önce sorulara ait tüm olası çözüm yollarını semantik olarak haritalıyor, ardından içlerinden en mantıklı olanı seçip doğal dille matematiksel ispatlar oluşturuyor. Gelişmiş bir denetim sistemi sayesinde model, sadece sonuç değil, süreç açısından da tutarlılık sağlıyor.
Şimdilik Sadece Araştırma Amaçlı Kullanılacak
OpenAI CEO’su Sam Altman’a göre bu düzeydeki yapay zeka yetenekleri henüz son kullanıcıya sunulmayacak. Bu sistemler, kısa vadede yalnızca araştırma alanlarında kullanılacak; GPT serisi gibi genel amaçlı modellerin bu seviyeye ulaşması biraz daha zaman alacak.
Yapay zekaların artık açık uçlu, çok adımlı ve soyut düşünce gerektiren problemleri çözebilecek seviyeye gelmiş olması, yapay genel zekaya (AGI) doğru önemli bir adım olarak değerlendiriliyor.