Önde gelen yapay zeka sistemleri arasında türünün ilk örneği olan satranç turnuvasında Sam Altman’ın yapay zeka modeli, Elon Musk’ın Grok’unu mağlup etti.
Perşembe günü düzenlenen Kaggle Yapay Zeka Fuarı Turnuvası finalinde OpenAI’ın o3 modeli, xAI’ın Grok 4’ünü 4-0’lık kusursuz bir skorla geçti. Her iki model de Anthropic, DeepSeek, Google ve Moonshot AI’dan gelen yapay zeka rakiplerini eleyerek finale yükselmişti.
Bu karşılaşma, 10 yıl önce Altman ve Musk’ın birlikte kurduğu OpenAI’dan Musk’ın ayrılıp kendi yapay zeka şirketi xAI’ı kurmasının ardından, kişisel bir önem taşıyordu. İkilinin ilişkileri zamanla bozulmuş; Altman, Musk’ın ChatGPT’yi satın alma girişiminin başarısız olmasının ardından onu “zorba” olarak nitelendirmişti.
Mağlubiyetin ardından Musk, Grok 4’ün satranç yeteneğini küçümseyerek bunun “yan etki” olduğunu söyledi. X’te yaptığı paylaşımda, “xAI satranca neredeyse hiç emek harcamadı” ifadelerine yer verdi.
Bilgisayarların satrançta insanları geride bırakma süreci 1997’de IBM’in Deep Blue adlı süper bilgisayarının dünya şampiyonu Garry Kasparov’u yenmesiyle başlamıştı. O günden bu yana Google’ın DeepMind’ı gibi birçok yapay zeka sistemi, satranç ve Go gibi oyunları insanüstü seviyede kendi kendine öğrenebilecek yetenekler geliştirdi.
Bu turnuva, OpenAI’ın ChatGPT’yi 2022’de piyasaya sürmesinden bu yana genel amaçlı büyük dil modelleri (GDM) üzerine yapılan ilk büyük çaplı karşılaştırma olarak öne çıktı.
Take Take Take şirketinin CEO’su Mats André Kristiansen, The Independent’a yaptığı açıklamada şunları söyledi:
“Kasparov ve Deep Blue 90’larda büyük olaydı… Bu turnuvada önemli olan, bu ürünlerin nasıl düşündüğü ve mantık yürüttüğü hakkında daha fazla şey öğrenmek.”
Dünyanın bir numaralı satranç oyuncusu Magnus Carlsen ise geçtiğimiz temmuz ayında düzenlenen çevrim içi maçta ChatGPT’yi tek bir taş kaybetmeden yenmişti. Grok ve o3 arasındaki finali değerlendiren Carlsen, Grok’un satranç derecesini 800, OpenAI’ın modelini ise 1200 civarında tahmin etti. Karşılaştırmak gerekirse, Carlsen’ın en yüksek derecesi 2882. X’te bir kullanıcı tarafından doğrudan sorulduğunda ise Grok’un 1600-1800 aralığında bir seviyede olabileceğini belirtti.