Google’ın geliştirdiği yapay zeka programı AlphaZero, sadece 4 saatte satrançta ustalaştı

Share on facebook
Share on twitter
Share on pocket
Share on email
Share on print

DeepMind Technologies 2010 yılından beri “yapay zeka” üzerine çalışan bir şirket, 2014 yılında Google tarafından alındıktan sonra, AlphaGo adında “Go” oynayan bir yapay zeka geliştirmeye başladı. Geliştirme sürecinde Go oynayabilen birçok programı yenmeyi başaran AlphaGo, Ekim 2015’de Avrupa Go Şampiyonu Fan Hui (2dan)’i handikapsız yenmeyi başardı. Profesyonel bir Go oyuncusu karşısında aldığı 5-0’lik galibiyetten sonra, Nature dergisinde programın ve yapay zekanın nasıl işlediğine dair detaylı bir makale yayınlandı.

Gelişimini öğrenerek sürdüren AlphaGo, Mart 2016’da profesyonel Go oyuncuları içinde en yüksek dereceye sahip olan Lee Sedol (Pro 9Dan) ile karşılaştı. 4-1’lik galibiyet kazanan AlphaGo önemli bir başarı kazanmış oldu.

Eylül 2017’de “AlphaGo”nun Güney Kore ve Lee Sedol ile yaptığı maçın hikayesini anlatan bir belgesel yayınlandı. “AlphaGo Movie”’ye GooglePlay ve Amazon üzerinden ulaşabilirsiniz.

Go nedir?

3000 yıl önce Çin’de ortaya çıkan Go oyunu, oldukça basit kuralları olan oyunda, rakibin taşlarını yakalamaya ya da boşlukları kuşatmaya çalışarak oynanıyor. Satranç’tan 1 googol (10100) daha karmaşık bir oyun olan Go, 19 x 19 bir tahtada 180’er siyah-beyaz taşlarla oynanıyor.

AlphaGo ve Alpha Zero nedir?

Geleneksel yapay zeka modellemeri, içinde milyonlarca oyunun yüklemiş olduğu bir algoritma içinde “Ağaç modeli” tarama ve hesaplar yaparak sonuçları oluşturur. Go oyunu için geliştirilen AlphaGo yapay zeka modeli ise gelişmiş bir ağaç taraması ve DeepMind tarafından geliştirilen “Derin sinir ağları” taraması yapıyor. “Derin sinir ağı” sistemi ise, sinir sisteminde bulunan milyonlarca nöron gibi tahta üzerinde yapacağı işlemlere karar veriyor. “Politika ağı” oynanacak bir sonraki hamleye karar verirken, “Değer ağı” ise kazananın kim olacağını hesaplıyor.

yapay-zeka

Altyapısında binlerce oyun bulunan, ve sürekli kendisine karşı oynayan AlphaGo, kendi hatalarından öğrenerek  gelişim gösteren bir yapay zeka sistemine sahip.

Ekim 2017’de Nature dergisinde yayınlanan bir makale ile ortaya çıkan DeepMind’ın yeni yapay zeka modeli “Alpha Zero” nun ise bir önceki versiyon olan “AlphaGo” dan 100 kat daha gelişmiş olduğu söyleniyor. Aralarındaki en büyük ise, Alpha Zero, oyunun temel kuralları yüklendikten sonra, oyunu oynayarak kendi kendine öğreniyor olması. Bununla beraber, Alpha Zero, AlphaGo’ya göre neredeyse yarı yarıya daha az işlemci kullanıyor ve daha düşük bir güç tüketimi sağlıyor.

Satranç için AlphaZero

AlphaZero’ya satranç oyununun mekanikleri tanıtıldı ve oyuna olan bilgi birikimini kendi öğrenmesi beklenildi. Böylelikle AlphaZero, satranç oyununun tarihi ve daha önce oyunun literatürüne girmiş açılış oyunları, savunma stratejileri gibi kavramları kendi kendine öğreniyor.

cam-satranc-takimi-116112_4_2

Alpha Zero’nun satranç becerilerini ölçmek için hâlihazırda Dünya’nın en iyi açık kaynak satranç yapay zekası olarak kabul edilmiş Stockfish ile bir maç yaptırıldı. Oyunun başlangıcında Stockfish oyunu daha hızlı ve daha iyi oynayan taraf. Ancak oyun oynanmaya başladıkça Alpha Zero’nun öğrenme algoritması devreye girdi ve oyunu daha hızlı oynamaya başladı. Oyunun açılışında “Fransız Açlışı” adı verilen bir oyunu çok sık oynayan Alpha Zero, oyunun devamında bu oyundan vazgeçiyor ve Queen Gambit, İngiliz açılışı ve Caro-Kahn açılışı gibi oyunları tercih ediyor. Üstelik bu açılışların oyun sırasında keşfedip kullanmaya başlıyor. Sonuç ise oldukça hayret verici. Birbirleriyle aynı seviye satranç bilerek başlayan ve oyun sırasında kendi kendilerini geliştirmeleri beklenen iki yapay zekayı karşılaştırılan maçta, Alpha Zero adına 28 galibiyet ve 72 beraberlik ile sonuçlanıyor.

Satrançta yapay zeka

1997 yılında IBM tarafından üretilen Deep Blue adında bir program ile satranç yapay zeka ilişkisinin ilk tohumları atıldı. IBM verilerine göre, saniyede 200 milyon hamleyi düşünebilen bir program olan Deep Blue, zamanının dünya bir numarası ve satranç üstadı Gary Kasparov ile oynamış, bu oyun 1-1 beraberlikle sonuçlanmıştı. Elbette maç büyük ses getirdi, Kasparov , oyuna kuşku ile yaklaştı. Deep Blue’nun bazı hamlelerinin insanlar tarafından yapıldığını iddia etti. Bu hikâye daha sonra “Game Over: Kasparov vs. The Machine” adlı çalışma ile belgeselleştirildi.  1997’den beri yapay zeka adına yapılan atılımı görmek adına Deep Blue ile Alpha Zero arasındaki farkı incelemek gerekirse, saniyede 200 milyon hamle görebilen Deep Blue’ya karşı Alpha Zero, aslında daha az pozisyonu öngörüyor ancak rakibinin oyununu da analiz edip, en doğru hamleyi görebiliyor. Daha az hamle hesaplayıp, öğrenme algoritması sayesinde sadece düşünen değil analiz edebilen bir iskelete sahip.

1997 beridir, yapay zeka çok büyük bir atılım kaydetti. Saniyeler içerisinde bir satranç üstadı yaratabilen bir öğrenme algoritmasına sahip Alpha Zero, bundan böyle çok şeyi değiştireceğe benziyor.

Share on facebook
Share on twitter
Share on pocket
Share on email
Share on print
 
  • Medyascope
  • Medyascope Plus