Bilim

Google'ın Satranç Deneyleri Yapay Zekanın Gücünün Nasıl Artırılacağını Ortaya Çıkarıyor

Grubu bunu öğrenmeye karar verdi. Bağımsız olarak ve çeşitli durumlarda eğitilen birden fazla yapay zeka sistemini içeren AlphaZero'nun yeni, çeşitlendirilmiş versiyonunu oluşturdular. Zahavy, genel sistemi yöneten algoritmanın bir tür sanal çöpçatan gibi davrandığını söyledi: Bu algoritma, hamle yapma zamanı geldiğinde hangi ajanın başarılı olma şansının en yüksek olduğunu belirlemek için tasarlandı. Kendisi ve meslektaşları aynı zamanda bir "çeşitlilik bonusu" da kodladılar; bu, sistem geniş bir seçenek yelpazesinden stratejiler çektiğinde verilecek bir ödül.

Satranç taşı

Yeni sistem kendi oyunlarını oynayacak şekilde serbest bırakıldığında ekip çok fazla çeşitlilik gözlemledi. Çeşitliliğe sahip yapay zeka oyuncusu, ne zaman ve nerede rok atılacağı gibi belirli stratejiler hakkında yeni, etkili açılışlar ve yeni ama sağlam kararlarla deneyler yaptı. Çoğu maçta orijinal AlphaZero'yu yendi. Ekip ayrıca, çeşitlendirilmiş versiyonun orijinalinden iki kat daha fazla zorlu bulmacayı çözebildiğini ve toplam Penrose bulmaca kataloğunun yarısından fazlasını çözebildiğini buldu.

Cully, "Burada amaç, herhangi bir oyuncuyu yenebilecek tek bir çözüm veya tek bir politika bulmak yerine, yaratıcı çeşitlilik fikrini [kullanmasıdır]" dedi.

Zahavy, daha fazla ve farklı oynanan oyunlara erişim sayesinde çeşitlendirilmiş AlphaZero'nun, ortaya çıkan zorlu durumlar için daha fazla seçeneğe sahip olduğunu söyledi. "Eğer gördüğü oyun türlerini kontrol edebiliyorsanız, temel olarak nasıl genelleşeceğini de kontrol edersiniz" dedi. Bu tuhaf içsel ödüller (ve bunlarla ilişkili hamleler), çeşitli davranışlar için güçlü yönler haline gelebilir. Daha sonra sistem, farklı yaklaşımları değerlendirmeyi ve değer vermeyi öğrenebilir ve bunların en başarılı olduğu zamanı görebilir. "Bu ajan grubunun bu pozisyonlar üzerinde gerçekten bir anlaşmaya varabileceğini gördük."

Ve en önemlisi, sonuçları satrancın ötesine uzanıyor.

Gerçek Hayatta Yaratıcılık

Cully, çeşitlendirilmiş bir yaklaşımın yalnızca takviyeli öğrenmeye dayalı olanlara değil, her türlü yapay zeka sistemine yardımcı olabileceğini söyledi. Fiziksel sistemleri eğitmek için çeşitliliği uzun süredir kullanıyor; buna, çeşitli hareket türlerini keşfetmesine izin verilen, daha önce geliştirdiği bazı teknikleri kullanarak hareket etmeye devam etmesine izin vererek kasıtlı olarak "yaralamadan" önce altı ayaklı bir robot da dahil. "Şu ana kadar bulduğumuz tüm önceki çözümlerden farklı çözümler bulmaya çalışıyorduk." Son zamanlarda, gelecek vaat eden yeni ilaç adaylarını belirlemek ve etkili hisse senedi ticareti stratejileri geliştirmek amacıyla çeşitliliği kullanmak için araştırmacılarla da işbirliği yapıyor.

Cully, "Amaç, her çözümün bir sonrakinden çok farklı olduğu, potansiyel olarak binlerce farklı çözümden oluşan geniş bir koleksiyon oluşturmaktır" dedi. Böylece -tıpkı farklı satranç oyuncularının yapmayı öğrendiği gibi- her tür problem için genel sistem mümkün olan en iyi çözümü seçebiliyordu. Kendisi, Zahavy'nin yapay zeka sisteminin "farklı stratejiler aramanın kalıpların dışında düşünmeye ve çözümler bulmaya nasıl yardımcı olduğunu" açıkça gösterdiğini söyledi.

Zahavy, yapay zeka sistemlerinin yaratıcı bir şekilde düşünebilmesi için araştırmacıların onlara daha fazla seçeneği değerlendirmeleri gerektiğini düşünüyor. Bu hipotez, insanlar ve makineler arasında ilginç bir bağlantı olduğunu öne sürüyor: Belki zeka sadece bir hesaplama gücü meselesidir. Bir yapay zeka sistemi için yaratıcılık, yeterince geniş bir seçenek büfesini dikkate alma ve arasından seçim yapma becerisine indirgenebilir. Sistem çeşitli optimal stratejileri seçtiği için ödüller kazandıkça, bu tür yaratıcı problem çözme pekiştirilir ve güçlenir. Sonuçta teoride, insanlarda yaratıcı olduğu kabul edilen her türlü problem çözme stratejisini taklit edebilir. Yaratıcılık bir hesaplama sorunu haline gelecektir.

Liemhetcharat, çeşitlendirilmiş bir yapay zeka sisteminin, makine öğrenimindeki daha geniş genelleme sorununu tamamen çözme ihtimalinin düşük olduğunu belirtti. Ama bu doğru yönde atılmış bir adım. "Bu eksikliklerden birini hafifletiyor" dedi.

Daha pratik olarak Zahavy'nin sonuçları, işbirliğinin insanlar arasında zor görevlerde daha iyi performansa nasıl yol açabileceğini gösteren son çabalarla örtüşüyor. Billboard 100 listesindeki hit şarkıların çoğu bireyler tarafından değil, örneğin şarkı sözü yazarlarından oluşan ekipler tarafından yazılmıştır. Ve hala geliştirilecek yer var. Çeşitli yaklaşım şu anda hesaplama açısından pahalıdır, çünkü tipik bir sistemden çok daha fazla olasılığı dikkate alması gerekir. Zahavy ayrıca çeşitlendirilmiş AlphaZero'nun bile tüm olasılık yelpazesini yakaladığı konusunda ikna olmuş değil.

"Hala farklı çözümler bulmak için yer olduğunu düşünüyorum" dedi. "Dünyadaki tüm veriler göz önüne alındığında, her sorunun [yalnızca] tek bir cevabının olduğu bana açık değil."


Orijinal hikaye , misyonu matematik, fizik ve yaşam bilimlerindeki araştırma gelişmelerini ve eğilimlerini kapsayarak halkın bilim anlayışını geliştirmek olan Simons Vakfı'nın editoryal olarak bağımsız bir yayını olan Quanta Magazine'in izniyle yeniden basılmıştır .

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Göz Atın
Kapalı
Başa dön tuşu