Ana Yenilik Google Yapay Zeka 'Alpha Go Zero' Nasıl Öğrenilir Üzerine Sıfırlama Yaptı

Google Yapay Zeka 'Alpha Go Zero' Nasıl Öğrenilir Üzerine Sıfırlama Yaptı

Yarın Için Burçun

Yürümeyi, konuşmayı, bisiklete binmeyi veya araba kullanmayı nasıl öğrendiğinizi (belli belirsiz) hatırlıyor musunuz? Dağınık ve hatalarla doluydu, ancak bu şekilde öğrendiğiniz beceriler kaldı. Canlı sistemlerin dışında, 'gerçek yaşam deneyimini' alacak kadar güçlü algoritmalar yapılandırmak ve yapay zeka için yapışkan, uyarlanabilir davranışlar geliştirmek zor oldu.

Alpha Go Zero az önce yaptı.

“Boş bir sayfadan başlar ve yalnızca kendi kendine oynayarak ve herhangi bir insan bilgisi veya herhangi bir insan verisi veya özelliği veya örneği veya insanlardan müdahalesi olmadan sadece kendisi için çözülür. DeepMind'in profesörü David Silver, Go oyununun ilk prensiplerden nasıl oynanacağını keşfediyor.

AI, her biri bir öncekinden daha akıllı ve daha yetenekli olan birkaç yinelemeye sahipti. Önceki sürüm, önceki oyunların büyük bir veritabanını ve onu kazanmaya yönlendiren bir grup algoritmayı kullandı. Bu yaklaşım, hüküm süren dünya şampiyonu profesyonel Go oyuncusunun yenilgisine yol açtı. Pokerde, AI Libratus yakın zamanda dünyanın en iyi poker oyuncularının derisini insan oyun verileri yerine kendi kendine oynama yoluyla öğrenerek neredeyse 2 milyon dolar kazandı.

Şimdi, Alpha Go'nun bu son sürümünde, yapay zeka programı öğretti kendisi Go nasıl oynanır - insan geçmişi olmadan.

Milyonlarca oyun simülasyonunu kendisine karşı çalıştırarak, kendisinin Dünya şampiyonu versiyonunu nasıl yeneceğini sıfırdan öğrenmesi 40 gün sürdü. Bu, yalnızca Go için değil, aynı zamanda yeni bilgilerin nasıl keşfedildiği konusunda da gerçekten oyunun kurallarını değiştiriyor. Alan uzmanlığınız ne kadar doğru veya eksiksiz? var çok Alpha Go Zero ile öğrenme konusundaki bu büyüleyici deneyin bize söylediği, keşfedilecek daha çok şey var.

Silver, 'Alpha Go'nun amacı dışarı çıkıp insanları yenmek değil, aslında bilim yapmanın ne anlama geldiğini keşfetmek - bir programın bilginin ne olduğunu kendisinden öğrenebilmesi için' başarı.

Alpha Go Zero Deep Mind ekibi buna birinci ilke, 'tabula rasa' (boş sayfa) öğrenme diyor.

'Eğer başarabilirsen yok etme Öğrenirken, Go oyunundan başka herhangi bir alana nakledilebilecek bir ajanınız var ve içinde bulunduğunuz oyunun özelliklerini, her yere uygulanabilecek kadar genel bir algoritma buluyorsunuz' diyor. . Konsepti genişlettiğinizde bu kışkırtıcı bir fikir. Zor problemlerin sistematik olarak üstesinden gelebilecek ve medeniyetimizin kolektif bilgisinden daha hızlı öğrenebilecek bir dizi güçlü, öğrenen algoritma ile neler yapabileceğimizi bir düşünün. . . onlarca yıl değil, günlerde.

Silver, şimdilik, büyük çıkarım, 'algoritmalar, bilgi işlem veya mevcut verilerden çok daha önemlidir' dedi. Bu tek başına, bilinen dünyayı genişletmeye nasıl yaklaştığımız konusunda bir oyun değiştiricidir. Alpha Go yaklaşık 25 milyon dolarlık bir donanımla çalışırken – bu tam olarak hafif bir sistem değil – biliyorsunuz AI guruları daha temiz, daha iyi veri kümeleri oluşturmak için uzun süredir çalışıyorlar. Bugün, birçok büyük veri seti, bir yapay zekayı doğru bir şekilde eğitmek için çok gürültülü - kötü verilerle dolu - olarak kabul ediliyor. AI verilerden öğreniyorsa ve veriler kötüyse, öğrenmez. Büyük sorun.

Ya temiz verilere değil, sadece deneyime ihtiyacınız varsa ve yapay zeka kendini eğitebilirse?

Alpha Go Zero'daki heyecan verici başarı budur. Niş, kural tabanlı oyun dünyasında olmasına rağmen, fiziksel kurallarla çalışan her endüstride büyük etkileri vardır - kimya, trafik, biyoloji, farmakoloji, seyahat, lojistik ve üretim gibi. Daha geniş bir deneyimden çalışabilecek kadar esnek ve her zaman daha güçlü beceriler yaratacak kadar yönlü kurallar tasarlayabilirsek - Alpha Go Zero gibi - o zaman sistemleri yöneten yapay zeka elde etmek mümkündür. Bu sistemlerin dış verilere ihtiyacı olmayacak, veri temizleme sorunları olmayacak ve döngüdeki insan yavaşlamalarına gerek kalmayacak. Bu kısmen, Google'ın ana şirketi Alphabet'in şirkete yapay zeka üzerine bahse girmesinin ve yapay zekaya hızlı bir şekilde yatırım yapmasının nedenidir. (Amazon, en son AI satın alma BodyLabs gibi yapay zekaya da yatırım yapıyor.)

Deep Mind profesörü David Silver, 'Bir programın üst düzey bir performans gösterdiğini görmemiz... insanlık için en zorlu ve en etkili sorunlardan bazılarının üstesinden gelmeye başlayabileceğimiz anlamına gelmelidir' diyor.

Bu gönderi, AI Libratus'un son zamanlarda insan tarafından girilen veriler yerine kendi kendine oynamayı içeren bir strateji kullanarak en iyi poker oyuncularını yendiğini netleştirmek için güncellendi.