TL; DR: Edinburgh Üniversitesi ve Adobe Research'teki bilgisayar bilimi araştırmacıları, video oyunu karakterlerinin çevreleriyle daha doğal etkileşime girmesini sağlamak için kullanılabilecek bir yapay zeka geliştirdiler. Teknik, bir karakteri belirli bir senaryoda hareketlerini çıkararak doğru bir şekilde canlandırmak için "nöral durum makinesi" veya NSM adı verilen derin bir sinir ağı kullanır.

8 ve 16 bitlik günlerde video oyunu, karakter animasyonları oldukça ilkeldi, oyunların çoğu statik ortamlara ve sınırlı etkileşime sahipti. Bu nedenle, avatarın hareketleri çok farklı animasyonlar gerektirmedi.

Geçişten sonra 3D oyunlar, canlandırma görevleri daha karmaşık hale geldi. Artık oyunlar keşfetmek ve etkileşim kurmak için devasa açık dünyalarla çok daha karmaşık hale geldiğine göre, oyun içi karakterleri canlandırmak yüzlerce hatta binlerce farklı hareket becerisi gerektiriyor.

Animasyon sürecinin sıkıcılığını hafifletmenin ve daha hızlı hale getirmenin bir yolu, hareket yakalama (mo-cap) aktörlerin hareketlerini karşılık gelen karakter animasyonlarına dönüştürmek için. Sonuç, daha gerçekçi görünen oyun içi hareketlerdir. Bununla birlikte, bir oyuncunun çevre ile etkileşime girebileceği her yolu yakalamak neredeyse imkansızdır.

Ayrıca, animasyonlar arasındaki geçişler biraz garip ve konserve görünebilir. Genellikle, hareketler arasındaki değişiklikler her seferinde aynı şekilde çalışan yeniden kullanılan algoritmalar tarafından gerçekleştirilir. Bir karakterin bir sandalyede nasıl oturabileceğini veya bir kutu koyabileceğini düşünün. Nesnelerin boyutu değiştiğinde daha da karmaşıklaşır. Kollarını farklı boyutlarda sandalyelere oturtmak veya değişen boyut ve şekildeki nesneleri kaldırmak canlandırmak için hantal hale gelir.

Onların kâğıt, "Karakter-Sahne Etkileşimleri için Nöral Durum Makinesi", ekip bir nesneyi alma örneğini kullanarak belirli bir animasyonun karmaşıklıklarını gösterir. Öğe kaldırılmadan önce, yürümeye başlama, yavaşlama, ayaklarını doğru yerleştirirken geri dönme ve nesne ile etkileşim dahil olmak üzere çeşitli hareketler düşünülmeli ve canlandırılmalıdır. Tüm bunlar, öğeyi alma işleminden önce gerçekleşir.

Araştırmacılar buna "planlama ve adaptasyon" adını veriyor ve derin öğrenme burada devreye giriyor.

Doktora öğrencisi ve makalenin kıdemli yazarı Sebastian Starke (yukarıdaki video), "Üretime hazır kalitede bunu başarmak kolay ve zaman alıcı değil" diyor. "Nöral Durum Makinemiz bunun yerine doğrudan sahne geometrisinden hareket ve gerekli durum geçişlerini ve belirli bir hedef eylemi öğrenir. Bununla birlikte, yöntemimiz tek bir ağdan yüksek kalitede birden fazla farklı türde hareket ve eylem üretebilir."

NSM, doğal olarak bir hareketten diğerine nasıl geçileceğini öğrenmek için mo-cap verileri kullanılarak eğitilir. Ağ, karakterin bir sonraki pozunu hem önceki pozuna hem de sahne geometrisine dayanarak ihlal eder.

Örneğin, bir kapı girişinden geçen bir avatarın animasyonları, bir nesne girişi engellediğinde farklı olacaktır. Karakterin sadece içinden geçmek yerine engeli aşması ya da üzerinden geçmesi gerekir.

Araştırmacıların yarattığı çerçeve, kullanıcıların basit kontrol komutlarıyla karakteri ortamlarda taşımasına olanak tanır. Ek olarak, NSM ağının tüm hareket yakalama verilerini tutmasını gerektirmez. Bir animasyon öğrenildikten sonra, öğrenilen davranışı korurken mo-cap sıkıştırılır ve saklanır.

Edinburgh Üniversitesi'nde bilgisayar grafiklerinin başkanı olan gazetenin ortak yazarı Taku Komura, "Teknik esasen bir insanın bir sahne veya ortamda sezgisel olarak nasıl hareket ettiğini ve nesnelerle gerçekçi ve kesin olarak nasıl etkileşime girdiğini taklit ediyor." Dedi.

Araştırmacılar, karakteri bir kalabalığın içinden doğal olarak taşımak veya aynı anda birden fazla eylem yapmak gibi diğer ilgili senaryolar üzerinde çalışmaya devam etmeyi planlıyorlar. Assassin's Creed oyunlarında kalabalığa yönelen tekrarlayan ve dalgalı hareketleri düşünün.

Ekip şu anki araştırmasını 17-20 Kasım'da Brisbane, Avustralya'da düzenlenen ACM Grafik / Siggraph Asya'da İşlemler'de sunacak.