イージーな見た目なのにまともに走ることすら困難なことで知られる短距離走ゲーム「QWOP」の攻略に機械学習でチャレンジ。試行錯誤の末、1分8秒という大記録を達成する動画です。

「QWOP」を遊んだことがある人は分かると思いますが、主人公は一瞬でバランスを崩して転倒するため、距離を伸ばすには安定感があるほうが有利になります。実際、AIが8時間かけて習得したのは画像のような「ヒザを擦って前進する」という方法。しかしこれではスピードが出ません。

そこで作者は自分のプレー50回分のデータを入力し、学習させることにしました。

こうすることでQWOPは実際の人間と同じように足を振り上げて走るようになりました。トッププレイヤー達の動きにはまだまだ及びません。

そこで今度はQWOPスピードラン界のトップランカーに協力を依頼。

彼の走行データとAIの学習データをミックスしたものを「経験」として再度トレーニング。

そうするとトップランカー達の用いる「足を大きく振り上げてその慣性でスピードをつける」という方法を学習、1分8秒という大記録を達成することができました。

動画はこちらから。
AI learns to Speedrun QWOP (1:08) using Machine Learning – YouTube

空軍パイロット相手の空中戦でも圧勝できるほどAIというのは強力ですが、それでもQWOPでは人間に軍配が上がるあたり、QWOPの魔窟っぷりが伝わってくるようです。1
DARPA主催の人工知能空中戦コンテストの優勝AIがシミュレーションで人間のパイロット相手に完勝する動画 – DNA