
ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
-
- How a 1980s toy robot arm inspired modern robotics 世界の工学者を魅了し続ける 80年代の日本のおもちゃ
- AI can do a better job of persuading people than we do LLMが説得力で人間超え、相手に合わせて議論を調整
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- By putting AI into everything, Google wants to make it invisible AIは「見えないもの」へ——グーグルI/O、驚きの時代の終わり