VRChat自律機械知能プロジェクト2024:好奇心でVRChatを探索するAIの中間報告!
詳細情報
※以下文章はスライド資料を元に自動生成されたものです。
発表のハイライト
- VRChat内で自律的に行動するAI「P-AMI<Q>」の開発プロジェクトが進行中!
- 2024年度版では、マルチスレッド化や学習モデルの変更により、より効率的かつ安定した動作を実現!
- 予測困難な環境でのAIの探索能力を検証するため、ランダムな飯テロ画像で埋め尽くされたワールドを作成!
VRChat自律機械知能プロジェクトとは?
VRChat自律機械知能プロジェクトは、VRChat上に自律機械知能を生み出し、その振る舞いから人間や知能そのものの理解を深めることを目指す、野心的なプロジェクトです。Earlクルツさんを中心としたML集会のメンバーが、2024年もこのプロジェクトを推進しています。
プロジェクトの目標は、VRChat内で自律的に行動するAIを開発し、その行動を記録・解析することで、人間の知能や行動を理解すること。さらに、研究成果を論文にまとめて学会で発表する計画も立てられています。
P-AMI<Q>:好奇心で動くAIの進化
このプロジェクトでは、VRChat上で自律的に行動するAI「P-AMI<Q>」を開発しています。「P-AMI<Q>」は「Primitive Autonomous Machine Intelligence on Q(Cu)riosity」の略で、好奇心を原動力としたAIです。
2023年には、原始的なP-AMI<Q>が実装され、好奇心ベースの内発的動機付けを報酬として学習し、VRChatワールドを探査し続けることができました。しかし、非同期処理の問題やモデルサイズ、計算リソースの非効率性など、いくつかの課題も存在していました。
2024年度版P-AMI<Q>:大幅な進化と改善
2024年度版では、これらの課題を解決するため、下記のような大幅な変更が加えられました。
処理をマルチスレッド化で非同期化!
- 従来のシステムでは、制御、推論、学習が順番に行われていましたが、2024年度版では、Mainスレッド、Inferenceスレッド、Trainingスレッドの3つのスレッドに分けて処理を行うように変更。これにより、推論と学習を同時に行うことができるようになり、AIの行動がよりスムーズかつ継続的になりました。
データとモデルの効率的な処理!
- Inferenceスレッドで収集と推論を行い、そのデータをTrainingスレッドに渡して学習を進めるように変更。
- 学習したモデルを素早く切り替えることで、Trainingスレッドが常に最新の状態のモデルを使って学習できるようになりました。
学習モデルの刷新!
- 観測エンコーダには、Yann LeCun氏が発表したI-JEPAを採用。画像に対する自己教師あり学習によって、世界の抽象的な表現を学習します。
- Forward Dynamicsには、myxyさんが開発したSioConvを採用。Transformerのように並列計算ができ、RNNのように逐次的推論も可能な、軽量で効率的なモデルです。
- 強化学習方式は、2023年度版と同じくPPOを採用しています。
予測困難な環境でAIの探索能力を検証!
AIの好奇心と探索能力を検証するために、ランダムな飯テロ画像で埋め尽くされたVRChatワールドを作成しました。このワールドでは、ブロックノイズのように、AIにとって予測が難しい環境が作り出されています。
田中スイセンさんが作成してくれた、秒間10枚程度のペースで切り替わる飯テロワールドで、AIがどのように振る舞い、探索していくのかが注目されます。
まとめ
VRChat自律機械知能プロジェクトは、VRChatというバーチャル空間で、AIの知能や行動を研究する、非常に興味深い試みです。2024年度版では、マルチスレッド化や学習モデルの変更など、大きな進化を遂げました。今後、予測困難な環境でのAIの探索能力の検証など、さらに興味深い研究が進められていくことでしょう。
VRChatでAIがどのように振る舞い、成長していくのか、今後の展開に期待しましょう!