VRChatワールド12万件分のデータ分析でわかったこととは? ~個人開発集会レポート~
詳細情報
みかん焼肉電気さん、VRChatワールドデータの収集・分析を発表!
- 4年弱、VRChatワールドの情報を収集しBigQueryに蓄積
- 収集データを使い、ラボ抜けの条件や人気ワールドの傾向を分析
- プライベートワールドの情報も取得可能だが、倫理的な観点から収集・分析は行わず
2023年[開催日時を追加]、VRChatの「個人開発集会」にて、みかん焼肉電気さんによる「VRChat のワールド情報が大量に集まっていた」というテーマの発表が行われました。
本記事では、その発表内容をわかりやすくまとめ、VRChatワールドデータ分析の面白さや可能性について迫ります。
なぜVRChatワールドの情報を集め始めたのか?
みかん焼肉電気さんは、もともとデータ分析を生業としており、過去にはECサイトの売上予測や自動運転のための画像認識など、多岐にわたる分野でデータ分析を行ってきました。
VRChatのワールド情報収集を始めたきっかけは、「VRChat APIからデータを取得できるなら、とりあえずBigQueryに入れてみよう」というシンプルなものでした。
BigQueryに眠っていたデータから見えてきたVRChatワールドの傾向
4年弱に渡り、VRChat APIを介して取得したワールド情報は、BigQuery上に蓄積され続けました。その結果、2023年2月時点で約12万件もの膨大なデータが収集されました。
データ分析の結果、以下のような興味深い傾向が明らかになりました。
ラボ抜けの条件
- ワールドへの訪問数が200を超えると、ラボ抜けするワールドが急増する
日本語圏ワールドと非日本語圏ワールドのタグの違い
- 日本語圏ワールド:「スリープ」「海」などのタグが多い
- 非日本語圏ワールド:「furry」(ケモノ)などのタグが多い
その他
- 収集したデータから、人気ワールドを予測できる可能性がある
倫理的な観点と今後の展望
発表では、プライベートワールドの情報についても言及がありました。VRChat APIを利用すると、プライベートワールドの情報も取得できてしまうという事実が明らかになりました。
しかし、みかん焼肉電気さんは、倫理的な観点からプライベートワールドの情報をBigQueryには格納せず、収集・分析は行っていません。
今後は、収集したデータを使って、マルチモーダルAIの教師データを作成することも検討しているとのことです。
まとめ
今回の発表では、VRChatワールドのデータ分析から、興味深い傾向や知見が得られることがわかりました。
VRChatは、メタバースプラットフォームとしても注目されており、今後ますますユーザーやワールドが増加していくことが予想されます。
VRChatワールドのデータ分析は、メタバースの利用状況やユーザーの行動を理解する上で、ますます重要性を増していくと言えるでしょう。