VRChatワールド12万件分のデータ分析でわかったこととは? ~個人開発集会レポート~

詳細情報

集会名 個人開発集会
日時 2024年02月29日 22:00 - 22:30
テーマ VRChat のワールド情報が大量に集まっていた
発表者 みかん焼肉電機
発表資料 リンク

みかん焼肉電気さん、VRChatワールドデータの収集・分析を発表!

  • 4年弱、VRChatワールドの情報を収集しBigQueryに蓄積
  • 収集データを使い、ラボ抜けの条件や人気ワールドの傾向を分析
  • プライベートワールドの情報も取得可能だが、倫理的な観点から収集・分析は行わず

2023年[開催日時を追加]、VRChatの「個人開発集会」にて、みかん焼肉電気さんによる「VRChat のワールド情報が大量に集まっていた」というテーマの発表が行われました。

本記事では、その発表内容をわかりやすくまとめ、VRChatワールドデータ分析の面白さや可能性について迫ります。

なぜVRChatワールドの情報を集め始めたのか?

みかん焼肉電気さんは、もともとデータ分析を生業としており、過去にはECサイトの売上予測や自動運転のための画像認識など、多岐にわたる分野でデータ分析を行ってきました。

VRChatのワールド情報収集を始めたきっかけは、「VRChat APIからデータを取得できるなら、とりあえずBigQueryに入れてみよう」というシンプルなものでした。

BigQueryに眠っていたデータから見えてきたVRChatワールドの傾向

4年弱に渡り、VRChat APIを介して取得したワールド情報は、BigQuery上に蓄積され続けました。その結果、2023年2月時点で約12万件もの膨大なデータが収集されました。

データ分析の結果、以下のような興味深い傾向が明らかになりました。

ラボ抜けの条件

  • ワールドへの訪問数が200を超えると、ラボ抜けするワールドが急増する

日本語圏ワールドと非日本語圏ワールドのタグの違い

  • 日本語圏ワールド:「スリープ」「海」などのタグが多い
  • 非日本語圏ワールド:「furry」(ケモノ)などのタグが多い

その他

  • 収集したデータから、人気ワールドを予測できる可能性がある

倫理的な観点と今後の展望

発表では、プライベートワールドの情報についても言及がありました。VRChat APIを利用すると、プライベートワールドの情報も取得できてしまうという事実が明らかになりました。

しかし、みかん焼肉電気さんは、倫理的な観点からプライベートワールドの情報をBigQueryには格納せず、収集・分析は行っていません。

今後は、収集したデータを使って、マルチモーダルAIの教師データを作成することも検討しているとのことです。

まとめ

今回の発表では、VRChatワールドのデータ分析から、興味深い傾向や知見が得られることがわかりました。

VRChatは、メタバースプラットフォームとしても注目されており、今後ますますユーザーやワールドが増加していくことが予想されます。

VRChatワールドのデータ分析は、メタバースの利用状況やユーザーの行動を理解する上で、ますます重要性を増していくと言えるでしょう。