AIインテリジェンスFeb 8, 2026AIインテリジェンス
記事
Gemini...
ProのようなマルチモーダルAIモデルは、新しい基本的な視覚テスト(WorldVQA)でパフォーマンスが低く、50%の精度を突破できません。このベンチマークは、モデルが画像内の物体を実際に認識しているのか、単に推測しているのかをテストします。これは、印象的なデモ機能とAIの世界に対する実際の理解との間に大きなギャップがあることを示しています。
Data Cube AI 編集部出典: The Decoder
ProのようなマルチモーダルAIモデルは、新しい基本的な視覚テスト(WorldVQA)でパフォーマンスが低く、50%の精度を突破できません。このベンチマークは、モデルが画像内の物体を実際に認識しているのか、単に推測しているのかをテストします。これは、印象的なデモ機能とAIの世界に対する実際の理解との間に大きなギャップがあることを示しています。