AI情报Feb 8, 2026AI情报文章像Gemini 3 Pro这样的多模态AI模型在新的基础视觉测试(WorldVQA)上表现不佳,准确率未能达到50%。该基准测试检验模型是真正识别图像中的物体还是仅仅猜测。这突显了令人印象深刻的演示能力与AI对世界的实际理解之间的显著差距。Data Cube AI 编辑部2026年2月8日来源: The Decoder01来源简报像Gemini 3 Pro这样的多模态AI模型在新的基础视觉测试(WorldVQA)上表现不佳,准确率未能达到50%。该基准测试检验模型是真正识别图像中的物体还是仅仅猜测。这突显了令人印象深刻的演示能力与AI对世界的实际理解之间的显著差距。02相关话题AI研究多模态AI基准测试弱点查看本期