Skip to content
AI情报Feb 8, 2026AI情报
文章

像Gemini 3 Pro这样的多模态AI模型在新的基础视觉测试(WorldVQA)上表现不佳,准确率未能达到50%。该基准测试检验模型是真正识别图像中的物体还是仅仅猜测。这突显了令人印象深刻的演示能力与AI对世界的实际理解之间的显著差距。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

像Gemini 3 Pro这样的多模态AI模型在新的基础视觉测试(WorldVQA)上表现不佳,准确率未能达到50%。该基准测试检验模型是真正识别图像中的物体还是仅仅猜测。这突显了令人印象深刻的演示能力与AI对世界的实际理解之间的显著差距。