AI情报Feb 9, 2026AI情报文章一个新的基准测试显示,即使像 Claude Opus 这样最先进的 AI 模型仍然经常出现幻觉(编造信息),即使配备了网络搜索功能。这突显了 AI 可靠性的一个持续存在的核心问题。Data Cube AI 编辑部2026年2月9日来源: The Decoder01来源简报一个新的基准测试显示,即使像 Claude Opus 这样最先进的 AI 模型仍然经常出现幻觉(编造信息),即使配备了网络搜索功能。这突显了 AI 可靠性的一个持续存在的核心问题。02相关话题研究与安全AI 安全基准测试幻觉可靠性查看本期