资讯

A:ObfusQAte是印度理工学院等研究机构开发的AI评估框架,专门测试大语言模型处理"混淆问题"的能力。它将同一个问题包装成三种不同的"伪装形式":命名实体间接法(用描述代替直接名称)、干扰项间接法(添加错误但合理的选项)、背景过载法(用大量相关信息掩盖核心问题),以此检验AI在面对复杂表达时的推理能力。