报告主题:MATH-Perturb:评估大语言模型在面对复杂改动时的数学推理能力报告日期:02月27日(本周四)10:30-11:30报告要点:大型语言模型在高难度数学推理任务上展现出了令人惊叹的能力,这引发了其是由真正的推理能力还是记忆能力(背题) ...