算不出和哪个大?六家大模型厂商总结了这些原因
-
算不出和哪个大?六家大模型厂商总结了这些原因
关于“9.11和9.9哪个大”,这样一道小学生难度的数学题难倒了一众海内外AI大模型。7月17日,第一财经报道了国内外“12个大模型8个都会答错”这道题的现象,大模型的数学能力引发讨论。“从技术人员的角度看答错这个问题并不惊讶。”在采访中,阿里通义实验室产品经理王晓明对第一财经表示,类似的问题是一个常见的数学计算和逻辑推理的问题,也是在模型训练和使用的过程中研发者常进行测试的case(案例),大模型“答对”或“答错”其实是个概率问题。除了通义千问外,第一财经记者也联系并采访了多家大模型厂商,腾讯混元团队、月之暗面K...