13.8和13.11哪个更大?
没想到
这样一道简单的数学题
竟引发网友激烈讨论
还难倒了不少大模型
13.8%和13.11%哪个大?
《歌手》排名引网友热议
上周
最新一期的《歌手》公布排名
孙楠得票13.8%
外国歌手香缇莫得票13.11%
引发了网友对排名的质疑
不少网友认为13.11%大于13.8%
因此香缇莫的得票率比孙楠高
随后
关于13.8和13.11大小比较的话题
迅速冲上微博热搜
其实,这个知识点
在小学四年级的课本中就有答案
然而,这道小学生难度的数学题
也难倒了一众海内外AI大模型
7月16日下午,南方都市报记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。
当记者输入“13.11和13.8,哪个数值更大?”时,Luca、Kimi、智谱清言均错误地表示13.11更大。其余6家大模型给出了正确答案,认为13.8更大。
Kimi认为
13.11比13.8更接近14
▼
智谱清言称
13.11在百分位上比13.80大
▼
Luca表示
13.11比13.8多了0.31
▼
一道简单数学比较题,大模型为何频频出错?
有技术专家告诉南都记者,在人们看来,这是一道小学生的数学算术题,但大模型不一定这样认为,它更经常见到这些数字是包含在软件版本号、股票、基金或者汇率等信息里,它们出现时跟数字大小本身没有关联。而大模型看到这样一组数字,意识不到应该做双精度浮点运算。
还有业内人士提出了一种解释称,这是大模型在输入词和标点向量化排序时,没有把顺序或者关联逻辑弄对,忽略了小数点也是数字的一部分。