研究发现:AI 越聪明就越有可能“胡编乱造”
图源 Pexels
注意到,该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。
研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更高。
瓦伦西亚人工智能研究所在西班牙的研究员 José Hernández-Orallo 对《自然》杂志表示:“如今,它们几乎可以回答一切。这意味着更多正确的答案,但也意味着更多错误的答案。”
格拉斯哥大学的科学和技术哲学家 Mike Hicks 对此进行了更严厉的评价,Hicks(未参与该研究)告诉《自然》杂志:“在我看来,这就像我们所说的胡说八道,它越来越擅长假装知识渊博。”
测试中,这些模型被问及了从数学到地理等各种主题,并被要求执行诸如按指定顺序列出信息等任务。总体而言,更大、更强大的模型给出了最准确的答案,但在更难的问题上表现不佳,其准确率较低。
研究人员称,一些最大的“撒谎者”是 OpenAI 的 GPT-4 和 o1,但所有被研究的 LLM 似乎都呈这种趋势,对于 LLaMA 系列模型,没有一个能够达到 60% 的准确率,即使是最简单的问题。
而当被要求判断聊天机器人的回答是准确还是不准确时,一小部分参与者有 10% 到 40% 的概率判断错误。
总之研究表明,AI 模型越大(就参数、训练数据和其他因素而言),它们给出错误答案的比例就越高。
研究人员称,解决这些问题最简单的方法是让 LLM 不那么急于回答一切。Hernández-Orallo 称:“可以设置一个阈值,当问题具有挑战性时,让聊天机器人说‘不,我不知道’。”但如果聊天机器人被限制为只回答它们知道的东西,可能会暴露技术的局限性。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
华为生日礼券有什么用
华为生辰礼券有什么用是大家比拟关注的,究竟华为作为比拟受大家喜爱的品牌,很多友友都在应用,而近期该品牌新上线的生辰礼品券成了很多友 [详细] -
华为生日礼券哪些城市可以到线下领取礼物
华为生辰礼券是你购置了华为的产品就可以享有的福利,但是吧由于不是每个处所都有兑换礼物的实体店,所以华为生辰礼券哪些城市可以到线下领 [详细] -
华为会员生日礼物必须去直营店才能领到吗
华为会员生辰礼物必需去直营店能力领到吗是当下大家最为关注的话题,究竟就某书友友们晒出的礼物照片,还是值得跑一趟的,但是吧由于线下华 [详细] -
北方冬天白天冷还是晚上冷2024
随着冬季的来临,我国大部分地域的的气温都开端骤降,也正是因为这样北方冬天白天冷还是傍晚冷成了日常生活中大家茶余饭后讨论的焦点,下面 [详细] -
别来沾边是什么综艺
别来沾边是gai在很早以前中国新说唱里的豪言壮语,作为rapper的语言都是给人很冲的感到,其实gai本人挺有趣的,近期在《中国说唱巅峰对决》 [详细]