奶不够吃是什么原因| 牙龈为什么会萎缩| 烂嘴唇是什么原因引起的| 左后背疼什么原因| 71年猪是什么命| 养尊处优的意思是什么| 庚子是什么时辰| 乔迁之喜送什么| 椰子煲汤放什么材料| 花椒什么时候传入中国| 经验是什么意思| 耳膜穿孔有什么症状| 血管瘤吃什么药| 阴道口痒用什么药| 为什么会气虚| 吃什么可以减肥肚子| 什么是甲减有什么症状| 西门子洗衣机不脱水是什么原因| 桂花树施什么肥| 木瓜什么味道| 得瑟是什么意思| 耳鸣脑鸣是什么原因引起的| 胜利在什么| 什么东西能加不能减| 荒淫无度是什么意思| 子宫有问题有什么症状| 北伐是什么意思| 天丝是什么材料| 梦见打死猫有什么预兆| 琳琅是什么意思| 这是什么石头| 饕餮什么意思| 阴米是什么米| 心衰病人吃什么食物好| 河蚌吃什么| 花痴病是什么症状| 睡觉多梦是什么原因| 七一是什么节| 重日是什么意思| 10月1日是什么日子| 脚爆皮是什么原因| 电脑长期不关机有什么影响| 逢九年应该注意什么有什么禁忌| 20岁属什么| 右耳朵痒是什么预兆| 金粉是什么| hbeag阳性是什么意思| molly什么意思| 传销是什么意思| 钥字五行属什么| 色斑是什么原因引起的| 2b是什么意思| 梦见鳄鱼是什么预兆| 金蝉吃什么| 爱什么稀罕| 中性粒细胞百分比偏低是什么意思| 菠萝什么季节成熟| 六味地黄丸适合什么人吃| inr是什么意思| 恰如其分是什么意思| 理工男是什么意思啊| 什么品种的榴莲最好吃| 手上螺纹多少代表什么| 异常心电图是什么意思| 什么样的人做什么样的事| 尿痛什么原因| 怀孕胸部会有什么反应| 子宫平滑肌瘤什么意思| 什么是静脉| 花字五行属什么| 隔桌不买单是什么意思| 斑马吃什么| 羡慕是什么意思| 属鼠男和什么属相最配| 网络用语是什么意思| 霸王餐是什么意思| 为什么同房过后会出血| 什么茶解暑| 神是什么偏旁| 脚趾头长痣代表什么| 大校上面是什么军衔| 胆囊炎吃什么食物好| 鸡代表什么数字| 脚心发麻是什么原因引起的| 硕士研究生是什么意思| 卵巢筛查要做什么检查| 床上用品四件套都有什么| 9月9号是什么星座| 通宵是什么意思| 右侧中耳乳突炎是什么意思| kiss什么意思| 身上长小红痣是什么原因| 同学过生日送什么礼物好| 你是什么动物| 低血压低是什么原因| 蒹葭苍苍是什么意思| 飞蚊症是什么症状| 蜈蚣最怕什么| 喉咙发炎用什么药| 什么不什么什么| 尿频尿急尿痛吃什么药| 耳朵发炎吃什么药| 2003属什么生肖| 一月28号是什么星座| 籺是什么意思| 天秤座和什么星座最配| 泰安有什么大学| 宝妈男是什么意思| 生命之水是什么| 白猫是什么品种| pe和pb是什么意思| 头晕是什么原因| 伤口愈合慢是什么原因| 脚趾头麻木是什么原因引起的| 4t什么意思| 重庆有什么特产| 上火流鼻血是什么原因| 嘴唇神经跳动是什么原因| 勾绞煞是什么意思| 为什么白醋把纹身洗掉了| 紫荆花代表什么生肖| 秘诀是什么意思| 频繁感冒是什么原因| 留低是什么意思| 三重一大是什么内容| 身份证是什么字体| 精囊在什么位置| 省政协主席是什么级别| 什么情况下做喉镜| 鹅蛋有什么好处| butter是什么意思| 眼角痒用什么眼药水| 毛毛虫吃什么食物| 虹膜是什么意思| 康桑密达是什么意思| 什么症状需要做膀胱镜| 迪士尼狗狗叫什么名字| 沙眼衣原体是什么意思| 什么马不能骑| tvt是什么意思| 宝宝消化不良吃什么| 中医的精髓是什么| 1989年是什么蛇| 司长是什么级别的官| 男人吃什么补肾壮阳效果最好| 脸上经常长痘痘是什么原因| 儿童回春颗粒主要治什么| 秘诀是什么意思| 一个丝一个鸟读什么| 淋巴炎挂什么科| lv是什么| 腰间盘膨出和突出有什么区别| 鼻基底填充用什么材料比较好| 小虾吃什么| 肝火胃火旺盛吃什么药| 为什么微信运动总是显示步数为0| 丰胸吃什么| 钾高吃什么可以降下来| 皮炎是什么| 男的叫少爷女的叫什么| 黄瓜吃多了有什么坏处| 金蟾折桂什么意思| 整形什么医院好| 黄精配什么提高性功能| p是什么意思医学| 鸡眼去医院挂什么科| 灰什么| 男性全身皮肤瘙痒是什么原因| 抱持是什么意思| 戊肝阳性是什么意思| 什么叫阴吹| 脑梗应该挂什么科| 碳酸氢钠有什么作用| 什么是像素| 10月31日什么星座| 梦到涨大水预示着什么| 猫的耳朵有什么作用| 浮想联翩是什么意思| 麦冬长什么样子图片| 正襟危坐什么意思| 针灸有什么作用| 镜片什么材质好| 骨折有什么症状| 高净值什么意思| 郑板桥是什么生肖| 手链断了是什么预兆| 鸭梨是什么颜色| 头皮脂溢性皮炎用什么洗发水| 黄斑前膜是什么病| 老被蚊子咬是什么原因| 菊花是什么季节| 迪拜为什么那么有钱| 颈动脉彩超挂什么科| 去草原穿什么衣服拍照好看| 隐性基因是什么意思| wz是什么意思| 中级会计什么时候报名| 补刀什么意思| 十年是什么婚| 哺乳期可以吃什么水果| 舌头辣辣的是什么原因| 我是舅舅的什么人| 鲍鱼是什么意思| dsa是什么意思| 真心话大冒险问什么| 胃疼检查什么项目| 阴道炎什么症状| 莫欺少年穷是什么意思| 什么是肺磨玻璃结节| super是什么意思| 去拉萨需要准备什么| 灵五行属性是什么| 肠子有问题有什么症状| 口臭药店买什么药吃| 检查幽门螺杆菌挂什么科| 皮神经炎是什么症状| 弯是什么意思| qw医学上是什么意思| 胃造影和胃镜有什么区别| 水肿是什么样子| 循序渐进是什么意思| 儿童测骨龄挂什么科| 什么样的男人值得托付终身| 立flag什么意思| 低烧是什么症状| 喝什么可以排便通畅| 期许是什么意思| 手抖心慌是什么原因| 女生的胸部长什么样| 七月十五日是什么节日| mh是什么单位| 梦见别人开车撞死人是什么意思| 社畜是什么意思| 子卯相刑有什么危害| 醋酸氯已定是什么药| 尿素氮高吃什么药| 红军为什么要长征| 春眠不觉晓的晓是什么意思| 吃什么对睡眠好| 冠脉造影是什么意思| 什么是正太| 性生活时间短吃什么药| 有鸟飞进屋是什么预兆| 怀孕后期脚肿是什么原因| 巽是什么意思| 驾驶证b2能开什么车| 谷丙转氨酶偏低是什么意思| 蝙蝠是什么动物| 电脑一体机什么牌子好| 梦见挖红薯是什么意思| pd是什么病| 秋天有什么水果| 老板娘是什么意思| 舌苔重是什么原因| 妈妈弟弟的儿子叫什么| 恪尽职守是什么意思| 心电图j点抬高什么意思| 花胶是鱼的什么部位| 孩子高烧不退是什么原因| 血压低什么原因造成的| 沙门氏菌是什么| 喝什么茶清肺效果最好| 十多块钱的烟什么好抽| 青蒜是什么| 百度

谷歌研究:大语言模型在压力下会放弃正确答案

VentureBeat
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。
百度 虽然军旅+警犬不好做,不可控性较强,又是独一份,没有参照物,但如果做好了,也就开辟了另类综艺类型

本文来自至顶网(ai.zhiding.cn),来源:VentureBeat。

谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。

谷歌DeepMind和伦敦大学学院的研究人员发表了一项新研究,揭示了大语言模型如何形成、维持和失去对答案的信心。研究发现大语言模型的认知偏见与人类存在惊人的相似性,同时也突出了明显的差异。

研究显示,大语言模型可能对自己的答案过于自信,但在面对反驳时会迅速失去信心并改变想法,即使反驳是错误的。理解这种行为的细微差别对如何构建大语言模型应用程序有直接影响,特别是跨越多轮对话的对话界面。

**测试大语言模型的信心**

大语言模型安全部署的关键因素是其答案要伴随可靠的信心感(模型分配给答案Token的概率)。虽然我们知道大语言模型可以产生这些信心分数,但它们在多大程度上能够使用这些分数来指导适应性行为还没有很好的描述。也有经验证据表明,大语言模型可能对初始答案过于自信,但也对批评高度敏感,并很快对同一选择变得缺乏信心。

为了研究这一点,研究人员设计了一个受控实验,测试大语言模型在面对外部建议时如何更新信心并决定是否改变答案。在实验中,"回答大语言模型"首先被给予一个二元选择问题,例如从两个选项中识别城市的正确纬度。在做出初始选择后,大语言模型会收到来自虚构的"建议大语言模型"的建议。这个建议附带明确的准确率评级(例如"这个建议大语言模型有70%的准确率"),并且会同意、反对或对回答大语言模型的初始选择保持中立。最后,回答大语言模型被要求做出最终选择。

实验的关键部分是控制大语言模型自己的初始答案在第二次最终决定时是否对其可见。在某些情况下会显示,在其他情况下会隐藏。这种独特的设置在人类参与者身上是不可能复制的,因为人类无法简单地忘记他们之前的选择,这使研究人员能够分离出对过去决定的记忆如何影响当前的信心。

基线条件中,初始答案被隐藏,建议保持中立,这确定了大语言模型的答案仅仅由于模型处理中的随机变异可能发生多大程度的变化。分析重点关注大语言模型对其原始选择的信心在第一轮和第二轮之间如何变化,清楚地显示了初始信念或先验如何影响模型的"改变想法"。

**过度自信和缺乏信心**

研究人员首先检查了大语言模型自己答案的可见性如何影响其改变答案的倾向。他们观察到,当模型能够看到其初始答案时,与答案被隐藏时相比,它显示出较少的转换倾向。这一发现指向了一种特定的认知偏见。正如论文所指出的,"这种效应——在考虑最终选择时,当选择可见(而不是隐藏)时,坚持初始选择的倾向更大——与人类决策研究中描述的现象密切相关,即选择支持偏见。"

研究还证实模型确实整合了外部建议。面对反对建议时,大语言模型显示出增加的改变想法倾向,而在建议支持时则减少。研究人员写道:"这一发现表明回答大语言模型适当地整合了建议的方向来调节其改变想法的速率。"然而,他们还发现模型对相反信息过于敏感,因此执行了过大的信心更新。

有趣的是,这种行为与人类经常出现的确认偏见相反,人类倾向于支持证实其现有信念的信息。研究人员发现大语言模型"过度重视反对而不是支持建议,无论模型的初始答案是可见还是隐藏"。一个可能的解释是,像从人类反馈中进行强化学习(RLHF)这样的训练技术可能会鼓励模型过度顺从用户输入,这是一种被称为阿谀奉承的现象(这对AI实验室来说仍然是一个挑战)。

**对企业应用的影响**

这项研究证实,AI系统并非人们通常认为的纯粹逻辑智能体。它们表现出自己的一套偏见,一些类似于人类认知错误,另一些则是其独有的,这可能使它们的行为在人类看来是不可预测的。对于企业应用,这意味着在人类和AI智能体的延长对话中,最近的信息可能对大语言模型的推理产生不成比例的影响(特别是如果它与模型的初始答案相矛盾),可能导致它丢弃最初正确的答案。

幸运的是,正如研究也显示的那样,我们可以通过人类无法做到的方式操纵大语言模型的记忆来减轻这些不必要的偏见。构建多轮对话智能体的开发人员可以实施策略来管理AI的上下文。例如,长对话可以定期总结,关键事实和决定以中性方式呈现,并剥离哪个智能体做出了哪个选择。然后可以使用这个总结来启动新的、精简的对话,为模型提供一个干净的推理起点,并帮助避免在延长对话中可能出现的偏见。

随着大语言模型更深入地集成到企业工作流程中,理解其决策过程的细微差别不再是可选的。遵循像这样的基础研究使开发人员能够预测和纠正这些固有偏见,从而构建不仅更有能力,而且更稳健和可靠的应用程序。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论
睡觉手麻木是什么原因 颈椎压迫神经手麻吃什么药 放屁臭什么原因 佰草集适合什么年龄 世界上最长的英语单词是什么
肺气囊是什么病 cc是什么单位 吃完晚饭就犯困是什么原因 大龄补贴需要什么条件 人生得意须尽欢什么意思
标准工资指什么 婴儿流口水是什么原因引起的 呼吸道感染一般用什么消炎药 hpv感染用什么药 羊肉炖什么
马达是什么 抑制剂是什么 离线缓存是什么意思 什么是led灯 一个三点水一个及念什么
冰箱里有什么细菌shenchushe.com 黥面是什么意思hcv8jop4ns8r.cn 盆腔积液吃什么药效果好shenchushe.com 用什么消肿最快最有效方法hcv8jop4ns8r.cn 小猫呕吐吃什么药hcv8jop1ns1r.cn
鸿运当头是什么意思hcv8jop5ns7r.cn 女娲姓什么hcv7jop9ns2r.cn 荨麻疹可以吃什么食物hcv8jop1ns0r.cn 什么是抹茶hcv9jop3ns3r.cn 喉咙干吃什么药hcv9jop0ns5r.cn
耳鸣是什么hcv8jop6ns1r.cn 舀水是什么意思hcv9jop2ns9r.cn 脚气缺什么维生素hcv9jop3ns2r.cn 首长是什么意思hcv8jop8ns9r.cn 女人胆固醇高什么原因hcv9jop1ns8r.cn
眼睑痉挛挂什么科hcv7jop5ns0r.cn 山东济南有什么好玩的地方hcv9jop4ns4r.cn 后知后觉什么意思hcv8jop5ns4r.cn 麂皮是什么材质hcv7jop9ns7r.cn 卵巢下降是什么原因hcv8jop2ns6r.cn
百度