全球视点!OpenAI公布大模型新训练方法:阻止ChatGPT“胡说八道”

2023-06-01 10:26:56 | 来源:黑科技

6月1日,据报道,当地时间周三,OpenAI公司通过论文介绍了一种全新的方法,来训练生成式人工智能语言模型。

OpenAI这一研究成果来得很是时候,最近,随着生成式人工智能技术流行,以及美国2024年总统大选初步启动,人工智能“胡说八道”的问题引发了史无前例的关注和讨论。

去年,OpenAI公司推出了人工智能对话撰稿工具ChatGPT,背后依托于GPT3和GPT4语言模型。ChatGPT的优秀表现在全世界掀起了生成式人工智能的一股风暴,两个月之内,相关服务的月度活跃用户超过了一亿人,用户增长速度创造了新的世界纪录。


(资料图片仅供参考)

OpenAI背后的大股东之一是微软,微软已经累计对该公司投资130亿美元。目前,OpenAI的市值大约为290亿美元。

人工智能“胡说八道”,术语上也被称为“AI幻觉”。面对用户的提问,ChatGPT以及谷歌的Bard等工具会杜撰出一些虚假信息,看上去像是权威正确的答案。

比如,今年2月谷歌针对Bard工具推出了一个演示视频,视频中Bard有关美国韦伯太空望远镜的描述就存在错误。此外,美国纽约的几位律师最近使用ChatGPT撰写法律文件,ChatGPT描述了完全虚构的案例,这些律师将面临处罚。

OpenAI公司的研究人员表示,即使是最先进的人工智能模型也会杜撰虚假信息,尤其是在拿不准的时候,它们往往倾向于编造事实。

研究人员表示,在要求多步骤推理的领域,人工智能胡编的后果尤为严重,因为一个单一的逻辑错误会导致整个解决方案“翻车”。

OpenAI准备采用新战略,防止人工智能胡编。比如在过去,一旦提供一个正确的最终答案,模型会获得某种鼓励,但是以后,在每一个单一的逻辑推理环节如果表现正确,就将获得鼓励反馈。这种模式也被称之为“过程监督”(以往的模式术语“结果监督”)。

研究人员表示,“过程监督”模式有助于产生更加清晰合理的回答,它将会鼓励生成式人工智能能够像人类一样,在推理思考中做到“环环相扣”。

OpenAI公司“随机生成数学”研究专家卡尔·柯比(Karl Cobbe)表示,发现并且减少人工智能模型的逻辑错误,也就是“AI幻觉”,是构建“通用人工智能”的关键一步。另外,“过程监督”模式并非OpenAI公司发明,但是该公司正在加以推广普及。

柯比表示,新方法的目的,是解决人工智能胡编问题,从而让语言模型能够解决更加复杂的推理难题。

这位专家介绍,OpenAI已经发布了一个研究使用的数据集,包括80万条人工标签,可用上述新模式训练语言模型。

不过,美国电子隐私信息中心的资深律师本·魏特斯(Ben Winters)对这种新的训练模式表示质疑,他希望亲自查看OpenAI的完整数据集,以及相关的例子。

魏特斯表示,目前生成式人工智能还处于野蛮生长时代,OpenAI的新模式还无法实质性缓解AI胡编乱造错误答案的问题。

这位律师表示,最重要的是,OpenAI是否会将一些研究论文成果部署到实际产品中,如果没有这样的计划,这将会引发社会质疑,即他们到底要向公众发布怎样的最终产品。

美国布朗大学的学者维克塔(Suresh Venkatasubramanian)表示,目前还不清楚OpenAI的研究论文是否经过了同行评议,他认为这一研究还仅仅停留在“初步观察”阶段。

维克塔表示,在做出某种确定性结论之前,研究论文还需要在学术圈子内进行更多传播。他认为,如今,人工智能领域每天都会有很多研究成果,但是“大型语言模型”在工作时存在不稳定性,因此在某种条件、背景或者模式下的运行结果,可能无法应用于另外一种条件、背景或模式。

维克塔认为,在人工智能胡编的问题中,包括了语言模型胡编一些他人引言或者参考信息。OpenAI的新论文并没有证据能解决这一问题。

OpenAI专家柯比表示,未来将会在学术会议上把论文交给其他人,进行同行评议。对于何时将会把研究成果和“过程监督”整合到ChatGPT等最终产品中,OpenAI尚未发表官方评论。

美国人工智能研究专家萨拉·迈尔斯·韦斯特(Sarah Myers West)表示,人工智能公司开始解决虚假答案问题,这是一个好消息,但OpenAI目前的论文还停留在“公司内部研究”的阶段,还需要攻克更多难关。

韦斯特表示,在论文中,OpenAI发布一个“人类级反馈”的小规模数据集,但是并没有训练GPT4模型所用数据的更多介绍。虽然生成式人工智能已经开始改变普通人的工作生活,但是距离“负责任的人工智能应用”,还存在相当多的技术挑战。

上一篇 下一篇

相关新闻

全球视点!OpenAI公布大模型新训练方法:阻止ChatGPT“胡说八道”

如何用骨粉、泻盐和糖种植大丽花_女儿的生日礼物送什么

郭德纲妻子近照被抓拍,瘦身后颜值回春,穿时尚染头发打扮似辣妹|每日精选

世界热推荐:黑豹原名“煤老虎”,浩克也被怒摔过,这些漫威趣事你知道吗?

【环球热闻】莫普拉(关于莫普拉的简介)

陪孩子读一本兴趣好书,《真的有外星人吗》,培养孩子的畅想思维_每日看点

世界热消息:党建联盟“温暖”童心 共话科普助力成长

五台山简介和传说(五台山简介)-环球最新

结婚礼仪风俗_中国婚礼习俗

天津河北区初中招生政策一览

工信部:前4月规上互联网企业利润总额同比增62.1%

塞尔达传说王国之泪鼓隆城火之神殿主线任务完成攻略详情

中美竞逐脑机接口赛道 这个“黑科技”离落地应用还有多远? 焦点报道

当前短讯!贾跃亭开抖音关注前妻甘薇

山东钢铁(600022.SH):拟3.38亿元对莱芜分公司炼铁厂老区原料场环保封闭及智能化改造

最新新闻

全球视点!OpenAI公布大模型新训练方法:阻止ChatGPT“胡说八道”

如何用骨粉、泻盐和糖种植大丽花_女儿的生日礼物送什么

郭德纲妻子近照被抓拍,瘦身后颜值回春,穿时尚染头发打扮似辣妹|每日精选

世界热推荐:黑豹原名“煤老虎”,浩克也被怒摔过,这些漫威趣事你知道吗?

【环球热闻】莫普拉(关于莫普拉的简介)

陪孩子读一本兴趣好书,《真的有外星人吗》,培养孩子的畅想思维_每日看点

世界热消息:党建联盟“温暖”童心 共话科普助力成长

五台山简介和传说(五台山简介)-环球最新

结婚礼仪风俗_中国婚礼习俗

天津河北区初中招生政策一览

工信部:前4月规上互联网企业利润总额同比增62.1%

塞尔达传说王国之泪鼓隆城火之神殿主线任务完成攻略详情

中美竞逐脑机接口赛道 这个“黑科技”离落地应用还有多远? 焦点报道

当前短讯!贾跃亭开抖音关注前妻甘薇

山东钢铁(600022.SH):拟3.38亿元对莱芜分公司炼铁厂老区原料场环保封闭及智能化改造

看“星”选药店!宝山首次授牌药品零售企业分类分级公示牌

浙大网新:网新恒天中标某大型股份制银行资金交易系统升级项目-今热点

普联软件:5月30日融资买入790.46万元,融资融券余额3830.68万元

故意毁坏财物罪追诉标准是怎样的

六年级月光曲课文原文课后题(六年级月光曲课文原文)

沪深股通|新乡化纤5月30日获外资买入0.03%股份

迪拜世贸中心2022年总增量经济产出35.5亿美元

热点在线丨人民银行上海总部副主任孙辉:4月上海新发放企业贷款加权平均利率3.57%,处于历史最低水平

全国制茶大赛湖北团体第四|全球热议

惠民保投保热潮再起!5月新发三款“顶流”产品,参保率仍有较大提升空间

高层公摊面积范围(高层房屋公摊面积标准有哪些)

“舟山时间”点亮中国文旅大消费年度峰会 “星辰大海”计划获“龙雀奖”年度最佳目的地招商引资示范项目|全球观天下

全球滚动:马诗慧性感泳装迎战酷热天气,上围坚挺纤腰练出腹肌

一个合格的物流仓库管理人员应该掌握的四个管理模块

世界热点!招贤纳士:我们寻找同路人