当前位置:首页 > 资讯

研究发现:AI生成答案超三成“不可靠”

2025-09-19 来源:网络

  据英国《新科学家》周刊网站9月16日报道,生成式人工智能(AI)工具及其驱动的深度研究智能体和搜索引擎经常给出缺乏依据和存在偏见的说法,它们引述的资料并不支持这样的说法。一项分析得出了上述结论,它发现,AI工具提供的答案有大约三分之一缺乏可靠资料的支持。对开放人工智能研究中心(OpenAI)的GPT-4.5来说,这一比例更高,达到47%。

  赛富时公司AI研究部门的普拉纳夫·纳拉亚南·文基特和他的同事测试了一些生成式AI搜索引擎,包括OpenAI的GPT-4.5和GPT-5、You.com、“解惑”和微软的必应聊天。此外,他们还测试了5个深度研究智能体:GPT-5的深度研究功能、必应聊天的深度思考选项以及You.com、谷歌“双子座”和“解惑”提供的深度研究工具。

  纳拉亚南·文基特说:“我们希望对生成式搜索引擎进行社会技术评估。”目的是确定答案的质量及人类应该如何对待其中包含的信息。

  他们要求不同的AI引擎回答303个问题,评价AI的回应使用了8个指标。研究人员把这套指标称为DeepTrace。其设计目的是检测某个答案是否过于片面或自信,它与问题的相关性如何,它引述了什么资料,引述的资料对答案给出的说法有多少支持,以及引述的资料的详尽程度。

  问题大致被分成两组:第一组包含一些有争议的问题,以发现AI回应中的偏见;第二组用于检测一系列领域的专业知识,包括气象学、医学和人机交互。

  总的来说,AI驱动的搜索引擎和深度研究工具表现得相当差。

  研究人员发现许多模型给出了过于片面的答案。必应聊天搜索引擎给出的答案有大约23%包含缺乏依据的说法,而You.com和“解惑”AI搜索引擎的这一比例为31%左右。GPT-4.5给出的缺乏依据的说法更多,为47%,而“解惑”深度研究智能体的该比例高达97.5%。纳拉亚南·文基特说:“看到这样的情况确实让我们很惊讶。”

责任编辑:郑容

声明:

1、内容征集与合作:诚邀各界提供新闻稿件、文学创作;承接单位工作资讯代发服务;同步转发各类正能量文章;专业策划并刊登多种软性广告。

2、免责声明: 本平台转载并标注来源的作品,旨在拓宽信息传播渠道,不代表本平台对其观点的认同或内容真实性的背书,亦不承担该类作品因侵权引发的直接及连带责任。 同时,我们秉持分享理念,尊重原创权益。若涉及作品侵权,请及时与我们联系,我们将在24小时内予以删除,感谢理解与支持!

3、如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。电话:13716035981

相关阅读

  今年是京津冀协同发展战略提出12年。来自中国铁路北京局集团有限公司(以下简称“国铁北京局”)的数据显示,12年间京津冀铁路网布局持续优化,区域内高铁总里程从

2026-04-08

  一湾浅浅的海峡,隔不断两岸亲人的浓浓乡愁。被称为"灵魂摆渡人"的台湾高雄祥和里里长刘德文,从2003年起,数十年如一日奔走海峡两岸,将430多位赴台老兵的骨灰护送回大陆家乡,

2026-04-08

  阳春三月,辽宁鞍钢西鞍山铁矿项目施工现场一派繁忙。开挖直径8.1米、重达数百吨的“钢铁脊梁号”宛如一艘“地下航母”,正加速向深地掘进。  深地

2026-04-08

  随着人工智能算力需求爆发式增长与全球低轨卫星星座加速部署,太空算力已成为全球科技竞争的新前沿,正处于从技术验证迈向规模化部署的关键阶段。  “太空算力涉及

2026-04-08

  澳大利亚莫纳什大学联合日本京都大学等机构科学家,成功捕捉到一种存储材料在写入数据时的原子“开关”过程。这一突破为开发更小、更快、更节能的电子产品铺平

2026-04-08

  800余家参展商、六大主题展馆,固态电池、AI大模型、大容量电芯等前沿技术与产品集中亮相。在近日举办的第十四届储能国际峰会暨展览会(ESIE 2026)上,全球储能产业链核心力

2026-04-08

  据中广核发布消息,全球海拔最高的槽式光热电站——中广核西藏乌玛塘50兆瓦光热项目6日正式开工建设。场址海拔4550米,项目同步实现了我国完全自主知识产权的8.6

2026-04-08

  据国家发展改革委网站消息,3月23日国内成品油价格调整以来,国际市场原油价格大幅震荡。为减缓国际油价上涨对国内的冲击,国家继续对成品油价格采取调控措施。按照成品油价

2026-04-08

热门推荐

阅读排行

首页 | 资讯 | 城市 | 娱乐 | 农村 | 公益 | 生态 | 文化 | 教育 | 健康 | 旅游 | 职场 | 关于我们 | 联系我们 | 人员查询

运营单位:北京竣发文化传媒有限公司

地址:北京市丰台区泥洼北路6号院9号楼二层203-1520室

中华人民共和国国家工业和信息化部备案号: 京ICP备2025122738号-1

京公网安备11010602201975号

Copyright © 2025-2030 城乡观察网 版权所有

本网站内容来源于互联网,如因版权和其它问题需要同本网联系。 邮箱:axlt6@qq.com    电话:13716035981