“康熙皇帝有几个儿子?”“请列出康熙皇帝儿子的名字。”“请给我一份康熙儿子的名单。”将这三条指令发送给人工智能模型。猜猜答案是什么?

令人吃惊的结果出现了:不仅不同的大模型给出了不同的答案,就连同一个大模型的答案也存在偏差。比如,有的答案统计了康熙所有的儿子,显示一共有35个,包括官阶上册的儿子和早逝未列名的儿子;有的答案只列出了24个官阶上册的儿子;还有的答案将儿子的名字全部列出,没有任何说明,顺序混乱……

评析澳门今晚一肖一码必中,康熙皇帝儿子名单竟引发人工智能大模型错乱,答案为何不一?  第1张

评析澳门今晚一肖一码必中,康熙皇帝儿子名单竟引发人工智能大模型错乱,答案为何不一?  第2张

不同大模型甚至同一大模型给出的答案并不一致

为什么答案明确的问题会在大型人工智能模型中引发“混乱”?

“人工智能幻觉”混淆是非

“这正是人工智能‘严重胡说八道’的体现。”上海好网民专家、中国互联网安全协会数据安全专家、上海临港数据评估有限公司董事宗良在接受上海辟谣平台专访时指出,应关注大型人工智能模型造假的新动向。

他说,人工智能的“严重胡说八道”其实有一个专门的术语,叫“AI幻觉”,意思是大模型提供的答案看似合理,但有错漏,公众如果相信,可能会被欺骗。

事实上,在今年的世界人工智能大会上,不少业内人士提及“AI幻觉”“可信任的大模型”等概念,并披露多起AI大模型“证伪”或“撒谎”的案例,希望引起社会各界的关注。

蚂蚁集团大模型应用部总经理顾金杰指出,目前公开的模型都存在不同类型的“AI假象”,大模型给出的结果甚至可能与事实完全相反。

例如有研究报告称功能饮料中的维生素和矿物质对快速补充身体营养、消除运动后疲劳有一定作用,但大模在回答相关问题时,居然说相关微量元素对增加疲劳有一定作用。

例如蚕的寿命可达一个月以上,从孵化到结茧大概需要25到32天评析澳门今晚一肖一码必中,康熙皇帝儿子名单竟引发人工智能大模型错乱,答案为何不一?,具体时间取决于季节,化蛹需要15到18天,化蛾需要1到3天。但有些大模型在介绍这个规律时,把蚕结茧和化蛹的时间混淆了,输出的答案完全误导了询问者。

基于这些“AI幻觉”,专家呼吁民众对大模型的输出保持谨慎。虽然“百模大战”提供了一种获取信息的新途径,但不应完全相信。事实上,大模型曾出现过捏造信息以证明自己没有错的案例。例如,它谎报葡萄牙一家银行破产,为了证明自己,它甚至编造了所谓的来源网址。

评析澳门今晚一肖一码必中,康熙皇帝儿子名单竟引发人工智能大模型错乱,答案为何不一?  第3张

大模型存在短板,标签化刻不容缓

为何大模型会给出错误答案并成为欺诈的根源?

这和大模型的数据库、语料、算法、检索能力甚至“理解能力”有关。和合信息智能创新事业部总经理唐琪说,如果把大模型比作一列疾驰的科技列车,语料就是珍贵的“燃料”,因为大模型的训练都源于语料。

对于国内大型模型开发公司来说,语料短缺的问题相当严重。这是因为目前的大型模型数据库多为英文,中文语料占比较低。此外,图表、复杂公式等元素的处理也是大型模型语料处理的“拦路虎”。在财务报表、行业报告等文件中,表格中的数据指标至关重要,但一些大型模型无法正确“理解”表格中行、列、单元格的含义,导致大型模型对整张表格的识别结果出现误差,最终得出错误的结论。

大模型需要能够“读懂”图表

基于此,在关注大模型“万能”的同时,我们也应该关注大模型的不足。积极的信号是,越来越多的大模型开发者开始关注“可信任的大模型”。有的开发出“大模型加速器”,帮助大模型理解图表等相对复杂的语料,从源头为大模型训练和应用输送纯净的“燃料”;有的在大模型开发中引入相应技术,试图消除“AI假象”,帮助大模型运行得更快、更稳定。

但考虑到大模型本身的缺陷,以及可能在不自觉的情况下“造假”的事实,业内人士建议,有必要加强对人工智能生成内容的“标签化”。一方面,大模型开发者应采取技术手段对人工智能生成内容添加标签,对可能引起公众混淆或误解的内容应进行明显标注。另一方面,信息发布平台应加强管理澳门码今期开奖结果,督促信息上传者对人工智能生成内容进行标签标注,帮助公众进行辨别。

普通人有诀窍识别假大号

宗良提醒,自然界中AI幻觉有两种,一种是完全“胡说八道”,一种是部分内容不准确或不完善。对于后者,虽然不完全正确,但仍具有一定的参考价值。同时,也不能完全否定“AI幻觉”的价值,因为它也是AI创新的起点。

当然,从获取精准信息的角度,公众对大模型的输出结果或生成内容仍需保持警惕。目前,一些自媒体或不法分子开始通过人工智能批量生成各类文章,乍一看似乎与正常新闻报道无异,但真实性大打折扣,很多都是为了博眼球而编造的。

但大模型生成的结果还是有迹可循的,公众可以通过一些关键词、写作格式等来识别人工智能生成的文章。

首先,这类文章会在具体的关键词、术语、表达上被固化,有点像“编辑会跟你说一些事情,那是什么事情?编辑会跟你说一下”,看似有道理,却没有什么实际意义。

第二,人工智能生成的文章中会出现一些常见的关键词,包括“以下是XXX的常用方法和手段”、“通过上述手段”等,这些其实都是大模型在检索信息后做出的总结,公众如果看到这些关键词,不妨提高警惕,不要轻易相信。

三是各方需共同努力,培育公众数字素养,提升公众对大模型诈骗等深度造假行为的防范意识和辨别能力。