智商超过99.9%人类,ChatGPT到底有多聪明? 当前简讯
我们所处的行业不是在被“替代”而是在被“重塑”
在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。
(相关资料图)
ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?
Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家,他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后,Roivainen不禁好奇:以人类的标准看待,ChatGPT究竟有多聪明?
超越99.9%的人类:ChatGPT表现出超高智商
于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。
Roivainen采用第三版韦氏成人智力量表对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集,智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分,测试量表的标准偏差为15分,这意味着最聪明的10%和1%的人的智商分别为120和133。
在6个语言测试集中,第六个子测试集为数字广度,它对注意力、短时记忆能力进行评估,由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练,Roivainen预计该测试对ChatGPT来说应该是比较容易的。
不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。
图片来源:geralt in Pixabay
综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。
高智商的ChatGPT仍旧会失败
那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?
尽管ChatGPT智商很高,但在需要真正的人类推理或对物理和社会世界的理解的任务中,它却以失败而闻名。
ChatGPT很容易在一些明显的谜题上失败,比如:
提问:“塞巴斯蒂安孩子的父亲的名字是什么?”
ChatGPT :很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。
ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。
“智商是智商测试所衡量的”,是一个经典的智商定义,它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。
ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。
此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。
ChatGPT离人类有多远?
在不到一个月前,来自斯坦福大学的Michal Kosinski教授在发布的论文中表明,大型语言模型系统可能自动产生心理理论能力,比如ChatGPT可能拥有9岁儿童所具备的心理理论能力。
Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5表现不错。
然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。
图片来源:Midjourney
因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。
相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。
而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。
关键词:
我们所处的行业不是在被“替代”而是在被“重塑”
今天来聊聊关于铁与稀盐酸反应方程式,铁与稀盐酸反应的文章,现在就为大家来简单介绍下铁与稀盐酸反应方程式,铁与稀盐酸反应,
当地时间4月14日,美国联邦航空管理局(FAA)宣布,已批准美国太空探索技术公司(SpaceX)的请求,允许该公司在得克萨斯州南部的发射场进行“
今天来聊聊关于中国戏剧最高奖是什么,中国戏剧最高奖的文章,现在就为大家来简单介绍下中国戏剧最高奖是什么,中国戏剧最高奖,
1、各家银行存款利息不一样多,但是都在人民银行统一利率基础上上浮20%~40%;最高的是上海农商银行,一年期定期存款利率
苏宁易购发布业绩修正公告家乐福中国加快与电器业态融合经营,中国,零售,会员店,大卖场,苏宁易购,家乐福购物卡
1、吃多种食物,均衡饮食,有助于增强身体抵抗力,使人更健康长寿。世卫组织建议,日常饮食应尽可能包括小麦、大米、玉米、土豆
红树林在海水中生长有强大的生命力被称为“海上森林”近年来我国大力推进红树林保护和修复成为世界上少数红树林面积净增加的国家
是指在投保人投保国寿鑫尊宝终身寿险时,可以选择缴纳一定的保费到万能账户中进行投资运营,提高保单的现金价值和保单账户价值。万能账户是一
张掖市甘州区水务局以开展“三抓三促”行动为抓手,强化城市自备水源监管,严格地下水管理制度落实,全力打造“关口前移、重心下沉,监管到位
超声电子:去年归母净利润同比增10 94%,营收降0 87%,超声电子,公司股东
工业和信息化部、国家发展和改革委员会、生态环境部发布关于推动铸造和锻压行业高质量发展的指导意见,到2025年,铸造和锻压行业总体水平进一
中老年吃啥补钙,中老年补钙吃什么好这个很多人还不知道,现在让我们一起来看看吧!1、随着年龄的增长,钙的流失比较多,尤其老
我们一起来学习2023《经济法基础》高频考点:增值税税收优惠。本考点属于《经济法基础》第四章税法概述及货物和劳务税法律制度第二节增值税法
“注意机器温度,金色的线对准有凹凸的那个面。”近日,在鹤壁市鹤山区鹤山街街道河东社区党群服务活动中心,居民人来人往,技术人员热情地为
来源:龙头新闻·黑龙江日报4月13日,有网民发布视频称,有不会写字的老人在银行办理业务时,网点人员让老人一直签字到下班,
1、水利建设专项收入有些省份已经取消,有些省份还需要申报,需要申报的省份就在税务系统先申报增值税后。2、然后再去申报水利
三国志战棋版沉睡状态是什么?三国志战棋版策略角色扮演手游,玩家操纵众多三国名臣猛将,在棋盘上对战,在大地图上与盟友团结协作攻城掠地,
1、病情分析:包皮红肿主要是龟头发炎引起的。2、其形成的主要原因是包皮过长或包茎导致包皮覆盖龟头,在包皮内板和龟头之间会
为保障广大市民“舌尖上的安全”,维护消费者合法权益,门头沟区市场监管局立足本职,坚持问题导向,保持高压监管态势,严厉打击食品安全违法
裕鸢航空闯关创业板遭否:成长性存疑!国金证券IPO项目接连铩羽,ipo,创业板,深交所,国金证券,招商证券,中信建投,裕鸢航空,资本市场
JBL耳机不要我多说了,这价格可以了。JBLT130NC主动降噪真无线蓝牙耳机智能环境音超长续航蓝牙5 2纯正低频音效音乐甜豆珍珠白[经销商]京东商城
中国基金报记者李智又有银行高管辞任!4月13日,工商银行发布副行长辞任公告,因工作变动,郑国雨向董事会提交辞呈,辞去该
1、根据各个公司不同,应该是不尽相同。2、抛砖引玉如下:工资福利费社会保险业务招待费办公经费电话费差旅费
需要购买台式机的朋友们看过来,现在这款主机做活动,满2980减200元,到手只需要3799元,现在购买,物超所值。这款主机可支持全新11代8核芯16
Copyright 2015-2022 南方酒业网 版权所有 备案号:粤ICP备18023326号-21 联系邮箱:855 729 8@qq.com