人工智能的缺憾

人工智能的缺憾

来源:人机与认知实验室

按:对于人工智能的发展最近一直有一些思考,抽空整理下来,算是抛砖引玉吧。欢迎指教讨论。
人工智能的崭新范式人工智能的研究范式和数理科学截然不同。这种范式数据导向,非常工程化,方法论发达而认识论不足。首先我们谈数据导向。李飞飞老师的ImageNet项目是一个非常典型的例子。海量图片的收集,整理和标注,有巨大的工作量。在这些高质量数据基础上进行了世界范围的图像识别竞赛,参赛队通过构建规模更大的深度学习网络,表现迅速超过了传统算法,这也成为深度学习标志性的成就。其基本的工作流程是积累大规模数据,得到更深的网络模型,实现更好的表现。虽然现在我们有了更多不同种类的深度网络应对不同任务,但这一基本框架并没有本质的改变。在该框架中,数据收集几乎占据了最为重要的位置,若数据质量不过关,很容易造成所说的garbage in - garbage out。而数据集大小是影响深度学习效能的重要因素,一般认为,当数据集较小时,深度学习不一定优于传统机器学习方法。而随着数据集规模的增大,传统机器学习算法的表现很容易饱和,深度学习的表现却可以随着网络规模的增大而更加优异。在传统数理科学领域,我们并没有如此依赖数据来进行模型构建。可能由于人脑思维能力的限制,人们更习惯于从简单假设出发,利用逻辑演绎或者公式推导来构建一套模型系统,用以解释实际数据。数理科学存在利用大量数据的情形:比如开普勒从第谷得观测数据中也找到了特定的结构,不过这种结构不是用神经网络的方式来描述的,而是采取了数学上更为简洁的形式。而该规律只有纳入牛顿力学的框架的时候才成为一个自然的结果。现在观测手段更加进步,据说LHC每秒可以产生100万亿字节的对撞数据。但这些数据不是为了导出模型,而主要是为了验证只有几十个参数的人为构建的标准模型,其包含的信息量也没有超过这个模型。在很多时候,理论的提出或者发展,可以用到很少的数据,甚至几乎不用数据。伽利略构建其运动学的时候,应该只依据很少的观测。而泰勒斯提出原子理论的时候我相信是没有什么观测数据的。理论的魅力在于可以从人的经验,思维或者直觉中生产,具有内在的简洁性却能解释大量的现实观测。对数据的内在追求,导致人工智能研究中有很多重劳力的部分。和产业的结合,资本的进入进一步放大了这一效应。国内人工智能创业公司不断涌现,数据标注俨然已经成为一种新的职业。已经有不少相关的报道,比如可以参考甲子光年的《那些人工智能背后的人工》一文。这些人每个月拿着4000左右的工资,在电脑前机械的点着鼠标做图片标注,得到的数据最终用于无人驾驶项目。还有很多下到村里收集人脸识别数据的,报酬是洗衣粉或者豆油。即使是科学研究逐渐资本化的今天,也很难想象一门学科可以像这样直接催生新的劳动关系。这也部分由于我们要谈的第二个问题,也就是人工智能研究非常工程化。如果上过吴恩达老师的深度学习课程,就会发现,深度学习在工程上非常先进,具有一套非常清晰的工作模式。对于一个深度网络模型,那些参数具有最大的影响,如何通过表现判断调节参数的方向,人们有着丰富的经验。最终决定表现的还是数据质量,规模,以及特征(feature)选取。这就导致了人工智能领域的工作,非常容易scale-up,也就是规模化。这也是硅谷最喜欢的发展模式--通过资本催化迅速实现技术飞越和革新。类似的模式造就了我们熟悉的facebook,amazon,现在的互联网移动互联网世界。在数理科学领域,我们不能简单通过积累用户或者数据获得革新。一般情况下,理论的发育程度对应了工程范畴的发展程度。新的工程实践可能要求理论的创新,而理论的进步又可以拓展人们进行工程化创造的能力。没有爱因斯坦的质能方程,我想人们试再多年,有再多数据也不会造出原子弹。所以人工智能可以算是一朵奇葩,感谢计算能力的巨大发展,它工程的发展程度已经可以跟理论脱节。这种缺乏理论或者认识论会带来比较严重的后果,我们后面会有所述及。
人工智能没有催生理念的进步对人工智能最大的批评在于它的可诠释性,人们难以理解越发庞大的深度网络是如何发挥它的作用,每个节点有着怎样的功能。拿图像识别任务来说,比较早期的深度网络AlexNet有35K个参数。到了2014年,VGG16网络有138M个参数。在强大的表现背后,是一个人们从未接触过的,难以理解的庞大造物(考虑到标准模型只有19个自由参数)。关于如何解读网络,现在逐渐有一些工作。但似乎还没有令人信服的结果。在数学上可能也没有成熟的工具来针对这类问题。神经网络算法的提出,最开始是受到了生物学研究,尤其是神经研究的启发。不过即使针对比较简单的模式生物,比如只有302个神经元的线虫,我们也刚刚能理解一些最简单行为,比如趋热或者趋冷在神经系统里细胞层面是如何编码的。诠释神经网络的工作,一方面受制于网络规模的飞速增大,参数的急剧膨胀,以及应用场景的逐渐复杂。另一方面,这本身可能就是不可解的问题,类似于我们本身都不知道大脑是如何运作,产生复杂思维。没有理论的学科会造成很多问题,可以参看我之前的博文《没有理论的学科会怎么样》。针对人工智能这一领域,第一个负面结果是会造成边际效益递减。也就是随着数据规模的增大,网络复杂度的增大,获得的进步越来越少。我们谈到深度学习一个重要的特征是表现随着数据体量增大而提高,这也是为什么大数据时代最适合深度学习。有时候我们觉得参数的膨胀标志着一种进步。但从物理学的角度看,这其实是退步--因为这标志着参数解释力的下降。这正是现实发生的情况,但即使我们在计算能力以及数据规模(感谢资本)上大跃进,表现的提高却越来越慢。还是拿图像识别为例,AlexNet的错误率是16.4%,而参数增加了4000倍的VGG网络错误率是7.3%,基本错误减半。换过来说,是35K个参数可以识别83.6%的图片,多出几千倍的参数只多识别了9.1%的图片,效能加起来只有接近九分之一。这也是为什么每当人工智能进入一个新的领域时,往往可以产生激动人心的初步结果(因为数据要求低),但对表现的改善却是趋于更慢的。这对于一些要求苛刻的领域这其实是致命的,比如对于自动驾驶,我们必须把失误控制在非常低的水平(每次失误可能都会造成致命的事故),而现实情况又非常复杂多变,有些情况不仅靠训练,也要靠应变和经验上的判断。没有理论的另一个负面结果是研究过程近似于盲人摸象。虽然我们也有越来越多的网络模型,但这些模型的构建似乎更受到灵感的作用,而不是通过理论的启发。这种try and error类型的研究,试对了就好,试不对就重来,运气的成分会比较大。从理念上看,深度学习领域似乎还没有根本上的创新,其最大的进步似乎还是计算力上的进步,工作的模式仍然接近于对生物神经系统的模仿。而这种模仿其实并不能算是效率很高的模仿,我相信人脑完成复杂任务计算的效率平均讲还是高于神经网络的。至少从计算时间和所需能量来讲是远优于计算机的。人脑的功率据说是20W左右,而现在好点的英伟达显卡比如GeForce GTX 1080Ti的功耗已经到了200W大关了。好在现在计算力不是瓶颈,再低的效率乘上庞大的计算力都能得到可观的结果。人工智能从应用方式和应用场景上,都是对人的一些基本能力的模仿。吴恩达老师有过一个说法,说如果一个问题,人可以凭借直觉在几秒内判断出来,那么就有可能用人工智能来解决。现在出现比较多的也的确是这类问题,比如对于图像识别,到底是猫是狗,人一般几秒钟就能看出来。或者在自动驾驶方面,在一个路口是要刹车还是左转,正常的司机几秒钟也能判断出来。所以说人工智能是对人的能力的再现,这使得它在一些场景下可以代替人工,提高生产效率。但它难以完成更高级的一些思维活动,比如创造性思维。虽然有些“灵感一现”发生的时间也很短,但目前的计算框架并不具备相应的发散性,联想性和随机性。所以深度学习研究不仅自身缺乏理论,而且也很难为其他学科领域带来新的理论。根本的区别在于数理科学的研究具有不同的工作模式,一般包括假设提出,理论发展和实验验证,三者之间相互促进。其中假设的提出是最为关键的一步,也是研究设计的基础。人工智能在这第一步就败下阵来。人怎么能够提出假设,这是一个复杂的问题。但其基本原因,脱不开人是有自我意识的,对世界的认识是自由的,人的思维也是自由的。人工智能有没有思维,有没有意识是另外的话题,但目前来看它的训练数据都是高度单一的,它的结构或者结构的规则也是比较单一的,难以形成更复杂的思维结构。
人工智能与社会发展所以综上人工智能最佳的应用场景是对人类劳动的部分替代。人工智能的革命,可能是生产效率的革命,类似于工业革命把人的双手解放出来。但现在还很难讲它在产业上会不会产生类似工业革命的影响,主要的区别可能有几点,第一,现在社会一般性产品的生产基本已经饱和,需要更多的是创新性产品,消费主要为了提高生活品质,也就是所说的“满足美好生活需要”。在生产创新性产品和服务方面,还没有看到人工智能的优势。第二,全球经济发展不平均(以及国内发展不平衡)造成的大量的低成本劳动力,在一些场景下替代这部分劳动力效益不高。举一个极端的例子,一些创业公司搞线上的人工智能产品或者demo,背后其实可以在人力成本比较低的地方雇真人来做,这也是实际发生过的事情。如果人力成本很低,电子化的人不一定能竞争过肉身的人。如果有一天人力成本都很高了,我们可能就进入共产主义社会了。我怀疑人工智能最危险的地方在于它对社会治理和网络治理的影响,而且这种影响很可能是负面的。这里就不展开多说了。另外像我提到的,人工智能对生产力的解放是有限的,它还难以替代创造性劳动,尤其是科研活动。我们支持人工智能是合理的,all-in人工智能是危险的。基础研究还应该受到重视,目前看这是唯一可能导向新技术革命的路径。不重视基础研究,永远会被人落在后面。原文载于:http://blog.sciencenet.cn/blog-927304-1148263.html

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

人工智能的缺憾

上一篇:【报告】2021年中国商用车市场研究(附62页PDF文件下载 )
下一篇:

相关推荐

央行重磅数据公布前,A股抱团股齐跌、北上资金却在加仓

央行重磅数据公布前,A股抱团股齐跌、北上资金却在加仓

624 Wind资讯

(图片来自海洛)4月12日,中国3月金融数据出炉,M2、社融规模不及预期,新增贷款比去年同期少增1039亿元。央行官员在当天的新闻发布会上表示,将对流动性进行精准调节,保持银行体系流动性合理充裕。金融数据公布前,A股收跌,周期股龙头遭抛售,业绩大幅预增股集体砸盘。值得注意的,当天北上资金逆势加仓。对于后市,中金公司、兴业证券、安信证券等主流机构均认为不必悲观

【报告】2021年中国商用车市场研究(附62页PDF文件下载 )

【报告】2021年中国商用车市场研究(附62页PDF文件下载 )

1008 汽车之地

2020年,受国Ⅲ车辆淘汰、治超加严、新基建投资增长以及营销多元化等因素的影响,商用车全年销量呈现逆势上扬。全年商用车终端销量达到454万辆,同比增长18.7%,创年度历史新高,是目前处于存量竞争中的汽车市场的亮点之一,也是商用车发展历程中新时代的开启。以下为报告节选:......文│巨量引擎、巨量算数、达示数据本报告共计:62页。如欲获取完整版PPT文件,

3月社融数据不及预期,流动性成为市场的主要变量

3月社融数据不及预期,流动性成为市场的主要变量

1875 大众证券报

导读市场分析:流动性成为市场的主要变量大众30:聚焦行业龙头——华能水电(600025)市场分析看点13月社融数据不及预期流动性成为市场的主要变量昨日市场延续上周调整走势,低开低走,沪指跌逾1%,深成指和创业板指均跌逾2%。前期市场热捧的业绩预增股昨日遭到集体抛售,多只个股盘中触及跌停。业内分析认为,一季报行情已进入后半场,在业绩刺激后,市场关注的焦点回归到

麻省理工最新研究:低收入VS高收入家庭,少对孩子说了“3000万”……

麻省理工最新研究:低收入VS高收入家庭,少对孩子说了“3000万”……

704 超级育儿师

▲点击上方音频,听南风姐姐讲晚安故事作者|夏小雨来自麻省理工学院的瑞秋•罗密欧团队,对30多名4-6岁的、足月出生且身体健康的孩子进行了研究,结果发现,孩子与父母交谈的频率越高,他们大脑中语言相关区域的活动就越强。罗密欧说:重要的不仅仅是和孩子说话,而是与孩子聊天。这不仅仅是将语言倾注到孩子的大脑中,而是实际上与他们进行对话。在这项研究中发现,高收入家庭的孩

深度 | 上海时装周“亚洲订货季”已四年,大家的生意做得怎么样?

深度 | 上海时装周“亚洲订货季”已四年,大家的生意做得怎么样?

1363 LADYMAX

如今部分设计师品牌已经率先进入线上市场和开设独立渠道,将倒逼更多设计师品牌被迫加速解决生意问题作者|Drizzie在全球疫情仍未结束的情况下,上海时装周迎来了史上最活跃的一季。往季为期不过十天的时装周被拉长至近一个月,官方日程与非官方日程活动集聚。在传统的时装秀发布和商贸展会之外,GQ、栩栩华生、时尚芭莎三大媒体品牌的年度活动,以及多个主题展览和线上直播活动

万亿级市场,企业服务2021年发展现状如何?--尽在《2021年中国企业服务行业投资机遇研究报告》

万亿级市场,企业服务2021年发展现状如何?--尽在《2021年中国企业服务行业投资机遇研究报告》

871 清科研究

清科研究中心马瑞过去一年,疫情突发,人们居家隔离,生产生活数字化需求释放,Zoom的DAU在短短3个月从1000万上升至2亿,钉钉、企业微信也迎来了史无前例的增长,用户付费意愿显著提升,同时,企业服务场景化应用快速迭代,行业生态蓬勃发展,越来越多的创业者和投资人加深对企业服务的认识。在美国,Zoom的股价距年初翻了7倍以上,Twilio、Salesforce

关灯吃面!创业板大跌超2%,顺丰一度跌停!更有业绩暴涨股闪崩跌停!外资突然40亿抄底,刚刚,央行重磅数据来了!

关灯吃面!创业板大跌超2%,顺丰一度跌停!更有业绩暴涨股闪崩跌停!外资突然40亿抄底,刚刚,央行重磅数据来了!

1463 中国基金报

中国基金报泰勒美股天天新高,A股天天吃面。让股民们很不爽。索菲亚突然闪崩跌停,顺便带崩了整个家居板块、金牌橱柜跌停封板,欧派家居、顾家家居均跌约5%。多只周期龙头股重挫!中远海控、赣锋锂业跌超8%、三一重工、万华化学、紫金矿业等均跌超6%。顺丰控股逼近跌停。阿里巴巴靴子落地股价大涨,但市场担心其他互联网巨头被罚,美团、快手纷纷大跌。来看看今天都发生了什么事。

报告解读|洞察Z妈“小儿颜养观”,深度剖析年轻宝妈护肤新理念

报告解读|洞察Z妈“小儿颜养观”,深度剖析年轻宝妈护肤新理念

1798 育儿网

近日,育儿网携手知名母婴洗护品牌发布中国婴幼儿护肤权威报告——《Z世代妈妈“小儿颜养观”蓝皮书》。Z世代(1990-2009年),又称网络世代、互联网世代。Z世代妈妈(Z妈)统指受到互联网、即时通讯、短讯、MP3、智能手机和平板电脑等科技产物影响很大的年轻妈妈群体。当Z世代来当妈,坚持“颜值即正义”的她们对宝宝肌肤护理有怎样要求?对于宝宝护肤,Z世代妈妈是否

《异度暗影》评测:沉睡忍者的未来赛博世界之旅
游戏

《异度暗影》评测:沉睡忍者的未来赛博世界之旅

1946 Switch游戏圈

早在发售之前,玩家就以“赛博忍龙”来称呼《异度暗影》。诚然,作为同样的像素忍者风的题材《异度暗影》与2D《忍龙》被人放在一起比对无可厚非,但是《异度暗影》,有它自己独特的风格。传统与未来的完美结合忍者、赛博,似乎是完全不搭边的两个词而《异度暗影》做到了这两个词的结合。游戏讲述了在科技高度发达的未来,主角暗影被人从沉睡中唤醒并求助,拯救世界的故事。剧情上中规中

男人对你忽冷忽热,学好这几招让他反过来痴迷挽回你
私房话

男人对你忽冷忽热,学好这几招让他反过来痴迷挽回你

211 挽回顾问

点击上方关注「挽回顾问」爱而不得的人,我教你去爱你是否会觉得,男人突然对你忽冷忽热,让你感觉到摸不着头脑,有时候你会觉得你们之间的感情明明很好,但下一秒你又感觉他们之间很陌生。你每天被他的情绪所控制着,就会在无形之中引发很多联想,比如“是不是我在和他上一次的互动中,做的不够好,还是他喜欢上别人了?”这些联想会让你们原本没有大问题的感情,变得开始小心翼翼,让你

夜思 | 金莎“择偶高标准”引争议:爱自己才懂得忠于自我
私房话

夜思 | 金莎“择偶高标准”引争议:爱自己才懂得忠于自我

481 中国青年报

小年说:近日,金莎某个综艺节目里,叫停了和相亲对象的约会。哪怕外界议论纷纷,金莎至始至终难以放下那颗不将就的心,坚守着内心对爱的执着。“生命的过程就是做自己,成为自己的过程。”愿我们都能释放自我,活出自我,也尊重每一个坚持自我的人!推荐给你,静夜思。金莎“择偶高标准”引争议:爱自己的女人,都懂得忠于自我!来源|张德芬空间ID|tefenchangpublic

老公在谋划离婚,我却一无所知
私房话

老公在谋划离婚,我却一无所知

463 宛央女子

前几天收到一位读者的来信,看完之后我的心情非常沉重,今天就借她的经历给大家聊聊婚姻和家庭。信的内容如下:01您好:我叫王倩,本来我拥有一个幸福美满的家庭,可现在一切都变了。我和林凡相恋10年,我从没想过我们会走到这一步。我是在所有人的祝福声中嫁给了林凡的,从校园到婚纱,这是所有女生曾幻想过的幸福场景。大学毕业后,我去了一家房地产公司做销售,而林凡进了家外企,

过年啦,《英雄联盟手游》《暗黑破坏神:不朽》《星战前夜:无烬星河》等版号过审!
游戏

过年啦,《英雄联盟手游》《暗黑破坏神:不朽》《星战前夜:无烬星河》等版号过审!

974 TapTap发现好游戏

新一批进口网络游戏审批信息今日公开,共33款游戏获得版号。除了PS4、NS平台的《雷曼:传奇》《超级马力欧派对》等游戏,还有25款重磅移动端游戏过审:《暗黑破坏神:不朽》《英雄联盟手游》《星战前夜:无烬星河》《宝可梦大探险》《寻找天堂》《最终幻想:勇气启示录幻影战争》《阳春艺曲》《艾兰岛》《学园偶像季:群星闪耀》《魔法门之英雄无敌:亚山征程》等。《英雄联盟手

陈年老翔出轨门事件被曝:男人撒谎的骚操作真的太逗了哈哈哈哈哈!
私房话

陈年老翔出轨门事件被曝:男人撒谎的骚操作真的太逗了哈哈哈哈哈!

719 史上最贱喵

要说2021年是瓜年没人能反对吧?短短一个月各种挑战内娱饭圈底线的瓜都抢着上热搜让人应接不暇有网友给出很好的建议:趁现在风起云涌、瓜风四起内娱明星们还有啥见不得人的事要澄清赶紧趁这波乱都澄清了吧会让被接受度调整到最大于是一出陈年老翔也就此出世:陈翔江铠同出轨门被曝之后在事隔4年后前几天出来澄清:当年并非出轨,而是在挤痘痘之所以被撞到两人孤男寡女共处一室并且光

狗狗咬伤了人,男子用老虎钳拔掉它的牙齿并遗弃,残忍虐待引众怒
萌宠

狗狗咬伤了人,男子用老虎钳拔掉它的牙齿并遗弃,残忍虐待引众怒

927 萌宠治愈师

如果有一天,你养的狗狗误咬伤了别人,那么你会怎么办呢?给别人赔偿一定的损失是必须的,然后你会用什么方法来教育或者惩罚狗狗呢?而最近一位理发师就遇到了这样的情况,但是他的做法让网友实在是很愤怒,因为他竟然拿起了老虎钳,将狗狗的牙齿给剪掉了!事情发生在几天前,当时在广州的一些宠物交流群里,都在传播着一个视频。在这个视频里面是有两个人一只狗狗。其中一个人在站在狗狗

狗狗美食诱惑赛:边牧不愧是边牧,而二哈....哈哈哈果然没让人失望!
萌宠

狗狗美食诱惑赛:边牧不愧是边牧,而二哈....哈哈哈果然没让人失望!

995 大爱狗狗控

在继绑架小主人来测试狗狗的反应后...小主人被坏人“绑架”了,而狗子反应,居然是满地拉屎?岛国综艺又开始整狗比赛啦,这次是测试狗狗能否在美食的诱惑下忍受3分钟,同样是小主人带狗参赛,场面也一如既往的搞笑:第一个出场的是贵宾,面对小主人一连串的指令,它开始也确实听了...然而狗子的耐心只持续了一分多钟:对不起,肉肉太香了,真的很难忍!小主人都委屈哭了...不过

为钓杭州富豪,90后女孩偷偷怀孕:赚快钱的下场,到底有多惨?
私房话

为钓杭州富豪,90后女孩偷偷怀孕:赚快钱的下场,到底有多惨?

620 周冲的影像声色

有些⼈因为贪婪,想得到更多的东⻄,却把现在所有的也失掉了。——伊索2020年夏。郑小姐走进杭州市妇联。陪同她的,是杭州《和事佬》栏目一众人员。郑小姐不愿示众——墨镜;口罩;一身黑衣。一坐下。郑小姐就语出惊人。“他一分钱抚养费都没出。”妇联潘主任原以为,这是一桩家庭纠纷。然而,接下来的几个小时沟通,却彻底颠覆了她的想法。婚内出轨;非婚生子;跳桥自尽……连电视剧