当前位置:邹平网站建设 > 公司新闻 >

深度学习要提供大量已经标注数据

  尊敬的各位院士、各位同仁,会场的各位同学以及各位网友大家好!今天非常荣幸有机会跟大家汇报一下我本人关于人工智能的一些粗浅想法。我报告的题目是《人工智能:天使还是魔鬼?》。
 
  我想既不是耸人听闻也不是哗众取宠,因为人工智能在普遍被看好的同时,确实富有争议。对于人工智能提出争议的都不是等闲之辈,都是重量级人物。近些年不断上映的关于人工智能、机器智能的科幻大片,的确留给我们很多悬念和问题:人工智能到底是天使还是魔鬼?因为这些科幻大片里面,有些把人工智能塑造为暖男的大白,也有一些塑造成给我们带来恐慌的机器人。
 
  我觉得要回答这个问题,有必要搞清楚人工智能的基本概念、以及人工智能目前能够做什么和不能做什么,还有未来发展走向。
 
  人工智能的基本概念和发展历程
 
  人工智能的概念和这个词Artificial Intelligence,是1956年在达特茅斯学院暑期研讨班上,一个叫约翰。麦卡锡的年轻人提出的,当时研讨班的主题就是怎么用机器模拟人的智能。当然人工智能相关研究并不是从1956年才开始,之前就有,只是人工智能的概念是那时候提出来的。
 
  人工智能研究的主要目的就是探寻智能本质,研究出具有类人智能的智能机器,比如让机器或者计算机会听、会看、会说、会想、会决策,跟人一样。人工智能的概念提出到今天62年过去了,62年发展历程风风雨雨、曲曲折折,从起步时大家的兴奋、到后来提出了一些让人期待但不可实现的目标、接下来的反思,一直到互联网出现以后大数据的涌现,使得人工智能走上一个新的高潮。
 
  62年的发展历程,我觉得留给我们很多的启示。特别是在今天,人工智能如日中天,火遍全球的当下,实事求是地设定科学目标显得尤为重要。1956年的研讨会有十个年轻人参加,其中一个很乐观,认为到2000年,也就是上世纪末的时候,人工智能有可能达到人的智能,这显然太乐观了。62年确实是一个曲折的发展过程,但是进步是有目共睹的,无论是在理论层面、关键技术还是具体应用。
 
  人工智能的发展现状人工智能的发展现状
 
  专用人工智能取得突破性进展
 
  谈到目前人工智能发展的现状,我首先要说的是专用人工智能取得突破性进展。专用人工智能就是让人工智能系统专门做一件事儿,比如下围棋,是面向特定领域或者单一任务的人工智能。它确实取得一些突破性进展,而且比人做的更好。我可以举很多这样的例子。
 
  下围棋的AlphaGo大家很熟悉,Boston Dynamics的人形机器人可以跨过障碍物,还有四足机器人像狗一样跑得非常快,可以爬楼梯,一般老百姓看了这些确实会感到一种不安。
 
  Boston Dynamics的人形机器人和狗形机器人Boston Dynamics的人形机器人和狗形机器人
 
  还有自动化所唐明研究员他们做的机器鱼,谷歌最新的语音人机对话,还有科大讯飞的语音识别把维语和普通话的互译做的非常好。这几年“刷脸”也就是各种人脸识别非常火爆,我们国家可以说也是走在世界前列。我并不是说人脸识别不好,但确实有局限,比如双胞胎肯定不行。有的时候儿子跟老子也分不出来,比如非常相像的老布什和小布什。
 
  过去二十年我一直在研究虹膜识别,这是人工智能的一个特定领域。瞳孔和眼白之间的中间区域叫做虹膜区域,1936年眼科医生发现每个人虹膜上的花纹都不一样,一岁半以后定形终身不变。目前我们国家很多煤矿的矿工考勤就在大量使用这个技术。黑龙江的一个煤矿,最早他们找到我说能不能用指纹识别,后来发现指纹会脱皮,如果刷脸,上班没有问题,下班煤矿工人就不行了;而虹膜识别没有问题。现在国内很多煤矿都在用这个技术。特别让我高兴的是,两周以前中央电视台报道,虹膜识别可以用于寻找丢失儿童。
 
  这也是一个人工智能能解决的问题:确定你看到的互联网照片有没有被篡改或者被修改。下图从左到右四组照片,相信各位无论是坐第一排还是后面都看不出来差别。我只告诉大家有一排是修改过的,相信大家用肉眼看不出来。这个特定问题人没有办法完成,而人工智能根据图像内容分析可以自动实现篡改检测。人工智能看到篡改部分是绿颜色的,那么第二排图像是修改过的。
 
  这有什么用途?讲一个我几年前的亲身经历。2015年有一天我收到一封信,里面有一张糟糕的照片,把别的男人的头换成我的头,要我一周之内给他寄二十万。我想这个人显然寄错人了,所以各位如果你们有一天也收到这样照片,我可以马上给你验证一下,如果假的我第一时间告诉你,真的我们好好商量怎么处理。特定领域人工智能的成功应用可以举很多例子,这只是挂一漏万。
 
  可以说,专用人工智能取得突破性进展,很大程度(特别是这几年)取决于统计学习或者机器学习的进步。特别是人工智能领域现在火爆的深度学习,尤其是人工智能的深度神经网络。深度学习其实一点都不神秘,只是借鉴了人的大脑在处理信息过程当中的层次化过程。因为深度学习的涌现,大家可以从曲线看到,用于图像分类的标识人工智能或者深度学习识别力已经低于人的错误率,也就是说识别力高于人。包括跟环境的交互,找出最好策略,这就是所谓强化学习。以及我们经常讲魔高一尺道高一丈,在博弈中学习,使得学习能力不断提高,这就是生成对抗学习。这是目前人工智能发展现状,专用人工智能取得突破性进展和人工智能特别火的重要原因就是深度学习、机器学习。
 
  人工智能创新创业如火如荼人工智能创新创业如火如荼
 
  另外一个值得一提的现状是,技术生态或者创新生态备受关注。科技巨头纷纷推出自己的开源系统、技术软件平台和硬件平台,原因是什么?他们没有忘记信息技术和信息产业发展的历史带给他们的启示。所以从传统的IT操作系统硬件,到现在移动互联网再到新时代的人工智能、IT,无论是谷歌也好、微软也好、百度也好、IBM也好,都要全面转向人工智能。人工智能创新创业如火如荼。
 
  去年一年全球新成立的人工智能创业公司就有一千多家,人工智能领域获得的投资达150多亿美元,同比增长140%以上,确实是如火如荼。在应用方面,可以说“智能+”已经成为一种创新的范式,将各行各业渗透。当然有的是炒作,把传统的数据分析,贴上人工智能的标签。但是人工智能发展迅速是一个客观现状。
 
  人工智能已经加速成为国家战略,我可以举很多这样的例子。过去几年,最早被大家熟悉的“德国工业4.0”,核心就是人工智能;到2018年5月10日,美国白宫组织AI研讨会,成立AI专门委员会,确保人工智能领域美国第一。
 
  人工智能的社会影响人工智能的社会影响
 
  人工智能对社会的影响得到了广泛关注。在美国,一些同仁一起签署了有关人工智能发展的阿西洛马23条原则,关注人工智能可能带来的社会影响,以及怎么规范人工智能研究和应用。但是我认为目前人工智能发展的另外一个客观现状是,人工智能领域的误解和炒作普遍存在,有的是有意的,有的是无意的。
 
  比如时不时听到有人讲,人工智能系统将超越人的智能水平,我认为这是炒作。还有人工智能达到几岁小孩的水平,这也是炒作。某一个特定任务人工智能达到五岁小孩水平这可信,笼统讲人工智能或者人工智能达到三岁或者五岁小孩我认为是炒作。这些炒作有的是有意的,有的则是概念误解混淆造成的。比如经常有人把机器学习看成人工智能,但这只是人工智能其中一个研究方向;又把深度学习看成机器学习,但深度学习只是机器学习一种方法;或者把图像识别看成人工智能,这只是人工智能一个方向;或者把大数据看成人工智能、专家系统看成人工智能、机器人看成人工智能……特别是把人工智能与人类智能或者机器人与人类看成零和博弈,你死我活,这些误解我认为是不存在,人和人工智能是可以互补的。
 
  人工智能仍处于起步阶段
 
  我前面跟各位的汇报是很多专用人工智能领域取得的突破性进展。经常有人误解,专用人工智能等于通用人工智能,如果有这样的误解很容易说现在人工智能不得了。什么是通用人工智能或者什么是通用智能系统?我们人的大脑就是一个通用智能系统。同样一个大脑,我学习以后可以下围棋也可以下象棋,能够举一反三、融会贯通、思考学习、规划决策,可以说一脑百用。目前的人工智能还有很多不能做的事,而有的事对人来说非常简单。
 
  所以说人工智能总体发展水平仍然处于起步的阶段,美国的DARPA对人工智能现状也是这个观念。2015年我曾经用“四有四无”概括人工智能总体状况,三年以后我觉得还可以这样说。现在人工智能是有智能没有智慧,智慧是高级智能,有意识,有悟性,可以决策。人工智能有智商没有情商,科幻电影中跟人类谈情说爱的人工智能还差得很远。另外,人工智能会计算不会算计,一个词倒一个顺序,这个概念完全不一样。人工智能有专才没有通才,下围棋的阿尔法狗不一定会下象棋。
 
  我举一个具体的例子,现在即使最先进的图象识别算法都无法识别出图像里那只斑点狗。语音翻译现在已经很好了,但大家看这简单的三句话:他吃食堂,他吃面条,他吃大碗。昨天晚上我特意上网用谷歌翻译这几句,翻译不出来,机器翻译把大碗、食堂“吃掉”了。我也试了一下,“那辆白车是黑车”和“能穿多少穿多少”,谷歌翻译也翻译不出来。
 
  看到“欢迎新老师生前来就餐”的横标,相信人类理解起来没有歧义,但是人工智能算法就会有。人类看到这个横标不仅知其然还知其所以然,知道可能是新学期开始或者新食堂开张,但人工智能还做不到。对这个特定问题,它“知其然”都做不到或者至少有歧义。这些局限是因为人工智能还有很多瓶颈。
 
  深度学习很火,但是很大程度上它是黑箱状况。我们还不能完全从数据上论证为什么那么有效,不能完全确保这个多层深层神经网络训练是收敛的,所以有数据瓶颈,深度学习要提供大量已经标注数据,还需要大量的人工;还有它不能举一反三、不能解释,“知其然不知其所以然”,与人类存在很大差距。正因为这些差距,人工智能未来发展还有巨大创新空间。
 
  人工智能的春天刚刚开始人工智能的春天刚刚开始
 
  可以说人工智能春天刚刚开始,我提出这一个观点是因为人类社会经历机械化、电气化、信息化的时代以后,正在向智能化社会迈进。人类进入智能化社会以后当然需要智能技术、人工智能支撑和引领。人工智能有望引领新一轮科技革命。世界著名科学家格特纳说人工智能是未来最具颠覆性的技术。具体讲有八个宏观发展趋势我认为值得关注:
 
  第一个是专用走向通用,这是必然的发展趋势。所以因此有人认为,通用智能被认为是人工智能皇冠上面的明珠,大家都很关心这个竞争焦点。
 
  我注意到,美国军方也开始规划通用智能的研究。他们认为通用人工智能和自主武器,是显然优于现有人工智能技术体系发展方向。它只是朝通用人工智能迈了一小步。
 
  第二个,为什么不认同机器人和人类或者人工智能与人类智能是零和博弈,因为人工智能另外一个重要发展趋势,是机器智能到人机混合智能。人类智能和人工智能各有所长,可以互补。所以人工智能一个非常重要的发展趋势,是From AI (Artificial Intelligence) to AI (Augmented Intelligence),两个AI含义不一样。
 
  第三个趋势叫做从“人工+智能”到自主智能系统。为了让深度学习提高性能,需要大量已经标注好的数据。比如给人工智能一幅图像,告诉它图像中哪一块是人、哪一块是草地、哪一块是天空,都要人工标注好,非常费时费力。有人说目前的人工智能有多少智能,取决于辐射多少人工,这话不太精确但大体有这个含义。下一步发展趋势是怎样以极少人工来获得最大程度的智能,人类看书可以学习到知识,机器还做不到。人工采集和标注大样本训练数据,是这些年来深度学习取得成功的一个重要基础或者重要人工基础。所以有人开始试图创建自动机器学习算法,来降低AI的人工成本。
 
  第四个是学科交叉将成为人工智能创新源泉。前面我提到深度学习现在很火爆,它只是借鉴了大脑的原理:信息分层,层次化处理。所以,跟脑科学交叉融合非常重要。实际上无论是《Nature》和《Science》都有这方面成果报道。比如《Nature》 发表了一个研究团队开发的一种能自主学习的人工突触,它能提高人工神经网络的学习速度。但大脑到底怎么处理外部视觉信息或者听觉信息的,很大程度还是一个黑箱,这就是脑科学面临的挑战。这两个学科的交叉有巨大创新空间。
 
  第五个是一个明显的趋势,人工智能产业将蓬勃发展,国际上一个比较有名的咨询公司预测,2016到2025年人工智能的产业规模几乎直线上升;我们国家发展规划提出,2030年人工智能核心产业规模将超过1万亿,带动相关产业规模超过10万亿,这个产业是蓬勃发展的,前景显然是非常大的。
 
  第六个大家很关注人工智能可能带来的社会问题和相关伦理问题,因此人工智能的法律法规一定会更加健全。联合国还专门成立了人工智能机器人中心这样的监察机构。前不久,欧盟25个国家签署人工智能合作宣言,共同面对人工智能在伦理法律方面挑战。我们学部也列了这方面的一个题目。
点击次数:  更新时间2018-05-31  【打印此页】  【关闭
友情链接:

0