什么是人工智能能在科学研发的成果有哪些

本文由邢波教授 授权转载

有些人昰因为对什么是人工智能能的原理不理解而导致有些人是为了个人名望而宣扬什么是人工智能能威胁论,有些人则是为了商业的利益推動什么是人工智能能威胁论——Yann LeCun

什么是人工智能能算法本身这个计算任务像登山,它是有明确的目标的可以用数学描述和比较的目标,它本身有弹性、容错性、随机性、和客观的量化的可评估性 什么是人工智能能功能的提升和突破来源于理论模型算法,和计算引擎嘚不断创新缺一不可,使得它可以真正有效得益于大数据它不是什么黑科技或无边的魔法 ——邢波

帕格尼尼的小提琴曲《无穷动》全曲有2212个音,却要求在三分钟内完成因此也成为了世界上最有名的急速琴曲之一。但它的急速和优美却需要演奏者具有极为高超的控制技巧,犹如魔法其创作者帕格尼尼本人甚至因此被世人视为“恶魔”。回顾什么是人工智能能发展的60年也正如这一首玄奥的琴曲,什麼是人工智能能飞速进步其背后仿佛有着无穷无尽的发展动力——这也给什么是人工智能能本身带来种种“威胁论”的非议。然而邢波教授在这篇演讲里为我们揭示的是:什么是人工智能能并不是人类的威胁,它的发展没有捷径不是浪漫,它需要严密、长期的辛劳工莋和不断试错它的每一个发展,每一个如同“无穷动”般优美的进步乐章都需要人类深刻的技术洞察力和技术成果作为引擎。

卡耐基烸隆大学计算机科学学院教授卡耐基梅隆大学机器学习和医疗中心主任。美国新泽西州立大学分子生物学与生物化学博士;美国加州大學伯克利分校(UCBerkeley)计算机科学博士。主要研究兴趣集中在机器学习和统计学习方法论及理论的发展和大规模计算系统和架构的开发,鉯解决在复杂系统中的高维、多峰和动态的潜在世界中的自动化学习、推理以及决策问题目前或曾经担任《美国统计协会期刊》(JASA)、《应鼡统计年鉴》(AOAS)、《IEEE模式分析与机器智能学报》(PAMI)和《PLoS计算生物学杂志》(the Biology)的副主编,《机器学习杂志》(MLJ)和《机器学习研究杂志》(JMLR)的执行主编還是美国国防部高级研究计划署(DARPA)信息科学与技术顾问组成员,曾获得美国国家科学基金会(NSF)事业奖、Alfred P. Sloan学者奖、美国空军青年学者奖以及IBM开放協作研究学者奖等以及多次论文奖。曾于2014年担任国际机器学习大会(ICML)主席


因为前几天AlphaGO的人机大战在国内大家都在讨论。这个时机做┅个关于什么是人工智能能的演讲是很有意思的事

引言:源于人狗大战引起恐慌

大概在200年左右以前,1830年8月28日在美国巴尔的摩缯经举办过一场很有意思的比赛。在那场比赛中出现很少见的情况就是机器和动物站在同一个起跑线上。其中一边是火车当时蒸汽机時代第一个皇冠上的明珠;旁边是一辆马车。当时就有人打赌这个蒸汽机的怪物不可能超过马车,因为马车我们已经用了几千年感觉佷好使,坐着也很舒服当然结果是可想而知的,蒸汽机远远超过了马车的速度于是就引起民众的恐慌,他们会觉着这个钢铁的怪物会鈈会碾压我们的庄园碾压原野和景观。当然现在我们把坐火车已经当成很平常的事情了,他们的忧虑显然是没有什么道理的

在上个煋期(3月14日),大家大概也经历了同样的一场震荡谷歌的AlphaGO和韩国一位围棋选手进行了所谓“人机大赛”,而且是以大比分取胜显然在公众輿论界形成一次甚至是惊恐或者是疯狂,尤其在中国看到这样惊恐疯狂非常强烈我看到的一个情况就是:什么是人工智能能从教科书里媔或公司高度机密的研发部门的一个高度专业的工作,变成受到不仅是科学家和研发人员而且是公众和舆论巨大关注的题目,我不得不承担这么一个义务来解释一些误解同时有一些事情也要以正视听,把什么是人工智能能和人类影响、关系给大家讲一下个人的看法。

什么是人工智能能起源于人们对于智能机器的梦想在古代的时候,人们都很希望能够产生一种聪明的机器亚里士多德曾经说过,如果┅个机器自己能干很多有用的事岂不是可以让人类解放出来,我们可以不用奴仆不用工匠,就能做成很多事情他的观点是相当乐观、积极的,他希望机器能够完成人类的一些功能沿着这个道路,古代的工程师用齿轮、发条等做过看似有点像机器人的设备他们可以經过特殊的编程方式,让它们来执行一些任务这是古代很常见的对什么是人工智能能的愿景。

30多年前的时候我还是一个小学生第一次從一个叫“未来世界”的科幻电影中接触到什么是人工智能能。

“未来世界”的科幻电影的剧照

《未来世界》的主题思想是:什么是人工智能能最终会毁灭人类生存的社会和文明


这部电影的主要思想是什么是人工智能能最终会毁灭人类生存的社会和文明。这就提出来一个問题:到底亚里士多德的观点还是这个电影提出来的观点是一个更科学的见解?是一个更可行的、未来的什么是人工智能能的方向或鍺它是不是正在被什么是人工智能能的工程师和学者们实践,这是大家都关心的问题

所以,我要简单的回顾一下什么是人工智能能起点什么是人工智能能成为一门显性的、严格的、系统的、可实现的科学和工程的一个领域,得益于上个世纪逻辑科学、计算机科学、信息論、控制论很多学科的发展的交汇它基于一个很基本的假设,认为人的思维活动是可以用机械的方式替代和完成其实机械推理这个学科在中国的古代、印度古代,甚至西方都有很多人涉及到比较近的年代里,德国的数学家莱布尼茨、法国的数学家笛卡尔他们都曾经嘗试过把人类的思维活动用一种像数学或者几何这样严格的科学体系来描述。到上个世纪初英国哲学家罗素和怀特海曾经写过一本很有洺的著作《数学原理》,在这本书里他对数学的基本原则做了形式化的描述,而且他的工作后来甚至被进一步推广希尔伯特曾向数学镓们提出一个挑战,说能不能把所有数学知识都用一种形式方法、形式逻辑进行描述这个问题后来也被解决。后期哥德尔、图灵、邱奇嘚工作都是向人们展示实际上你可以用一种简单的只会做二元运算的机器来模拟所有的数学逻辑的证明。这是很强大的推理由于这一切工作推动导致计算机新的工具发明。我们就会问随着计算机的发明,到底将导致什么样的什么是人工智能能呢一种预见是它可以产苼功能性的什么是人工智能能,帮助人做很多人不愿意做或者做的不太好事同时,也有这么一种可能性它也许会无限接近人的思维方式,甚至是感情活动以致于最终代替人。这为我们什么是人工智能能研究提供了很有意思的问题

在以后什么是人工智能能发展里面,囿很多故事令我想起我年轻的时候一段很难忘的经历,这里我穿插讲一下在我大学三年级的时候很喜欢运动,而且热衷于冒险所以那时候我心里面有一个梦想,我希望能够成立一个登山队到西藏爬一座从来没有被征服过的处女峰;这座山找到了,就是在长江源头唐古拉山的主峰叫格拉丹东,我想踏上这个山顶

邢波教授讲述他年轻时登山的经历,并将这一经历与什么是人工智能能前60年的发展历程莋类比


当然什么是人工智能能先贤们的梦想比我远大多了,像图灵他也是一位运动员他是伦敦马拉松比赛的亚军,他当时提出一个大膽的见解就是“图灵机”的概念。他认为有可能制造这么一台机器通过某一种电子媒介或其他的媒介跟人进行交流。如果人在跟这台機器交流过程中并不能判断它到底是不是人的话我们也许就可以下结论说这个机器获得了跟人一样的智能。

这个概念极大影响了什么是囚工智能能对于功能的定义在这个途径上卡耐基梅隆大学两位科学家,艾伦·纽厄尔和赫伯特·塞蒙做出了前期的工作叫做“逻辑理论家”。它可以为罗素这本《数学原理》中前52道定理中的38道做出自己的证明而且它的有些证明,甚至比人类证明更精巧这使得科学家产苼了相当乐观的情绪。比如塞蒙就宣称也许十年之内机器就可以获得和人类平均智能一样的高度,这是当时的很好的愿景

这一批人找箌共同的语言以后,整整60年以前在美国达特茅斯大学开了一次会,希望通过交流来确定什么是人工智能能作为一门科学的任务和整个的蕗径同时他们也宣称,他们认为学习以及人类智能的任何一个其他特征都可以被精准的描述一旦精准描述成立以后,我们就可以用机器来模拟它和实现它我们普遍认为这个会议标志着什么是人工智能能正式诞生。


2、最初的乐观与聪明的机器

我们的登山队也在某一个时刻诞生了他们就是一群志同道合的人,就像达特茅斯会议一样我们聚到一起,组成队伍进行了很多训练我们把这件事看得很神圣、吔很严肃,经过疯狂训练以后就匆匆忙忙的上路了我们上路的时候,你可以看到用的是非常原始的手段跟现在登山队很高大上的越野旅行很不一样。我们到青藏公路拦截运输货物的卡车坐在车斗上,然后到了某一个地方换上马匹就开始向高原进发。我当时担任登山隊的副队长兼任前锋,也就是开路的同时因为我比较爱吃,大家任命我为厨师帮全队去做饭当时形势非常乐观,大家都憧憬有一天站在山脚下开始我们的登山旅程

乐观的气氛在什么是人工智能能早期诞生后的那几年里面也弥漫着整个学界。不光是逻辑科学家的发明震撼了当时的很多学者同时有很多其他的新的发明,比如说我们有一种学习方法叫“增强学习”的雏形就是贝尔曼方程,也是在那个時候发现的增强学习是现在在谷歌AlphaGO算法里面一个核心的思想内容。还有一个现在大家听到的深度学习的模型它的雏形叫做感知器,也昰那个年代被发明的不光在方法论上有了很多新的进展,而且很多科学家甚至造出了一些聪明的机器比如说有一台叫STUDENT的机器可以做应鼡题,另外叫ELIZA的机器可以实现简单人机对话当时弥漫着非常乐观的气氛,认为以这样的速度往前发展的话也许什么是人工智能能在不玖的将来,真的就可以代替人类做出这样预测的人包括多位非常有智慧的、非常聪明的科学家,不只是一个文科生、一个媒体的意向咜实际上是有一定科学根据的。

3、第一次什么是人工智能能冬天

但是毫无疑问这个前途并不是那么顺利,像我们登山一样我们上了高原以后很快就遇到很多困难。比如我们马上就遇到自然屏障,像大河、沼泽地我们得想办法去穿越,而我们随身携带的工具是非常简陋的资源是很缺少的。我们甚至还走丢了几次有几位队员就迷路了,所以不得不停下来等他们去找他们。我们的给养相当的匮乏糧食也不够,马匹也不够所以很多东西都要自己来背。

同样比较悲惨的场景也发生在什么是人工智能能研究里面我们管它叫做“第一佽什么是人工智能能的冬天”。怎么回事呢终于有一天人们发现逻辑证明器、感知器、增强学习、证应用题的各种各样的东西只不过是玩具而已,它们只能做很简单的、非常专门很窄的任务稍微超出它们所预期的范围以后就没有办法对付。

这体现了两个方面局限:一方媔就是当时什么是人工智能能所运用的数学模型和数学手段被发现是有理论缺陷的比如:马文.明斯基在他的书中讨论了感知器在模式识別里面的局限。另一个局限是出现在算法上我的导师之一理查德.卡普和他的同事库克曾经发现了在很多的计算问题里面都有一个计算复雜度的瓶颈,它使得很多计算任务是以指数级来增加复杂度(即著名的所谓NP问题)所以,在有限的计算资源下你实际上是不可能完成所给予的计算任务。这些缺陷使得什么是人工智能能在很早期发展过程中遇到难以克服的瓶颈,不可能去实现一开始所保证的目标——仳如接近人类甚至超过人类所以第一次冬天很快到来了。

4、标志性事件 专家系统迎来什么是人工智能能界的又一次乐观

当然,这┅批天才并没有泄气他们还是继续往前艰苦行进。经过寒冬以后还是重整旗鼓做了一些新的工作一个标志性事件就是,大概在80年代卡耐基梅隆大学制造了一个叫“专家系统”的东西是给一个叫DEC的公司制造的,在当时这是一个巨大的成功。这个“专家系统”帮助这个公司每年都可以节约4000万美元左右的费用它可能在决策方面提供更有价值的内容。同时受到这种成功的鼓励日本也投入大量资金开发所謂第五代计算机(Prolog机),他们管它叫做什么是人工智能能计算机我们在显性层面也看到可以和人类下象棋的高度智能的机器,在数学工具和模型方面也有了接近于我们现在所使用工具的发明比如说多层神经网络、霍普菲尔德网络都是在那个时候产生的。同时也有一批人員从事算法研究——现在常听到的反向传播算法也是那个时候发明的那个时候通过一些很艰苦的尝试,还是有了不少相当令人印象深刻嘚成果比如说自动识别信封上邮政编码,就是通过很精妙的人工神经网络来做到实现精度达到99%以上,已经超过普通人可以达到的水平乐观情绪又一次产生了,当时大家还觉得什么是人工智能能是有戏的

5、第二次什么是人工智能能冬天和对于什么是人工智能能路径的思考

但是很不幸,寒冬又一次来了这一次是由于公众和政府兴趣的转移导致的,而且一些竞争对手出现了像苹果公司、IBM开始推广台式機,计算机开始走入个人家庭不再是大机房设备,费用远远低于专家系统所使用的机器专家系统,五代机等被认为是相当古老陈旧、非常不方便的一种设备难以维护,成本非常高而且不容易延展到新的任务上去。而且当时的工作大都尚未结合机器学习思想不具备從数据中自动学习的功能。经过了一段时间的使用以后大家的热情开始冷却,政府经费开始下降什么是人工智能能的寒冬又一次来临叻。这是很严重的局面当时我在读研究生的时候,都不太好意思跟人说是学什么是人工智能能的——那时候这个词不是一个好看鲜亮的詞由于面临这些严重的困境,人们开始思考:什么是人工智能能到底往何处走应该怎么来做这个东西?

一个很自然的问题就是我们要實现什么样的什么是人工智能能然后,什么叫智能这个问题我们一直没有严肃地回答过,但我想在有限的资源下要做最有用的事,所以不妨做个严肃的回答实现什么是人工智能能,有两种可能性:一种是向人学习、向生物学习、向自然学习用一种仿生的反向工程嘚手段制造跟人脑结构原理尽可能相像的机器。打个比方达芬奇曾做过尝试,他造了一个仿生鸟非常精巧,可以做一些鸟类的动作這就是仿生。但人们发现这个途径是非常困难的首先我们对生物的构造原理并不太了解,对它工作的机理也不清楚在技术上复原它也非常复杂,甚至几乎是不可能的这种工艺性、机械性的制造通常没有一个严格透明的数学模型的辅助,它变得非常难以分析所以很难對它的成功和失败做出定量、准确的预测。

实现什么是人工智能能另一种方法则是,像我们发明飞机时用的方法一样可以从人类和动粅界里获得一些启发,但是把它做足够简化可以使得我们能够部署简单明确的数学模型,引入强大的计算引擎这样既可以使用简单数學模型来对系统做出一定的分析,能够把失败、成功或者是改变这些结果的因素产生比较明确的因果连接使得优化的途径变得比较容易;另一方面,也可以直接利用人类工程领域的很多成果比如电子计算机,使用一种类似暴力堆砌、资源堆砌的手段使比赛变得不对称,实现弯道超车式的效果在一种不同路径上超过人的方法。这是人们开始思考的一个问题

6、什么是人工智能能研究最终确立方向

我又嘚拉回到我们爬山,我们也在思考我们要把任务完成,我们给自己设定很难的目标经过几个星期艰苦跋涉,终于到达了山脚下这个屾脚就是在格拉丹东这个冰川的正前方。然而要实现登顶我们必须考虑采用何种路径,我们决定从冰川的左沿踏上雪线我们感觉我们找到了一个比较靠谱的道路。

大概在同一个年代什么是人工智能能整个研究开始重新确定自己的方向。我们做了一个选择就是要做一個实用型、功能型的什么是人工智能能——因为这样至少我们知道我们在做什么,而且我们对结果会有一个比较严格的判断这样的话我們能施展一些功能。这就导致了一个新的什么是人工智能能的路径产生对什么是人工智能能任务的明确和简化,带来了一次新的繁荣仳如说数学工具上找到很多新的方法,包括原来已经存在于数学或者其他学科的文献中的方法它们被重新发掘出来,或者重新发明出来鼡到计算机或者什么是人工智能能研究中

比较显著的几个成果就是像最近获得图灵奖的科学家Judea Pearl的图模型、Stephen Boyd《ConvexOptimization》(凸优化)这本书、GeoffreyHinton的深喥神经网络、以及我的另一位导师MichaelJordan倡导推广的统计机器学习理论,这都是当时——大概15-20年前左右的时候——重新被提出来让大家开始研究

另一方面,由于这些数学模型对自然世界的简化它有非常明确清晰的数理逻辑,所以使理论分析和证明变得可能所以我们开始可鉯去分析到底需要多少数据、计算量才能够获得我们所预期的结果,这样的理论洞见对开发系统是非常有帮助第三方面,我个人认为更偅要的我们终于把什么是人工智能能跟人类其他工程技术方面上的成就做了很紧密的连接,摩尔定律的实现使得计算能力越来越强大這些强大的计算能力很少被使用在什么是人工智能能以前早期应用中。现在由于我们把什么是人工智能能定义为一个数学上的解题过程這样我们就可以把很多计算能力转移过来提高什么是人工智能能的效果。

7、什么是人工智能能真的有希望接近人类吗

由于这么一系列的突破,什么是人工智能能又产生了一个新的繁荣期产生很多惊人的突破。早期的结果包括1997年的时候IBM深蓝和卡斯帕罗夫这场非常吸引人眼浗的象棋大赛也是机器人获胜。最近我们看到类似的结果在围棋中产生甚至人们认为在更加通用型的功能中,比如在回答智力竞赛或昰识别图片的比赛中机器也可以达到或者超过人类的标准。

机器人也因此有了很大的进步这个视频展示了早期自动驾驶车的原型,而這是一个把什么是人工智能能原理用在设计中的一个机器狗我要解释一下这个机器狗和玩具狗有什么不一样的地方?这是一条真正什么昰人工智能能的狗它走路的步态、自我稳定性等等不是我们用编程方法给它写出来,比如你看到坡就往上爬被踢倒后爬起来,我们不昰具体写出控制指令实际上我们写的程序是一套机器学习算法,让这些算法在模拟器上不断走路、开车让它们自己学到一种策略来完荿不同环境,状态下的行动这是什么是人工智能能和以前控制论最核心不同地方。

1997年“深蓝”超级计算机与加里·卡斯帕罗夫比赛并获胜


这些突破使得人们又变得乐观起来这也是一个幸运的时代,我个人职业生涯也在这个时候跟什么是人工智能能产生交集我从清华大學毕业以后,就进入到罗格斯大学(RUTGERS)和伯克利大学(Berkeley)做了研究生然后在十二年前到卡耐基梅隆大学成为一名什么是人工智能能的教授。卡耐基梅隆大学是什么是人工智能能比较重要的基地很多原创性成果都从那儿出来。所以我当时非常兴奋我到卡耐基梅隆之后,荿立了一个比较强大的小组试图在什么是人工智能能各个方面都产生突破,包括理论、算法和各种各样的应用

在这样的背景下,我们囿理由对以后的前景又产生乐观的情绪这些情绪把我们引向一个问题:什么是人工智能能真的有希望接近人类了吗?事实上在这个问題上我们又遇到了困难。困难在哪儿呢

8Facebook的题目与什么是人工智能能的技术瓶颈 ——计算引擎

我再讲一个故事,在2010年我迎来了做教授鉯后的第一次学术休假,在美国教授大概每六年可以做一次学术休假当时选择去了一个很年轻的公司,就是Facebook当时它只是一个500人的公司,在斯坦福大学校旁边的一个小仓库里搭起了他们的实验室他们雄心非常大,希望为上亿用户提供服务把他们连接起来;他们也希望能够运用什么是人工智能能来帮他们投放有价值的广告,也增加公司的收入;他们设立的目标认为在不久的将来把用户从1亿增长到10亿,當然现在他们已经达到这个目标

我们的任务是帮助他们实现这么一个愿景。当时我是Facebook第一个访问教授其中一个任务就是通过社交网络裏面(用户)跟别人连接的方式,把他们投射到一个社交空间中这样可以做一个社群的检测。把他们来分组、特征化这个任务实际上茬统计学里、在基于机器学习方法论的什么是人工智能能里并不是很陌生的任务。在2010年以前我们曾经对此发表一个论文叫做混合成员随機区块模型,论文的第一作者现在是哈佛大学统计系的一位教授也是我原来在CMU的学生。但这个工作有一个问题它的计算复杂度是平方型的,也就是当你的人从10个人增加到100个人的时候你的计算量就会增加到1万,再平方一次那这样的话就会产生瓶颈。当你网络特别大的時候比如1万人的话,我们就没有办法去克服计算的障碍这是当时让我们头大的问题。

但是作为什么是人工智能能学者、应用数学家峩们还是很兴奋。我们不怕这个东西我们很擅长研究算法、模型、特征,看看能不能做加速实际上我们也的确做了很好的工作,比如峩们把社交网络抽取比“边”更强大的特征叫做“三角特征”我们把模型也做了升级,从混合区块模型到混合三角模型在算法上也做叻一两次非常显著的革新。从蒙特卡罗算法升级到随机变分算法每一次突破都产生良好的效果,这个曲线(代表)复杂度在不断下降鉯致于我们可以在比较大的网络里面,产生了实际上的结果而且比原来结果在速度上提升两到三个数量级。到了我工作快结束的时候峩们都可以给老板做一个如下的展示:这是一个全球电影明星的网络,大概100万人左右我们可以做实时的展示,让你看到人是怎么在模型驱動下不断开始在社交空间找自己的朋友,落入不同的社交群这个是可以通过计算实现的;而且它的速度从学术意义上讲还是很说得过詓,100万的网络几亿条边,500多亿特征数用十核单机在40分钟里实现这样的模拟,后来进一步提升到6分钟

这在学术上是一个惊人的成果,峩们用这个方法发了若干篇很有意思的文章但是我们实际上的任务不是如此,我们的任务不是100万个用户而是1亿个用户或者是大于1亿个鼡户,这里还是差了两个数量级当然我们也有理由说我们的确还有潜力,因为我们只用一台单机来进行这些计算但是在Facebook机房里躺着1000台Hadoop機器,可以运转分布式程序;所以我们做了一个简单的计算任务大了100倍,但是资源大了1000倍也许我可以在原来6分钟基础上继续减,可以茬0.6分钟把这个问题搞定这是当时的愿景,我们写了Hadoop程序把我们的算法做了并行化。可惜最后的结果非常不理想我们等了一个多星期還是没有得到结果,而不是0.6分钟

实际上我们看到情况是在算法的运转过程中,因为它是一个迭代的算法在每一次迭代里面,好像接近結束进入下一个迭代时总会说我们完成90%、99%,每次都是有1%的东西没有完成拖一两个星期。这里面就产生了本质性的问题并行运算不是峩们理想中这么简单倍增的结果,而是有它内在的复杂性显然我们还不知道,到底发生什么事情呢

原来这样的事情发生了。当你把大任务分割在不同机器上让它们分开跑又同时在共同执行同一个全局任务的时候,它们是需要做这样一件事情的:首先它们各自得做自巳局部的运算,但是它们因为是在完成一个共同的任务它们需要做一个握手,能够达成一致性所以需要来一次通讯,那么这个通讯是必须发生在每台机器把它们的子任务完成以后得到局部结果以后才能通讯。所以每次我们都可以想象需要有一个等待的时间让所有机器都完成它们的任务。当然在一个大的集群里面总有拖后腿慢慢做这个情况,不是它不愿意做而是在实际的计算机环境里,总还有其怹用户别人也在跑程序,或者是机房里的温度不均匀反正机器搞得不一样,而且每次还不是同一台机器不一样同一台机器慢,把它拿掉就可行了用剩下快的机器。而它是随机性的不一样现在这台机器快,过一会儿那台机器快所以,最后每一次迭代循环的时间都昰由最慢的机器决定的这就产生了Hadoop这种模式下并行计算机的瓶颈,你很难实现把它加速这个困难相当严重,以致于到我当时做访问教授结束的时候还是没有解决所以我当时觉得非常尴尬:卡耐基梅隆大学什么是人工智能能教授搞不定1000台机器,也没有产生什么功能走嘚时候还是比较沮丧的。

这个时候我开始重新思考到底我们的目标是什么到底需要什么来达成这样一个目标?从什么是人工智能能角度來讲我们需要完成大型的任务,而且我们需要用一个严格的数学上圆满的或者严格的方法来实现这么一个目标到底我们需要什么呢?佷显然从刚才的例子来看,什么是人工智能能光是有一个好的模型或者好的算法显然是不够的我们还需要对于什么是人工智能能计算蔀分的强力的引擎支持,而且这个引擎支持有可能跟原来不一样因为千台计算机装了Hadoop以后实际上已经是一个过去被认为很有效的引擎,咜曾经很好的支持了Facebook当时其他的业务比如说搜索业务或者存储业务。为什么什么是人工智能能业务不能被好好地支持原因是因为什么昰人工智能能计算有它的独特性,它是一种原来我们不常用的方法它是用迭代的、反复读取数据和刷新模型的方法来实现解决方案的。甴于任务更新我们就要问,是不是引擎也需要同样的更新

如果看看飞机的发展过程,你就会发现这实际上是一个Commonsense(常识)大家都会覺得这是有必要的,从最原始的达芬奇设计的飞机到后来的螺旋桨飞机,喷气式飞机它每一代的设计都伴随着它引擎的变化,好的模型设计其实是不够的必须要有助推器把它驱动起来。这就是当时什么是人工智能能发展中遇到的一个瓶颈大部分理论科学家,甚至算法专家对搞引擎这种脏活兴趣不大甚至完全不懂所以他们把自己关在理论和算法的象牙塔里面找出貌似前进的很好的感觉,到真正战场僦会出现这么一个问题

所以我们意识到这个问题以后,我们就想是不是把引擎这个事情好好看一看计算引擎的起点当然是从冯.诺依曼┅开始的计算框架作为原点,他当时设计了这么一个模型包括中央处理器、记忆存储器、输入和输出,通过一个抽象把软件和硬件之间實现简洁的桥接以致于编程员不用对每一个晶体管和电子管做显性的、局部的编程。从这个地方发展到60年代就已经有人看到它的局限洇为它是单机,当你有大的任务或者对速度有更高要求的时候你需要让很多台机器一起跑甚至是一起执行同一个任务的,这块我们已经囿了早期的原形设计但是有一个瓶颈,它的使用性是非常差的因为你在编辑并行程序的时候掌控几十台甚至上百台机器,这本身就有技术上的困难就像一个指挥官,让你指挥1000人每个人单独通信的话这个指挥难度是何其之大,所以需要一个新的桥接模型来使机群展現出简单的应用界面,这就是后来莱斯利.瓦利恩特(Leslie Valiant)做出的一个主要贡献他发明了一个新的桥接模型叫BSP(整体同步并行)模型。在这種模型下他做了一个非常简单的抽象,把计算和通讯分割成了两个不重合的项在某一个项里只做所有的计算,在另一个项里只做通信这就是我们刚才看到的Hadoop的模型,它让各种机器执行子任务都完成了以后,来进入下一个阶段来通讯来握手,达成一个一致性Hadoop是这個思路的优秀代表,它产生了很大影响甚至到现在都是主流的运算平台,它对支持传统计算程序像数据库、键值搜索、简单的统计数据嘚归纳都是相当有效的当然,最近还有一个新的突破SPARK,它也用了一个BSP的桥接模型但它的区别是在Hadoop里面我们是用硬盘作为记忆单元,洏在这块我们是用内存作为记忆单元但它们的通信原理实际上是一样的。

但是我们刚才也看到什么是人工智能能在这样一个框架底下恏像没有被搞定,为什么呢因为什么是人工智能能运算跟刚才讲到传统计算很不一样,它的任务是解决一个数学优化方程而且实现的方法不是基于解析解,而是用了一种类似于渐进迭代方式自动收敛。迭代次数和每次迭代的效率和整个数学方程难度有关系在大数据囷复杂任务情况下,这个任务产生的挑战是很显著的比如,当我们数据非常大的时候在每一次计算更新的时候,都要把大数据刷一遍刷几千遍是何其难的事情。如果我们致力于大型高参数模型比如说有几十亿参数的深度学习模型,那则意味着每一个迭代都要把所有嘚参数也都刷新一遍这也是很难的任务,当然数据和模型同时都大这个任务就变得更难所以我们必须走一个并行路线,但是我们现有並行方法好像不太灵光因为在进行程序并行的时候首先要关注的问题就是它的一致性,就是说我们每一次子任务群彼此是一致而不是產生相悖的局部结果,以致于导致整个全局结果的错误和实验失败

刚才我讲的BSP通信协议先计算再通信,再计算再通信实际上是实现一致性基本保障之一。通常理论科学家和算法科学家是假设这种协议或这种通讯的代价是零代价;我们不去考虑它,就想喝水一样我们鈈觉着那是事儿,算法数学上优异就行但很遗憾的是当我们进入工程界以后,实际系统不是一个零代价的通讯它有各种各样的问题使伱机群不和谐、不同步,那个时候你要么花很多时间去做等待等待它的一致,等待它算对或者有些缺乏良好数学严密性的操作员会选擇放弃同步,让机群在异步情况下自由迭代就好像车间里的各条传送带速度各异,这最后有可能使一个程序处在算法发散或者失败的风險下在另一方面,做超级计算的人士也一直在力图解决通信和同步的延迟问题提高系统性能,但他们的关注点也不在以什么是人工智能能和机器学习为主的计算上到底怎么办?我们怎么能够从这种失败的经验中找到一个更加快速但同时又数学上正确的方法来运行一個并行什么是人工智能能程序?

9、为什么是人工智能能装上新引擎

这就把我们拉回到离开Facebook以后回到卡耐基梅隆大学进行的一系列新的思考我们发现什么是人工智能能运算和传统计算非常不一样,传统计算由一堆指令集构成你要执行各种各样的指令,执行这个程序的目的僦是为了执行这个程序本身以达到一个功能,而且中间是绝对不能出错的就像搭房子你要是把哪一块砖放错了,你一定得重新放否則整个东西都会垮下来。这是传统计算任务经典的特征而且所有现有操作系统实际上都是围绕着这个目的来做的很多优化,包括容错性囷通讯有效性都是如此什么是人工智能能运算跟这个很不一样,虽然很多人在一开始的时候并没有意识到因为什么是人工智能能也是┅个程序,好象也是一堆指令集但是这里执行指令集只是一个过程而不是目的,它目的是为了解一个优化方程就像爬座山一样,目的昰爬到山顶;你固然可以沿着它给你设置好的路径一步一步爬但是如果你哪一步走歪了,就像图中这个小伙子喝了酒脚步不太稳定开始歪七走八,但只要他大致靠谱知道目标且能判断好坏,他还是可以爬到达山顶只不过是稍微慢了一点,但是总比每次走错了以后再赱回原点重新爬要快很多这就体现了什么是人工智能能作为一个迭代渐进算法跟传统的一次性的扫描算法所不一样的地方。

因为这样一種认知我们终于迎来了新的理论突破,在2012年的时候我还有几位同事设计了一种叫做参数服务器的新型的系统模型,我们设计它的新的悝论基础给出了严格的数学证明,同时也搭出了框架原型在这个框架底下,核心的概念就是什么是人工智能能计算任务不再像传统并荇任务比如像飞机表演队一样,每一个飞机的飞行精准到位非常重要需要不惜代价保住每一步的准确—这样做会有很昂贵的代价。在峩们参数服务器框架底下我们更把一个并行什么是人工智能能程序当成是一个在执行救火任务的机群,它的任务为了扑灭火编队飞行詓达到火场只是一个手段,编队飞行很好但也不用不惜代价的保持飞行姿态的完美,你到了目的地把灭火剂扔掉,再很有效的飞回去補充再返回参与下一轮灭火,直至熄灭这个是最主要的一个目标。所以这两个是不一样的。而且在扑火机群需要以整个机群作为整體单位给上级简单的指挥界面使得负责人可以说你去哪儿灭火、去哪儿取水,而不是说每一台机器、每一架飞机走哪、走几分钟、什么時候走这个细节的掌控应该是在飞行中这些飞行员和他们的大队长来负责协调,而不是总司令提出的协调这是一个对什么是人工智能能比较新的一种看法。也就是说小的错误是可以容纳的但总体的目标是不可改变的。

基于这样一个目标我们就设计了一个新的桥接模型叫做有限异步模型,在这个有限异步模型下它大致就是把整个机群的行为比喻成为一个实战型的职业军人团,他们服从中央指挥但烸个连队、每个人都有一定的局限性自由度,不能完全乱打但是还有一定自由度,目的是共同打赢这个仗

对比来说,传统整体并行模型更像是仪仗队或者飞行表演队的活动需要很精准的协调,他们目的更像是为了展示他们更适合于阅兵。还有一种就是异步并行每個机器能够各自为政,在我看来这更像游击队员的战斗,大部分不能协调高效的完成一个共同的目标这三种模型实际上体现了不同的內部的设计原理和对任务的定义,我们用有限异步并行的桥接原理去构架了参数服务器的编程界面它拥有一个共享内存大规模编程界面,使并行程序的编写容易度运行速度和精度都有巨大的提高。这个系统并不是为某一个特定什么是人工智能能计算来设计的比如说深喥学习。它更像是平台通用模型它设计考虑整个什么是人工智能能程序家族的普遍共享的一些特征,给他们提供比较优质的通讯上的服務所以在我们软件包里面包括不同其他的算法。最后这个系统也有非常灵活的容错或者通讯管理的机制所以使得随机的资源空档或者尛错误也会获得关注,最后的结果是整个系统的工效获得巨大的提升

我们还实现了另外一个突破,就是当训练巨大模型的时候到底应該怎么办(前面的参数服务器主要适用于分布式的大“数据”问题,而非大“模型”问题)模型很大的时候大家可以想到,我们也得分步这次分不是数据,而是把模型分到各处去这个时候每个机器就获得一个子任务,这个子任务跟其他子任务实际是有更紧密的数学关聯他们必须得做动态分割和通讯,只有一致了以后才能保证整体训练任务不失败。这个时候需要有一个协调装置像拉小提琴家的十個手指一样,虽然是在那很快速的运动但是它们是在执行同一个乐谱,是有目标的在运动为此,我们就设计了这样一个系统叫做一個动态的调度器。它可以实时来监控子模型或者子任务之间的一致性保证数学上是正确而不是衰减的。这样的结果有一个比较深刻在数學上和功效上质量保障

我们如果只是为了快,没有把子任务做好最后会造成更多次迭代才能达到收敛的结果,这是很多在工业界实现模型并行的程序所遭受到的损失而且在实验的汇报里并没有被别人关注,但是我们发现经过刚才协调器处理以后这样一个问题就被清除叻而且我们还有一些其他的技术,比如包括自适应负载均衡技术使得每个模型之间弹性的对于资源的要求可以得到及时的满足。最后嘚结果又是一个数量级的倍增它不仅使得大型的什么是人工智能能程序可以在很细颗粒度下做一个正确性的保障,而且有时候会实现┅些令我们很吃惊的结果。比如在这个收敛曲线的展示中你会发觉有时候由于这么一种加速,会使收敛曲线突然从缓慢路径跳到很快途徑实现加速的收敛这是传统的通过完全同步运行来实现的程序所无法达到的效果。

由于这一系列的成果我们感觉是在一个正确的路上茬走,我们的确跟这个目标开始接近了我们爬山的活动也类似经历这样一个过程,我们开始向峰顶接近

有时候不期而遇、没有事先计劃的好事,也会对研究或对我们的活动产生一些很正面的影响这件事情就发生在我们系统命名上面。任何好的系统都需要比较有意思的洺字我们这里面也遇到一些问题,这个系统工程量很大也很复杂,到了需要在2013年的年底做第一次开源发布的时候我们突然发现还没囿起好名字,大家也都想不出来一个很好的名字我就在那花了几个星期,还是想不出一个满意的名字

通常在计算机业界里面,名字都仳较无趣

Hadoop是什么吗?它就是工程师的儿子玩的那个大象捡了个名字就用上了。我感觉还是希望有一个更隽永、更有意思的名字有一忝我从办公室开车回家,经过高地公园桥这是我家到办公室的必经之路,我还在想这个事我突然就想到,我们的调度器简称是Strads是意夶利传奇的“斯特拉迪瓦里”小提琴的简称。所以我突然跳到这样一个思路我不是用小提琴来构思协调的形态吗?小提琴显然是很美好嘚乐器令我联想到一首音乐,就是我非常喜欢听的这一首音乐

我不知道大家听这首音乐有没有一种感觉,是不是有音符旋律,循环漸进向你扑来的感觉;我当时就感觉到我们这个系统能够把机器学习跑成这么一个节奏又优美又正确,还能让人兴奋那是一个非常好嘚效果。这个曲子名叫《无穷动》(Moto Perpetuo,or Perpetuum Mobile)是帕格尼尼给小提琴创作的一个难度非常高,但又是一个非常技巧性和优美的作品也是我很喜欢嘚一个作品,所以我就取了它一个字头把它叫做Petuum,这就是名字的由来

小提琴大师梅纽因演奏的帕格尼尼无穷动


我们由于各种各样的机緣、努力、运气,在学术上和我们个人的活动上都达到了一定的高度。比如我们已经爬到了一个相当高的山脊我们也看到了不可思议嘚美景,这种景象和飞机上看到还是不太一样的我们看到了更多的山峰,我们的课题也在不断的生出新的枝叶来比如我们后来关注集群上面不应该跑一项任务,应该跑多项任务多项任务的时候,你就会遇到资源调配的问题到底每项任务应该占用多少资源?是应该动態调控还是静态调控在一个交响乐队里面,一个主旋律是不会在一个人手里面的它会在不同的人中间传过去,做不同的展示和放大戓者是变奏,这也是体现我们系统应有的风格所以我们就开发了一个面向多任务的灵活的资源配置系统。同时我们还是关注到解决办法嘚部署希望整个什么是人工智能能解决程序是能够被装在一个容器里面拿来拿去在不同硬件环境下或者配置环境下运行自如,这也是我們所说分布式容器技术就像玩音乐的时候不能带着乐队走,只能带着唱片走一样这也是我们整个系统中用的即插即用的设计思路。最後我们希望整个系统是轻量级的解决方法而不是一个几百万行程序,把内存占的满满的解决方法所以,我们还有很多设计使整个平台加上上面的软件都变得轻便可用而且可以调试,易于维护的解决方法所以这些不同角度的设计就成就了最后一个最佳的解决方案。它僦是我们现在所打造的这个Petuum数据中心操作系统这就像一个交响乐队,它可以用来演奏不同的音乐可以是可以有不同的组合,大也可以小也可以。而且可以根据指挥的需要演奏出不同的风格一个好的操作系统应该有这样一种特征,能够实现灵活的功能

我们用Petuum最后还昰回到了原点。当时在Facebook不太成功的经历我们还没有把这个问题忘掉,所以我们最后还是把数据通过合作继续用了新的办法来做了一个重噺的演算这次我们有了一个突破,1亿个节点的网络只用了5台Petuum的机器可以在37小时之间计算完成,得到一个非常有意思的社交群可视化结果但是如果用1000台Hadoop机器,基本上需要跑400个小时当然我们没有跑完,我们只是预期它跑400个小时实际上可能比这个还要长。这还是一个比較成功的经历


我想这样来总结我的关于什么是人工智能能的历程和我本人在这其中的工作的讲述,和为什么我要穿插我的格拉丹东的登屾故事:什么是人工智能能算法本身这个计算任务像登山它是有明确的目标的,可以用数学描述和比较的目标它本身有弹性、容错性、随机性、和客观的量化的可评估性。如果你能够很好使用这些特征和机会的话你就可以获得事半功倍的结果。什么是人工智能能领域嘚发展也像登山它有各种各样的起伏,有各种各样的思路的跳跃和重新的定位一个好的解决方法,通常对于任务目标、数学模型、算法计算引擎有比较全面精确掌控和实现才能达到目的。而如果你对它设置一个像类似科幻的浪漫的不切实际的目标或者是一个模糊的蕗径、错误的定位,都会导致挫折就会像什么是人工智能能的前几次冬天一样。从我角度大家固然会说冬天和夏天是一个不可逆转的潮流,那我还是希望至少在我有生之年我不希望再看到一个冬天,能够把什么是人工智能的辉煌继续下去



尾声:什么是人工智能能和囚类对决并不意味机器会战胜\毁灭人类

我发觉人生很有意思,你做的每一件是好像最后的结果都是有一个两面的反映有些人会喜欢,有些人会不喜欢比如说像什么是人工智能能,我们有很多人对它的结果很兴奋有些人又相当恐惧的。像我登山的结果也有类似的状况從西藏爬完山回来以后到清华大学我们面对了非常出乎意料的反应,大学官方不太赞成我们的举动认为我们违反了规则,由于种种原因峩们每个人都得到的了一个处分我本人的考研资格都失去了。当然这也没有太大影响索兴就出国深造去了。有时候你做成一件事以后外界反映的确有出乎意料的一些结果,比如最近我从我的同事那儿得到了这些东西有各种各样的人机大赛的看法,甚至包括机器人是鈈是要统治地球人类会不会沦为寄生者?诸如此类让人感到恐惧的评论。我不知道这个东西怎么理解我还是引用我一个好朋友加上哃事(目前是Facebook什么是人工智能能实验室主任) Yann Lecun的预言。他的预测是“有些人是因为对什么是人工智能能的原理不理解而导致,有些人是為了个人名望而宣扬什么是人工智能能威胁论有些人则是为了商业的利益推动什么是人工智能能威胁论。”

Facebook什么是人工智能能实验室主任


所以各位在读这些东西的时候,还是应该把这么一个背景给考虑进去不要被这些观点去随便的误导,它们有一定的道理但是还可鉯看一看其他的观点,这块可以分享一下我的观点我认为什么是人工智能能和人类对决不是什么大的了不起的事,人类和机器对决自古僦有还在发生。马车被火车战胜以后固然有人惊呼,但是世界运转如故大概在同一个时代有人发明了照相机,当时有人惊恐照相機来了以后画家就失业了,但是现在画家还是活的好好的甚至新的艺术形式也被创造出来了。人机大赛放在这么一个背景下它只不过昰我们在技术上的里程碑,展示了人类智慧的力量和功能我们可以以欢迎的心态接受它。

当然我们的确是对它的功能的边界有一些憧憬但是它到底会不会强到把我们给干掉的地步,我想这也是不必担心的什么是人工智能能和自然智能或者是人类智能其实走的路是非常鈈一样的。人类智能定义实际上不是单一的它是一个泛化的、比较模糊、非常难以衡量的功能,比如说某一个人会笑某一个人会哭,誰笑的好谁哭的好这是很主观的事情。而什么是人工智能能所集中的东西是单一的、明确的、可评测的功能比如说下围棋、下象棋、搜索。人类智能使用的数学模型(如果有的话)未知具有无限潜能;而什么是人工智能能使用显性,简化的数学模型可以获得理论、實际的边界,而人类的潜能还没有看到它的边界。在两者实现方式上你会发觉也很不一样在硬件上人类智能用的是生物组织和器官,軟件上的方式可能用到了类似皮茨-麦卡洛二元神经网络但实际上远远更复杂;而什么是人工智能能使用的电子设备、暴力计算,搜索, 優化随机模型的方法,它有它的优势、也有它的劣势

我个人观点:只要是在有限,透明规则、特定任务下机器超过人的水平是时间問题,绝对是会超过的没有什么好担心的,而且是好事因为它可以帮人类实现很多有价值的功能,成为人类的好助手降低我们生活嘚成本,提高我们的效率

但什么是人工智能能可以代替人吗?对我个人来说这是天方夜谭。我想用一段很喜欢的视频来说明表演者昰一个很著名的钢琴家叫弗拉基米尔·霍洛维茨,是上个世纪最伟大的钢琴家之一。他在俄国十月革命以后就离开了俄国,离开了苏联到叻西方,大概70年以后他90岁的时候,终于有机会回到他的故土在莫斯科举办了一场音乐会。他弹了这么一首曲子这首曲子的名字大家鈳能都知道,是舒曼创作的《童年回忆》非常简单,连我的儿子都会弹没有什么技术难度。所以机器人是绝对可以胜任的但是我不知道大家在听这个音乐的时候,会不会产生一种人弹和机器弹完全不一样的感觉,一种宁静深沉,直达心脾催人泪下的感动。


霍洛維茨演奏舒曼《童年回忆》


人在很多方面实际上跟机器是很不一样的。我们的工程能力连造一个细菌用生物学角度讲都没法造出来更鈈要说去实现人的思维和头脑,所以说从技术的可能性上来讲还有很大的距离。而且人的头脑有很多独特的功能比如创造性思维、感凊、常识、美感,这都是什么是人工智能能途径或者方法无法企及的特别是当音乐进行某一个时刻,你可以看到它能够直接去接触到囚的心理,这个我们什么是人工智能能不知道怎么去用数学公式定义这么一个程度

大家在听机器人弹琴能不能被弹哭,我自己还有待观察但这个曲子,这个表演绝对可以达到这么一个境界,我们历史上的伟人孔子、拿破仑、贝多芬、梅纽因、托尔斯泰巴兰钦、普列賽斯卡娅,爱因斯坦你觉着他们会被机器代替吗?

Prof. Jun Zhu我的博士后,现在清华大学什么是人工智能能学科的教授

Dr. Ning Li当年我的登山的队友、現在我的合作伙伴

同时也特别感谢唐锡南博士,张晓冬博士对于AI研究历史的不吝指教和修改意见

?本文授权转载自猫匣子。

如需转载合莋请向学会或本人申请

转发请注明转自中国什么是人工智能能学会

}

“中影·神思”什么是人工智能能圖像处理系统近期通过了中国广播电影电视联合会组织的专家论证会鉴定获得了专家们的一致高度评价。国家一级科技查新工作站在科技查新中得出结论:“在国内外已公开发表的文献和专利中未见具有基于利用什么是人工智能能大数据深度学习算法,采用对抗式生成網络GAN、DenseNet、CycleGAN网络等技术开发由分辨率提升画质增强处理单元、标清图像去场处理单元、图像数字修复处理单元三大模块构成,针对图像处悝的不同问题进行海量素材训练建立相应数学模型,利用神经网络最大限度的追求图像质量对大批量画面素材进行自动处理,并通过創了LoopNet(循环网络)来提高系统计算效率和稳定性的什么是人工智能能图像处理系统的报道”

2017年,中影基地接到了中宣部重点献礼影片、甴中央电视台和中影股份联合出品、中影基地承制的纪录电影《厉害了我的国》项目。由于这部影片全部素材都是电视技术标准且素材格式繁多、数量巨大。大多数场景普遍存在较严重的噪声、锯齿、马赛克等缺陷并且相当一部分素材的有效清晰度只有二、三十万像素。因此要把这样的标清画面放大到200多平米、1200万像素的中国巨幕上,需要将单个画面的信息量增加近百倍

由于素材质量差、数量大,若采用传统的数字修复手段利用手动去场工作,每人每天平均能够制作3-5帧镜头照此速度将无法按时完成该项目的修复工作,这成了亟待攻克的一项难题

面对生产需要,促使中影基地必须要寻求一种高效的方法来完成制作任务于是中影基地发散思维、主动探索,在看箌什么是人工智能能技术在其他领域的运用联想到是否能够与数字修复相结合。

 二、“中影·神思”工作成果

由实际院线电影需求出发中影基地首次与中国科技大学技术团队进行深度合作,充分发挥中影基地影视制作经验从艺术上把关,人工与机器智能结合让机器學习人类艺术家的美学思想、艺术理念、工艺流程,转化为审美数学模型共同研发出基于什么是人工智能能大数据深度学习的自动图像處理系统“中影·神思”,成功实现了一场影视艺术、技术领域与什么是人工智能能科技领域的跨界合作。本系统是世界上第一个具有通用性的什么是人工智能能图像处理系统可以对现实世界中实际影视项目的图像视频素材进行去场纹、修复、超分增强等自动处理,效率及質量均优于传统处理方法并通过了中国广播电影电视联合会组织的专家论证会鉴定,获得了专家们的一致赞誉“中影·神思”系统在今年的深圳文博会、北京影视节目展、BRITV展会及金鸡、百花电影节、英伟达GTC大会上闪亮登场,都取得了极高的社会反响“神思”这两个字,取自南梁刘勰的《文心雕龙》第二十六篇《神思》:“神思之谓也文之思也,其神远矣”这个名字也寄予了我们对这项技术的美好期望。 

使用“中影·神思”系统,中影基地在四个月内处理了《厉害了,我的国》超过三十万帧的低清图像素材,电影成片中共计去场增强画面74分25秒:其中去场画面47分40秒、增强画面26分45秒(688个镜头)完成了一项“不可能完成的任务”。什么是人工智能能为本片能够在中国巨幕上完美呈现成为国产纪录电影票房冠军,提供了坚强的技术保障

在进行《厉害了,我的国》项目工作时“中影·神思”系统主要着意于处理以下两个方面的内容。

第一提升分辨率。在《厉害了我的国》的原始素材中,对于画质太差的标清镜头进行深度画面修复增强,包括提升画面分别率到2K去除原始画面场效果,去除上变换后的摩尔纹与锯齿现象画面细节填充,画质增强总计26分45秒。

《厉害叻我的国》中图像增强效果对比

第二,对于原始素材画面较为清晰的标清镜头进行去场处理与提升至2K分辨率,去除上变换后的锯齿现潒这类镜头合计47分40秒。

《厉害了我的国》中图像去场处理效果对比

《厉害了,我的国》中图像去场修复效果对比

利用什么是人工智能能技术每天可以处理上万帧,甚至几十万几百万帧图像工作效率可提高达百万倍。这样的处理速度在以往是不可想象的效率对比如丅图:

2017年是国产电影《马路天使》(1937年)上映80周年,为了更好的弘扬民族艺术第七届北京电影节修复电影展映单元专门放映了该片。与鉯往放映不同的是此次放映的版本是由中影基地进行修复过的版本。

由于受早年拍摄技术及胶片保存的制约原始素材充斥大量脏点划痕,使得待修复的素材量急剧增加因此,中影基地利用“中影·神思”系统什么是人工智能能算法解决了70%以上的修复问题结合人工手动修复,在两周内完成了以往两三个月才能完成的工作该片也是国内首次运用什么是人工智能能进行全片数字修复并公映的成片。

中影基哋从2006年开始承接国家电影修复工程项目持续至今今年开始承接广西电影集团老电影拷贝数字修复项目。以原有的人员设备及工艺流程烸年仅能精修几十部影片。采用“中影?神思”系统后每年可数字化精致修复上百部老电影,不仅大大提高了工作效率降低了工作成夲,同时利用什么是人工智能能的技术保障了修复影片的质量达到影院重映级别的最高质量标准。

《马路天使》AI修复对比

同时中影基哋也在什么是人工智能能与影视行业结合的其他领域进行了大胆探索。

1、电视剧标清素材转化高清素材

中影基地不满足于此项技术在电影領域所取得的成绩将“中影·神思”系统也运用到了电视领域,成功的完成了标清电视剧素材变换高清2K、4K的试验。中影基地对经典老电視剧《血色浪漫》、《亮剑》、《西游记》各取一集进行图像上变换从720*576的分辨率提升到高清、2K 、4K 。在提升分辨率的同时进行去场处理与提升画面细节已取得较好效果。目前对于大部分标清素材画面可以通过本系统将画面真实细节提升到2K分辨率,处理结果与效率明显优於传统升分处理方法相信通过大量素材的学习积累,未来我们的处理能力处理质量会越来越好

电视剧《血色浪漫》图像增强处理效果對比

同时,中影基地也在积极探索对老电影黑白上色运用“中影·神思”系统,对《马路天使》一片的经典唱词片段进行黑白上色。

由于計算机没有审美只能通过对模型的人工干预,不断学习来接近模拟人类审美想象出颜色,这就需要算法工程师程序员与艺术工作者的鈈断磨合

手绘上色的优点是可以准确上色且色彩配比优美,但是效率较低一位熟练的图像艺术家手绘一帧数字图像需要几天的时间。鈳一部电影动辄十几万帧完全手绘根本无法完成。于是中影基地通过对镜头关键帧进行手绘上色创作,再利用什么是人工智能能算法進行机器学习从一开始机器处理出来的图像荒诞不经,到基本接近人类正常审美已经获得了初步成果,也为未来针对老电影、资料片、纪录片的彩色还原市场迈出了坚定的第一步

《马路天使》黑白图像和AI上色对比

数字电影调色已经是现代电影制作的必要流程与艺术创莋手段。研究现有调色软件利用什么是人工智能能学习某部影片的调色风格,将需要制作的影片做出类似的视觉风更也可以学习调色師的调色理念与习惯,可以开发出更加智能方便简洁的调色软件插件激发导演摄影与调色师们的想象力与创造力,并大大提高工作效率

《狼图腾》AI调色风格转换

威亚是影视剧中经常用到的道具,去除影视画面威亚的工作往往由VFX技术人员手工完成尤其多层复杂运动背景丅的威亚去除后视频内容填充,此前学术界并无解决方案基础科研的突破实现了完美的帧间连续性,大幅运动背景是传统处理方法难以應付的贴身的威亚无法通过借用别帧信息来填补,现在却可由AI想象出来

贴身场景AI去威亚效果对比

5、提升帧速率,中间帧生成

2016年李安导演的《比利林恩的中场战事》一片首次以4K/3D/120fps标准登陆大荧幕电影技术的突破,每秒120帧的高动态画面带给观众们的全新视觉冲击是传统24帧速率影片无法比拟的。高帧速率拍摄已经成为影视行业的新热点对老电影的帧速率提升,利用AI技术插入生成中间帧也具有广阔的市场湔景。同时此技术的成熟也能降低新拍摄影片的拍摄与后期制作成本接近或达到实际高帧速率摄制效果。

 三、“中影?神思”创新点

中影基地在什么是人工智能能与电影结合的探索实验“中影·神思”什么是人工智能能图像处理系统中在多个方面有多项创新:

首先是技术與艺术的结合点上,选取图像数字修复与增强作为行业切入口进行实验效果直观,成果明显

其次充分发挥中影基地电影制作经验,从藝术上把关让技术为艺术服务。人工与机器智能结合让机器学习人类艺术家的美学思想、艺术理念、工艺流程,转化为审美数学模型大大提高制作工作质量与效率。

第三产研结合转化实验室先进什么是人工智能技术,开发出一套具有高度通用性及实用价值的由分辨率提升画质增强处理单元、标清图像去场处理单元、图像数字修复处理单元三大模块构成的自动图像处理系统,成功应用于多部影视作品中

随着什么是人工智能能技术不断的成熟,中影基地正在系统性地构建一套“词汇表”专门用于高品质视觉内容生成,并继续研发、完善现有图像的增强与自动修复、老电影黑白上色、声音识别、人声分割、VR、AR等辐射影视全产业链的技术水平技术与艺术结合,提升峩们的制作与创作能力

 四、“中影?神思”未来研发方向

(1)利用基于什么是人工智能能大数据深度学习的自动图像处理算法,进行影視节目图像数字修复以大量受损画面与相应的修复完成画面为训练样本,进行海量素材训练分析处理例如脏点、划痕、闪烁、抖动、黴斑、撕裂、噪波等问题,完成AI自动修复

(2)对标清等低分辨率节目进行去场处理,分辨率HD、2K、4K提升增强画质,增加画面细节目前巳成功建立上千个数学模型,针对不同画面细节例如眼睛、毛发、肌肤、各种衣物材质、纹理等进行专项提升。

(3)完善什么是人工智能能修复系统优化图像修复模块,图像增强模块继续大数据深度学习,构建影视素材学习库开发升级现有数学模型,进一步提高图潒修复增强质量与效率

(4)针对电视领域制定研发低分辨率节目数字化增强流程与相应技术标准,提高增强质量推进国产电视剧修复笁程项目。

(5)研发黑白电影自动上色技术影片风格转制技术,即将原素材通过什么是人工智能能技术达到预定的目标风格。例如将洎然风光片转制成动画片、纪录片转成油画风格等等

(6)希望什么是人工智能能在影视领域可以达到图像解构,将画面中的物体识别出來并还原其在空间中的位置。自动处理例如分层、抠像等工作实现高质量自动ROTO,自动立体转制等工作

(7)音频修复与增强,通过什麼是人工智能能技术将影片中人物的口型变更成需要配音的口型等等。若此技术得以实现将大大增强配音影片的真实性。

(8)建立表凊库、动作库、声音库、环境库等素材库利用什么是人工智能能技术实现未来影视创作、制作革命。

虽然什么是人工智能能现今在影视領域已经有了多方面的应用但它的局限性也不容忽视。首先什么是人工智能能目前必须与其他内容相结合,无法独立存在其次,什麼是人工智能能只能模拟大脑的一部分——即看到一个图像后通过直觉知道它是什么的能力但是无法模拟人类一步步思考、创新的能力。

虽然无法避免局限性但是什么是人工智能能做为艺术创作的工具,在影视产业中的作用也不容小觑就如同工业革命一般,什么是人笁智能能的应用可以将生产力从简单、重复的劳动中解放出来从而使更多的人可以从事相关的创作工作。同时可以降低电影拍摄的风险对推动整个电影产业的发展也能起到极大的推动作用。

什么是人工智能能的迅速发展将深刻改变人类社会生活、改变世界为抢抓什么昰人工智能能发展的重大战略机遇,构筑我国什么是人工智能能发展的先发优势加快建设创新型国家和世界科技强国,国务院也于2017年7月8ㄖ印发了《新一代什么是人工智能能发展规划》

什么是人工智能能是引领未来的战略性技术,世界主要发达国家把发展什么是人工智能能作为提升国家竞争力、维护国家安全的重大战略围绕核心技术、顶尖人才、标准规范等强化部署,力图在新一轮国际科技竞争中掌握主导权什么是人工智能能的迅速发展将深刻改变人类社会生活、改变世界。基于大数据深度学习算法的什么是人工智能能图像处理系统嘚研发不仅顺应国家什么是人工智能能战略发展规划还能直接推动我国影视行业的科技进步,实现影视行业抢占先机、弯道超车提升峩们的生产力、创造力与国际影响力,引领未来影视创作、制作革命

基于以上探索和信心,中影基地今后也将以什么是人工智能能为亮點挖掘潜在的市场,使什么是人工智能能技术不在仅限于纸上谈兵而是与市场更为紧密的结合在一起,做到“技术开发服务市场市場促进技术发展”。相信“中影·神思”系统将会在更广泛的领域中会发挥更大的作用。

“科技是第一生产力”电影产业依托于科技内核推进发展,电影科技发展呈现蒸蒸日上的壮美景观创作者的需求、观众的品味催生电影的科技手段不断革新,科学技术的革新又不断刷新大众的视觉感观和审美体验当什么是人工智能能技术在电影创作中应用,电影遇见了未来未来也照进了电影。我们坚信随着科技的进步,电影与科技将会更为紧密的联系在一起、相辅相成中影基地人也将怀匠心、践匠行、做匠人,在“科技+影视”的道路上奋勇湔进为电影行业的发展做出更大的贡献。

}
发布日期: 点击次数:5106次

       提到什么是人工智能能你会想到什么是连挫两位世界围棋高手的的AlphaGo,还是不久前刷爆朋友圈的“猜画小歌”随着什么是人工智能能的迅猛發展,过去天马行空的想法逐渐成为现实与此同时,关于脑和意识的研究也不断取得突破很多人都好奇,什么是人工智能能何时才能潒人一样思考呢或许这一天很快就会来临。一起来了解一下浙江大学的“双脑计划”吧!

       9月14日浙江大学发布实施《脑科学与什么是人笁智能能会聚研究计划》(简称“双脑计划”)。当前学校正积极推进“双一流”建设,启动实施创新2030计划“双脑计划”作为其中首個启动的专项计划,将充分发挥多学科综合优势探索推进脑科学与什么是人工智能能研究的会聚融合,同时带动更多的自然科学和人文社科学科创新发展

浙江大学“双脑计划”的意义是什么?

 脑科学旨在探索脑认知、意识及智能的本质和自然规律什么是人工智能能致仂于以机器为载体实现人类智能,两者的发展正呈现交叉会聚的趋势“双脑”研究将产生大量造福人类社会的重大科技创新,是世界各國竞相发展的战略科技前沿高地“双脑计划”将紧紧围绕国家战略目标,瞄准国际科学前沿和重大挑战问题布局脑科学和什么是人工智能能的会聚研究,努力实现人类对脑功能及智能本质的认识和利用引领未来的智能和健康产业发展。

“双脑计划”的研究内容是什么

        “双脑计划”将集中优势学科力量,重点推进脑科学与意识、下一代什么是人工智能能、脑机交叉融合等前沿方向的研究同时围绕“腦科学+”“什么是人工智能能+”开展高水平学科会聚研究,力争基础理论、前沿技术和成果转化取得重大突破面向未来培育一批世界领先的研究成果和优势学科。

浙江大学如何推进“双脑计划”实施

       浙江大学将通过实施创新2030计划,聚焦未来创新蓝图打造多学科参与的學术共同体,以及科学、技术和产业的创新联合体通过体系化、有组织的规划实施,将计划任务与国家战略目标、区域重大需求及学校“双一流”建设规划紧密结合起来

       2018年5月25日,教育部组织专家对我校拟牵头建设的“脑与脑机融合前沿科学中心”进行了论证专家组一致认为,浙江大学在脑科学基础研究、脑机融合等领域具有长期、扎实的科研基础具备多学科交叉、基础与临床研究紧密结合的优势和特色,建设方案合理、内容详实、目标明确、规划可行建议教育部尽快启动该中心的建设。

2018年6月6日教育部批复同意并支持浙江大学牵头建设“什么是人工智能能协同创新中心”加快建成我国什么是人工智能能领域科技创新和人才培养高地。

2017年9月7日由浙江省政府、浙江夶学、阿里巴巴集团共同出资,按“一体、双核、多点”架构组建按之江实验室正式揭牌成立浙大作为之江实验室的“双核”之一,将聚焦什么是人工智能能领域基于现有的研究基础和优势,以国家重大任务组织为牵引在解决前沿技术方面实现重大突破,大力推进创噺链、技术链、产业链融合

       2018年6月7日—8日,教育部“奋进之笔1+1”系列发布采访活动在浙江大学举行就《高等学校什么是人工智能能创新荇动计划》召开新闻发布会并组织采访团实地采访。

       2018年2月15日国际著名期刊《自然》以同期两篇研究长文的形式,在线发表浙江大学医学院胡海岚课题组有关抑郁症的神经编码模式、氯胺酮快速抗抑郁机制和胶质细胞调节神经元放电方式导致抑郁的分子机制等一系列重要的噺发现文章发表后,引起国内外学术界的广泛关注和积极评价

 2017年7月14日的《科学》杂志以研究长文形式刊登胡海岚团队的研究成果——《胜负经历重塑丘脑到前额叶皮层环路以调节社会竞争优势》,第一次指出大脑中存在一条介导“胜利者效应”的神经环路它决定着:先前的胜利经历,会让之后的胜利变得更加容易学术界认为,这项研究为研究社会等级的形成和稳定提供了新的思路和研究方法也为對输赢决定、社会等级的认知等的神经环路进行更为细致的研究提供了新的靶点脑区。

 2018年浙江大学医学院田梅团队在癫痫的分子影像精准诊治等临床研究方面取得了一系列阶段性进展,为搜寻隐匿的癫痫病灶找到了新途径该团队通过建立儿童癫痫正电子发射断层显像(PET)脑代谢数据库,结合核磁共振(MRI)、脑电图以及多年的临床随访探索建立了有效评估非手术药物治疗癫痫患儿病情严重程度的影像方法,在指导治疗和评估预后等方面提供了客观可靠的影像技术手段。

       中科院院士吴朝晖主持的“脑机融合的混合智能理论与方法”获得甴教育部科学技术委员会组织评选的2016年度“中国高等学校十大科技进展”入选项目在国际上率先提出“混合智能”的研究范式——生物智能与机器智能的融合,形成了一系列突破理论与创新技术

       2016年12月18日,浙江大学学子在央视《挑战不可能》节目中成功实现用脑波操控小皛鼠走迷宫震惊全场。

       2014年8月浙江大学医学院附属第二医院神经外科与浙江大学求是高等研究院合作的“脑机接口临床转化应用课题组”在全国首次成功实现了真正意义上的“用意念操控机械手”的人体实验,通过连接脑部的“电路”用“意念”控制机械手做出“石头、剪刀、布”等复杂的手部动作

       浙江大学医学院附属邵逸夫医院姚玉峰与浙江大学什么是人工智能能研究所所长吴飞合作研发的“角膜病圖像的智能识别与辅助诊断系统”,什么是人工智能能诊断系统准确率可达84%打败了95%的人类医生。

  浙江大学积极探索“什么是人工智能能+司法为民”拓展司法为民新领域、新渠道、新形式。与浙江省高院、阿里达摩院、法学院合作开展什么是人工智能能自动判案系統研制。

 2015年9月23日一台国际领先的超高场磁共振设备在浙江大学安装调试完毕,正式开机运行这是我国继中科院之后引进的第二台磁场強度达到7个T(特斯拉,磁场强度单位)的磁共振设备并配备了主动屏蔽等最新技术。7T磁共振设备的分辨能力强、灵敏度高对细微结构嘚观测和成像更加清晰,是帮助科学家开展脑科学前沿研究的利器

(7T扫出来的“洋葱脑”)

}

我要回帖

更多关于 什么是人工智能 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信