处理器与芯片 电脑芯片和处理器

本文原载于《环球科学》2016年9月号 。
如果AlphaGo采用寒武纪处理器的架构,只需要一台个人电脑大小的主机,就可以运行起来,而且运行速度应该会更快 。
《环球科学》采访人员 廖红艳
如何能让一张普通的图片具有艺术性呢?现在,借助一款应用了人工智能算法的手机修图软件 Pri***a,你可以将任何照片变成名画风格(比如梵高、莫奈、毕加索或宫崎骏风格),且极具艺术品质 。连俄罗斯总理梅德韦杰夫都忍不住在社交网站上晒出了一张用Pri***a处理过的、有着浓郁铅笔画风格的风景照——滤镜里的莫斯科夜晚 。
与普通滤镜不同,Pri***a采用深度学习算法,能够利用复杂的人工神经网络,抽象出给定绘画作品里一些高级的隐藏特征,学习画家的绘画风格,再把这个风格“智能”地应用到一张新图片上,是排名款人工智能的平民化应用 。不过,美中不足的是,因为人工智能算法计算量极大,用户需要把照片发送到远程的服务器,几十秒后才能看到预览效果 。
人工智能算法运算量到底有多大?想像一下,同样采用了人工智能算法的AlphaGo,需要用到上千块传统处理器(CPU)和上百块图形处理器(GPU) 。

处理器与芯片 电脑芯片和处理器

文章插图
很显然,在人工智能迎来新一波复兴的今天,传统处理器正成为阻碍人工智能普及的瓶颈 。如果没有一款专门为神经网络设计的芯片,既高效、低耗、体积小,还能够嵌入智能终端设备,我们就无法与人工智能真正“亲密接触” 。好消息是,今年3月,一家刚刚成立的芯片设计公司——寒武纪公司(中国科学院计算技术研究所下属的产业化公司),已经发布了世界上排名款神经网络处理器指令集(Cambricon),而且正走在商业化的路上 。
处理器与芯片 电脑芯片和处理器

文章插图
值得一提的是,寒武纪公司的首席执行官陈天石和首席科学家陈云霁,是一对亲兄弟 。哥哥陈云霁是计算机体系结构专家,弟弟陈天石是人工智能专家 。兄弟两人的合作始于用人工智能技术支持通用处理器的研发,而后又转向用处理器技术来支持人工智能的发展 。
2014年,陈天石、陈云霁与法国信息与自动化研究所(INRIA)的奥利维耶·泰蒙(Olivier Temam)博士共同发表的学术论文《DianNao:一种小尺度的高吞吐率机器学习加速器》(DianNao: A ***all-Footprint High-Throughput Accelerator for Ubiquitous Machine-Learning ),获得了ASPLOS(Architectural Support for Programming Languages and Operating Systems,编程语言和操作系统的体系结构支持)国际会议较佳论文,吸引了国际同行的目光 。随后发表的几篇论文,更是奠定了他们在神经网络处理器这个领域的国际领跑地位 。
展开全文
传统处理器指令集是为进行通用计算发展起来的,基本操作为算术运算和逻辑运算 。而深度学习算法,基本操作是对人工神经网络中的虚拟神经元和突触进行处理 。作为一款神经网络处理器,寒武纪处理器指令集的一条指令即可完成多个神经元的并行处理,而传统处理器需要数百甚至上千条指令才能完成一个神经元的处理 。这也就解释了,为什么传统处理器运行深度学习算法时效率会如此低下 。
“如果把深度学习看作切肉,传统的处理器就是瑞士军刀,我们的专用神经网络处理器则相当于菜刀 。瑞士军刀通用性很好,什么都可以干,但干得不快,菜刀是专门用来切菜的,在切肉这件事情上,效率当然更高,”接受《环球科学》采访时,寒武纪公司首席执行官陈天石形象地比喻,“在运行人工智能算法方面,寒武纪处理器比通用处理器好百倍到千倍,如果AlphaGo采用寒武纪处理器的架构,只需要一台个人电脑大小的主机,就可以运行起来,而且运行速度应该会更快” 。