中国科学院孵化企业、智能芯片设计公司寒武纪科技5月3日在上海发布了新一代云端人工智能芯片和板卡产品Cambricon MLU100、寒武纪1M终端智能处理器IP产品,使我国人工智能芯片的种类更加丰富、功能更加强大。
1.实力更强的寒武纪家族新品
寒武纪公司创始人兼CEO陈天石介绍,MLU100采用寒武纪最新的MLUv01架构和TSMC 16纳米的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算。
虽然运算速度快,但它的能耗却很低——典型板级功耗仅为80瓦,峰值功耗不超过110瓦。这款芯片还具有优良的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下的云端智能处理需求。
寒武纪1M则是该公司的第三代IP产品,在TSMC 7纳米工艺下8位运算的效能比可达5Tops/watt(每瓦5万亿次运算)。它能够提供三种规模的处理器核(2Tops/4Tops/8Tops),可以满足不同应用场景下不同量级的智能处理需求,并可通过多核互联进一步提高性能。
寒武纪系列智能芯片是基于中国科学院相关基础研究设计成功,并实现产业化。2016年、2017年,寒武纪曾发布终端系列芯片。此次发布的云端芯片不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪系列终端芯片完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。
2.人工智能的“专门武器”
说到智能芯片,大家往往有个疑问:它和传统的中央处理器(CPU)能否互相替代?中国科学院计算研究所研究员、寒武纪芯片发明人之一陈云霁解答:“打过游戏的人可能都知道,要有出色的游戏体验,不仅要求计算机的CPU要好,显卡也要好。智能芯片和CPU的关系与此类似。”
CPU“就像是能做任何工作的通用工具”,在运算、控制等方面它的作用无法替代。智能芯片“就像是高效率的专用工具”,能为视觉、语音、自然语言处理以及各类经典的机器学习任务提供灵活高效的计算平台,能极大提升计算效率、降低能耗。
与传统的芯片相比,智能芯片往往有不同的设计理念和计算模式。CPU的基本操作是算术操作和逻辑操作,一般需要数百甚至上千条指令才能完成相当于人类一个神经元的处理。寒武纪系列芯片采用电脑语“DianNaoYu”,模拟大脑的神经元和突触,下达一条指令即可完成一组神经元的处理。
因此,智能芯片虽然无法替代CPU,但大家在使用嵌入智能芯片的设备时,例如智能手机、无人机、智能摄像头、智能驾驶等,会明显感觉更流畅、更省电。例如,寒武纪第一代终端智能处理器IP产品——寒武纪1A,就被应用在华为Mate10等型号的手机上。
3.形成基于寒武纪智能芯片的产业生态
这不仅是一次新产品的发布。发布会上,联想集团、中科曙光、科大讯飞都推出了基于这款智能芯片的应用方案——这说明基于寒武纪系列芯片的产业生态正在形成。
计算产业几十年来的发展历程说明,如果没有上下游的良性生态,再出色的硬件产品也只有死路一条。而寒武纪系列芯片在开发之初,就在积极探索形成良好的产业形态。
今天,联想集团发布了基于Cambricon MLU100智能处理卡的云端智能服务器ThinkSystem SR650,打破了37项服务器基准测试的世界纪录,将全面支撑联想客户在机器学习、虚拟化、数据库等方向上的业务需求。
中科曙光不仅推出了基于Cambricon MLU100智能处理卡的服务器产品,还披露将开发人工智能管理平台Sothis AI,可以与寒武纪系列芯片及其开发环境实现无缝对接、深度融合。
科大讯飞执行总裁胡郁介绍,应用寒武纪的智能处理器后,科大讯飞语音智能产品的能耗效率领先同类产品5倍以上。同时,安装了寒武纪智能处理器的手机本地端,语音本地识别准确率相对于传统处理器提高了9.8%,显著改善了用户体验。
陈天石说:“寒武纪创立的初衷就是要让全世界都能用上智能处理器。我们将秉承学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享寒武纪最新的技术成果,使全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。”
(本报上海5月3日电 本报记者 齐芳)