从2017年7月15日到2018年8月16日,经历397个日夜,云天励飞深度学习神经网络处理器DeepEye1000终于一次性流片成功,回片(试生产)一个星期,跑通人脸识别算法全链路;回片一个月,跑通人脸识别业务完整demo;回片两个月,跑通100万人像搜索,4K-200人抓拍识别全功能。
云天励飞的身上一直有很多标签:海归,孔雀计划,人工智能,算法……11月13日,云天励飞又添一枚新标签:芯片。其在“深圳第一展”高交会的第一天,正式发布了一款5AIoT芯片。
为什么从流片到发布要相隔13个月?作为一家以算法系统见长的AI公司,为何要花大成本、苦功夫造芯?这背后有什么故事?
造芯:迟来13个月的芯片
“我们今天就来挑战对传统芯片的理解。”
11月13日,身着黑色T恤和牛仔裤的云天励飞创始人兼CEO陈宁一开场就抛出一个听起来有些“惊世骇俗”的观点,语气间,他加重了对“挑战”二字的强调。
当天,云天励飞在深圳高交会期间,正式发布了自主可控的神经网络处理器芯片——云天初芯DeepEye1000。这颗芯片不是一个纯AI算力的芯片,而是满足边缘计算的SoC芯片。
芯片,云天励飞喻其为“城市大脑的AI触角”。
本次发布的面向AIoT领域的“云天初芯”DeepEye1000是一款面向边缘和端侧视觉应用的AI芯片。内置四核神经网络处理器,采用存算融合体系架构和可重构计算阵列,可以灵活、高效的执行各种深度学习算法模型的推理计算,峰值算力达2.0Tops。
在CPU方面,“云天初芯”DeepEye1000采用阿里平头哥玄铁810嵌入式处理器。此外该芯片还采用了双核视觉DSP处理器,内置硬件加速运算子ACC,支持超过20个高效算子,每秒可跟踪1200张人脸。DeepEye1000的视频处理能力,可支持4K@30fps视频、4路高清视频并行的实时分析。
单纯从神经网络处理器角度的出发,在相同条件下,经过测算,云天励飞的第二代深度学习神经网络处理器NNP和华为海思的NNIE相比,在性能上提供了十倍以上的IPS,单位模型处理性能的平均带宽需求降低40%,单位模型处理性能下的平均成本降低60%。
值得一提的是,这颗芯片背后的160多条指令,是基于人工智能神经网络和未来三年框架发展趋势,由算法团队和芯片团队跨界创新的成果。
自主可控的神经网络处理器芯片——云天初芯DeepEye1000
对于云端芯片来说,强大的算力是最重要的。而对于端和边缘侧芯片,面对海量的终端,云天励飞副总裁兼芯片产品线负责人李爱军认为,最重要的特点是高性能和低成本。
从高性能上看,云天励飞的异构架构有着分布式、可重构的特点,可以实现实时动态任务调度和智能高效的存储,这种架构保证了性能大幅度的提升。经过测算,和通用GPU相比,该芯片单位性能提升20倍,单位能效提高100倍,系统时延降低200倍。
其中,最为关键的秘诀是“数据复用”。主要体现为云天励飞的算法映射到处理器上时,输入数据的复用和内部执行数据的复用。这会在带宽、成本上明显体现出来。
从低成本上看,这颗芯片售价为10美金。团队深刻地记得,2012年,云天励飞还在草创阶段的时候,英伟达送了几片芯片给硅谷的团队做研发支持,那个时候一片GPU的价格为4000美金。眨眼7年后,芯片的价格已经有很强的市场竞争力了。
实际上,这款5AIoT芯片于2018年8月投片,10月流片回来并测试成功,为何此时才召开发布会?在从流片到正式发布的这13个月里,云天励飞干什么去了呢?
免费芯:算法公司创新商业模式
在这13个月里,云天励飞做了一件事:围绕这颗面向边缘的AI芯片,完善了从端到云的开发服务能力。让合作伙伴有能力在一个月时间内,基于云天的芯片和云端的服务“从无到有”开发出一款产品。他们把这称之为“1-1-1-1计划”,又叫“双十一计划”。
“1-1-1-1”四个“1”分别指代:一周完成硬件,一周适配算法,一周对接服务,一个月具备完整AI产品的能力。
也就是说,有了云天励飞提供的芯片和模组,一周时间用来组装硬件;一周的时间用来适配算法,在硬件上跑好业务逻辑;还有一周的时间用来对接云天的SIK,满足所有业务接口的需要;最后再用一个月的时间,把端和云端的能力打造好。
“不是出来一个芯片就要开发布会,我们在意的,是要让芯片有服务的功能。过去13个月,云天励飞就是在打造端云协同的AI生态。”李爱军说。
云天励飞副总裁兼芯片产品线负责人 李爱军
那么,“双十一”是否意味着只适用于小型公司,方便他们敏捷接入AI能力?李爱军认为并非如此,因为双十一计划覆盖“芯片-模组-主板-硬件-算法-软件-云服务”全链条,大小公司可以从链条的每一处接入这个业务生态:小公司可能倾向于从算法乃至以后的节点接入,工作量很小;中大型企业可能会从链条前端的节点,比如芯片层就购买云天励飞的方案,在此技术上自研算法。如无意外,越能从链条前端接入的公司,本身研发能力就越强。
有了成果,当然要有评测标准。在当下,我们需要用什么标准去看待一颗AI芯片?传统的观点是纯粹的算力,云天励飞认为是针对特定场景发挥出来的有效算力。
“我们今天就来挑战对传统芯片的理解。”云天励飞创始人兼CEO陈宁加重了对“挑战”二字的强调。
“我们认为人工智能时代不应该单纯追求算力,因为算力不等于有效算力。人类尚未进入通用人工智能时代,更不存在通用AI芯片。所以说,今天的AI芯片,是面向场景的AI芯片。有效算力是更有价值的技术指标。”陈宁提出。
有了芯片之后,需要有好的算法才能发挥出最大的功效。云天励飞的算法平台叫“ARCTERN”。
AECTERN在英文中指代一种来自北极的燕鸥,极其轻快,准确,狠厉,这也是他们对算法平台的期冀。AECTERN自带100种以上的算法,支持30余种场景,跨平台SDK即插即用。
云天励飞作为一个以算法系统和场景能力见长的公司,做芯片,是一种扩张。这一次进击,对云天励飞来说是一个全新而陌生的挑战。
如果把AI掰开,有三个重要因素影响AI进程:
第一是芯片,投入太大;
第二是算法。算法也需要大量的人力投入,而我国过去AI产业的积累不深厚,导致AI算法人才“物以稀为贵”。2012年的硅谷,一个算法人员年薪可达40万美金;
第三是云服务,因为云服务需要大数据和架构人才。
有了数据、算法和芯片,以及过去几年对业务的理解。云天励飞提出了“芯片及服务”(C²aaS,Chip x Cloud-as-a-Service)。从芯片到云端,提供一体化AI赋能服务。
这个看似复杂的公式,传递出一个信号:芯片免费,服务收费。
时间回到2018年,云天励飞一传出造芯消息,就在业界喊出“免费”的口号。既然是免费,也就说明云天励飞一开始就没想挣硬件的钱,而是将芯片打包在解决方案里面,这个解决方案因为芯片和算法的适配,在场景落地能力上更强。
就像华为卖手机,从来不会去向消费者再收一笔什么“芯片钱”,但毫无疑问,能卖出更高价的手机,和海思芯片的能力是分不开的。
最后芯片的成本由谁来买单,羊毛出在羊身上,结果还是显而易见的。
但这不代表这种探索就是没有意义的,因为比产品更大的格局是服务。
“芯片不是一个行业,结果一定是芯片改造各行各业。如何改造呢?一定是以体验嘛。”李爱军指出“芯片即服务”的实现路径,技术走向体验为王。
场景:先懂场景再造芯
云天励飞2014年落户深圳龙岗区,2015入选深圳市孔雀计划团队。
然而,令很多人没想到的是,云天励飞当时承揽的孔雀计划项目就是关乎AI芯片研发的。随着云天初芯DeepEye1000正式流片及发布,四年后,该项目也画上圆满句号。
从2014年到2019年,从研发投入上看,云天励飞为AI产业化投入超过一亿美金,为客户创造结构化数据有300亿条。云天励飞称,将过去知识和经验都放在这个只有指甲盖大小,遍布9亿晶体管的AI芯片上。
但在外界看来,云天励飞一直以算法系统和应用见长。为什么云天励飞一开始就不直接冲着AI芯片去呢?
“因为我们想做的不是单纯的芯片,而是面向场景的芯片。所以第一步我们想要做到数据、算法和应用能够真正和场景结合,打造一套业务系统之后,用业务定义芯片,反哺场景。这就是我们花了3年的时间才推出芯片的原因。”
也就是说,云天励飞是先落地再做芯片,而不是“拿着锤子找钉子”,先做芯片再去找落地。
本次发布的云天初芯DeepEye1000面向八大场景,分别是:智能安防、新商业、智慧交通、智能制造、智慧仓储、智能家居、机器人和智能超算。针对不同场景和生态,云天励飞提出“星云计划”。携手海康威视、优必选科技、深圳超算中心、阿里巴巴平头哥、TCL、京东、深圳巴士集团、迈德威视等8家首批合作伙伴,在可探索的领域寻找合作机会,加速AI向产业渗透。
DeepEye1000的视频处理能力,可支持4路高清视频并行的实时分析
智慧安防和新商业是云天励飞积累最深厚的两个行业。而这次发布的八大场景中,能看到城市治理、机器人、智能家居甚至是超算的身影。
对于超算芯片,李爱军表示:“我们目前还在起步阶段,但不排除未来会做云端芯片。”
“我相信云天励飞不是筹钱最多的,也不是花钱最多的,但却是落地最扎实的。其实今天AI的刚需说到底还是安防拉动的,自动驾驶固然是很好,但是路还很长。”IC设计公司芯原微电子董事长戴伟民如此评价云天励飞。
发布会结束当天,云天励飞临时组织了一场媒体交流会。
会上,云天励飞CEO陈宁说:“价值不在于芯片本身,而在于我们对行业的快速、深度的理解和服务。未来各类场景的界限也将不再泾渭分明,核心是对采集到的数据进行智能化的分析。”
陈宁还介绍,云天励飞从创业之初就是以“算法+大数据+芯片”独特的商业模式起家的。不得不说,云天励飞这三架马车的商业模式,似是独创,但又令人感到熟悉。
竞争:算法公司为何纷纷跨界做芯片?
进入2018年以后,人工智能界感受到了风向正在发生微妙的变化:不仅是云天励飞,算法公司跨界“造芯”,这是之前从来没有出现过的景象。
云知声面向IoT的雨燕、出门问问的语音芯片模组问芯Mobvoi A1、思必驰推出语音芯片深聪TAIHANG,依图科技推出深度学习云端定制芯片“QuestCore™”(求索)、Rokid发布SoC芯片KAMINO18……
有人开始揣测算法公司造芯的真正原因,众说纷纭。李爱军认为有三个原因:
人工智能大爆发时代,连入网络的智能终端有了指数级的增长,未来五到十年,人所拥有或使用的智能设备数量会增长30-50倍。这背后需要一系列基于AI全新架构的超低功耗、超低成本的芯片实现技术驱动。这是不可逆的产业化大背景。
另外,从过去几年可以看到,单纯卖芯片是非常难的事情。从芯片的逻辑来说,数量绝对一切,没有数量就是亏本买卖。为什么推不动?因为单纯卖芯片的道路走不通,必须得用服务来加速这个过程。
第三,单纯的算法很难体现出算法公司的竞争力,并且随着时间的推移,算法的竞争力会越来越低,不足以支撑未来的成长,需要寻找一个新载体,芯片就是最好的载体。
李爱军预测,算法的红利期从2012年左右开始,到现在已经有7年时间了,预计未来2-3年间窗口就会关闭。而算法+芯片,才处于起步阶段,未来起码还有5年以上的发展空间。
“业界越来越认识到算法和芯片结合所带来的价值。而这是传统的芯片公司——至少现在看起来不容易突破的,这也是我们相信未来云天励飞有能力在洗牌期存活下来的原因。”
洗牌期一触即发,也许诸如华为、腾讯、阿里等传统ICT巨头和互联网企业真正发力之时,就是新一轮洗刷开始之日。目前,这些公司还徘徊在门外没有完全进入,但人工智能是下一个时代的百年机遇,大公司岂容贻误战机?在此之前,初创公司必须抓紧打磨战刀,自备粮草。
既然对于芯片来说,数量决定一切。为什么云天励飞还要瞄准B端和G端市场,而不是针对广大消费者用户的C端市场?
李爱军认为首先是云天励飞的历史业务使然,其次视觉市场有其特殊性,对于视觉智能终端来说,B端市场更占据优势。
如何保证芯片销量和和利润的稳定?本次芯片的预期发货量是多少?李爱军将业绩划分为两块,一块是存量市场,预估是十万片的出货量。而对于未来的产业合作,预计是百万片的出货量。
“对于业绩,我个人还是蛮有信心的,未来收入将不亚于纯造芯的企业。”李爱军说。
未来:芯片是差异化战略武器
回顾造芯的三年准备期,研发的397个日夜,李爱军用“踏实与激情并在”作为总结。他说:“造芯总体上是一个枯燥的过程,踏实体现在我们将芯片一步步推向市场并接受检验,激情在于我们今年相继获得了国家三部委的课题。”
这三部委课题,分别是国家科技部、国家发改委和工信部的项目。这也是李爱军获得“幕后英雄”称号的出处。
年初,云天励飞才了解到科技部的“新一代人工智能重大专项”,这个项目需要找合作伙伴一起申请。因为往年都是科研院所而不是企业牵头,因此许多合作伙伴拒绝了云天励飞的邀约,认为此事可行性不高。另外,云天励飞当时了解到这个项目的时间相对晚了,已错过了前期的准备阶段,时间一下变得非常紧张。
没想到李爱军和团队里另一位工程师偏偏“不认邪”,坚持天天去“敲”合作伙伴的门。令所有人意外的是,云天励飞与合作伙伴过五关,斩六将。5月30日完成答辩后,结果很快就下来了:他们成功申请到了该项目,团队一时间被惊喜“砸”得头昏眼花。在这个项目中,云天励飞和清华大学、北京大学、中国科学技术大学等高等院校携手并战,云天励飞是其中唯一以企业身份进入的机构。
除了一些时代的偶然,也许,成功更多来源于执着者的必然。
李爱军介绍云天励飞牵头承揽国家科技部“新一代人工智能重大专项”
李爱军透露,云天励飞第三代芯片会在一年至一年半左右的速度迭代一次,争取明年年底流片,2021年上半年正式发布。
对于云天励飞来说,造芯只是一种业务的扩张,并非转型。那么芯片会在云天励飞的发展战略中占据何种地位呢?
据了解,目前,云天励飞目前的内部技术团队分为算法团队,大数据团队和芯片团队。“三者(团队)缺一不可,芯片是我们差异化的战略武器。”云天励飞CEO陈宁给芯片的战略定位做了清晰的界定。
看上去,云天励飞兜了个大弯子造芯,但也许走过的路都不会白费。“罗马不是一天建成的,凡事都有个过程。”李爱军说。
从公司整体发展上看,云天励飞年初传出科创板上市的消息,从公开数据看,目前尚未提交资料。李爱军透露公司还在筹备科创板上市事宜。
当天媒体访谈结束,亿欧智慧城市拉住陈宁,问:“云天励飞的基因究竟是算法还是芯片?”陈宁说,是AI。
埃森哲预期,作为全新的生产要素,人工智能有潜力将2035年的中国经济总增加值提升7.1万亿美元。这其中,会有云天励飞多少的份额呢?人工智能战场的竞争将愈发残酷,结果还要交给时间去验证。
文丨杨珊珊