9月6日,腾讯高级执行副总裁,同时也是腾讯七大事业群之一的 SNG (Social Network Group,社交网络事业群)掌门人汤道生出现在上海,为当日举行的腾讯优图计算机视觉峰会站台。
“到目前为止,优图的技术积累和应用取得了一些成绩,但这样远远不够。我们会持续长期投入,不设KPI。”汤道生在致辞中强调。
相比 SNG 事业群内QQ、天天 P 图、全民 K 歌、腾讯云等知名度较高的拳头产品,优图实验室的存在还不为人熟知。而此次汤道生对优图发展“不设 KPI”的背后,则显现出腾讯对以优图实验室为代表的 AI 版图进一步扩张的押注。
回顾腾讯布局人工智能的过往,“优图”可以称得上是里程碑式的起点。
2012年,腾讯优图实验室成立,聚焦计算机视觉,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。彼时,如今被称作“视觉识别四小龙”的四家国内 AI 独角兽公司中,商汤、云从尚未成立,旷视与依图只处在发展萌芽阶段,以视觉识别为代表的人工智能技术也尚未实现大规模的场景落地。
基础技术积累成为优图过去六年中的重要动作。为了证明自身在 AI 领域的科研实力,优图开始频频在人工智能行业的顶级赛事(MegaFace,LFW, ICDAR, MIREX)、会议(ICCV,CVPR,AAAI)中露脸——仅在2017年,优图就发表了18篇A类论文,并推出首个AI开源项目ncnn。
而在技术储备的同时,将 AI 能力形成使用门槛更低的产品,并找到合适的场景落地,成为优图如今发展的重心。另一方面,AlphaGo击败李世石、波士顿动力机器人的惊艳亮相,也在大环境上促使腾讯优图让 AI “跑出”实验室,让科研成果转化为提升实体产业效率的工具。
“前两年,我们还经常听到各家公司说’我们的某某能力达到了96.88%,又提升了一个百分点’。但现在,这种声音已经开始慢慢变少,人工智能已经进入到一个场景化深度发展时期。”汤道生说。
为了更快实现腾讯 AI 的场景落地。当日,汤道生宣布,将腾讯优图实验室升级为腾讯计算机视觉研发中心,深入到包括医疗、自动驾驶、工业、零售、办公、文化、社会公益等十大领域的具体应用。
从在基础能力上“跑高分”,到找到垂直领域技术落地,人工智能俨然已进入“跑场景”时代。不过,对于专注自身“两个半”(社交、内容+半个金融)领域的腾讯来说,要想将自身的 AI 基础技术融入线下的复杂场景,既要面临陌生领域的专业度积累,同时需把握好与合作伙伴的利益分配。
“实验室”制度
在 BAT 对人工智能的业务部门划分中,相比阿里巴巴的达摩院、百度的 AIG 事业群,腾讯选择了与业务绑定更深的“实验室”制。具体来说,就是在腾讯各个事业群中成立具有业务特色的实验室,并与一线职能部门深度联动。
同样在 SNG 事业群,除了如今升级为腾讯计算机视觉研发中心的优图实验室,还有2016年成立的腾讯音视频实验室、2017年成立的量子计算实验室。这三个事业群中,量子实验室带有长远布局的意义,而音视频与优图的诞生,都与 SNG 已有的 QQ、QQ 空间、NOW 直播、腾讯云等业务需求有很大联系。
以音视频实验室为例,其负责人刘晓宇曾在接受采访时谈到,QQ 在1999年就有了音视频通讯功能,但网络问题一直是一个技术难点,不论是检测网络带宽,还是处理丢包、抖动、多端设备的适配,都需要很深的技术积累,这也就倒逼腾讯产生了自研技术的决心。
不过,在腾讯目前公布的AI 版图阵容来看,目前对外公布的集团级三大实验室中,除了腾讯优图实验室外,还有2015-2016年间成立的 AI Lab 与 WeChat AI 实验室。
其中,AI Lab 隶属于腾讯 TEG (技术工程事业群),由人工智能领域顶尖科学家张潼博士担任负责人,其基础研究方向包括计算机视觉、语音识别、自然语言处理和机器学习,目前已推出围棋AI“绝艺”,技术也被微信、QQ、天天快报和QQ音乐等上百个腾讯产品使用。
而 WeChat AI 实验室则隶属于腾讯 WXG(微信事业群),主要研究自然语言处理,图像和视频,数据挖掘和文档理解,并在语音的输入及转文字,扫一扫/封面,翻译,聊天机器人,摇一摇音乐电视,声纹锁等场景进行应用。
由于腾讯内部有着“赛马”传统,对于如何划定 AI 实验室的优先级,以及是否能让多个实验室实行技术及业务上的联动,成为腾讯对外输出 AI 能力时需要考量的难点之一。
“并不是说哪个实验室优先发展或者不发展,每个实验室都有它的强项。”腾讯优图实验室总经理、杰出科学家贾佳亚对钛媒体说。
在贾佳亚看来,全球懂量子计算、并愿意加入量子实验室的人选可能不超过十个,但人工智能方面的专家可能已经有几万个,这种人才规模上的差别势必会影响实验室之间投入的量级。
而对于优图实验室,贾佳亚则直言:“整个优图的发展就是以落地为基础,把最新研究的技术迅速落地到产业里去。”他以优图与腾讯短视频产品“微视”合作的人体跟踪算法举例,从收到需求到完成项目,优图只用了不到半年,就实现了人体形态、包括人脸、每个关节的实时跟踪技术。
“优图为什么能够崛起?就是因为他们能够打硬仗。有一个全新的行业过来洽谈,就算之前什么都不懂,也能从零开始把这个事情做起来。”贾佳亚告诉钛媒体。
让 AI “跑”进场景
2017年是腾讯 AI 名副其实的战略规划年。这一年11月,腾讯在位于成都的全球合作伙伴大会上首次公布人工智能全盘布局。腾讯集团首席运营官任宇昕谈到:腾讯的目标并不是 All in AI,而是 AI in All,即让腾讯研发的 AI 技术开放后与行业结合,让 AI 的技术价值得以发挥。
在今年3月腾讯“两会媒体沟通会”现场,马化腾也回答了钛媒体有关腾讯 AI 布局的问题,他表示:
现在AI都应用于一些专用的场景,而且要把这个场景划的足够窄、足够清晰,然后通过深度学习把它的特征、数据了解之后,开发成算法。我觉得先从垂直领域入手,AI的通用或许还远,垂直方面我觉得已经有很多机会可以做了。
“觅影”是腾讯 AI 大规模落地产业的首个标杆案例。这款 2017 年 8 月诞生的 AI 医学影像产品,可以辅助医生筛查食管癌、肺结节、糖尿病视网膜病变、结直肠肿瘤、乳腺癌、宫颈癌等疾病,其中,觅影对早期食道癌的筛查准确率高达90%,已经在全国100多家三甲医院落地。
除了在技术层面的突破外,觅影的发展路线,实则代表了腾讯对 AI 的整体布局方向。
“开放、合作”就是腾讯觅影的关键动作。特别是对于医疗这类专业垂直场景,腾讯自然无法靠一己之力完成渗透。
因此,负责觅影产品的腾讯医疗团队一方面不断在微信智慧医院、糖大夫、医疗云等方面拓展工具,另外注重全产业链合作,比如结合腾讯 MIG 事业群的 AI 加速器开放 AI 技术、投资、导师等资源,在国内多家三甲医院落地人工智能医学实验室。
“我们希望合作方把我们当做一个超市,可以选择需要的能力,我们不能强迫你们选择不喜欢的东西。”腾讯副总裁陈广域曾这样谈及腾讯的医疗布局。
另一方面,隶属于腾讯 MIG(移动互联网事业群)的觅影,其背后融合了腾讯优图、 AI Lab 等多个 AI 实验室的技术联动。
“大家彼此术业有专攻,又能做到很好的互补,我们很少会在同一个领域中出现撞车的情况。比如 AI在医疗领域的突破,就是公司内部协调的一个非常好的案例。”腾讯副总裁梁柱对钛媒体说。
零售则是腾讯近期落地 AI 的另一个集中领域。今年5月,腾讯优图和微信支付合作的刷脸支付系统在上海家乐福投入使用。这一场景应用融入了优图活体识别和1:1核身技术,能够判断面部的细微差别,1:1条件下可以实现十亿分之一的错误率。
通过与腾讯云合作,腾讯还推出“优 Mall ”智能零售系统,消费者可用人脸注册会员,通过腾讯优图的人脸检索、识别技术,门店在消费者到店的那一刻就能识别顾客身份。如果识别出是老顾客及VIP客户,还可根据其过往购买记录,将可能感兴趣的商品进行推送;最终,消费者还能通过“刷脸”轻松完成支付动作。
可以看出,不论是To B 的医疗、零售场景,还是 To C 的短视频、支付工具,腾讯 AI 正在过去的一年中,加速让技术“跑”出实验室。就连腾讯优图实验室总经理、杰出科学家贾佳亚在上周的活动演示中,也多次提及,这是优图技术团队成立六年来,第一次主动对外演示 AI 与零售、工业、文化等行业的结合案例。
不过,贾佳亚也坦陈,优图在实验室里对技术的长期积累,与当下落地场景的高效有着直接关系。
在贾佳亚看来,区别于市面上其他的视觉识别 AI 公司,优图的壁垒是拥有一个强悍的运算中台。搭建这个中台的过程难度很大,但完成之后,优图的研究人员训练一个新模型的时间就能从十天缩短至一个小时,再加上有腾讯云、微视等丰富的应用层提供数据、产品需求,就能通过这些反馈进一步磨炼中台的能力。
“从算法模型的训练,到完成中台搭建、再到上层应用的结合,完成这个循环后,优图投入一套核心算法的人员只需三四个人,但小公司四十个人也完不成,”贾佳亚对钛媒体说。