人脸识别可以算是落地够快、效果也够炫的“智能技术”之一了,从2015年3月马云展示支付宝的刷脸支付,到最近很多机场、高铁站启用了刷脸进站,就连美图都说自己可以“AI自拍”。
先来泼一盆冷水,目前很多人脸识别的落地应用还处在一个非常初级的阶段,技术价值并不高。
首先,我们要弄明白人脸识别这一概念。人脸识别其实是个相对宽泛的大分类,基于生物特征识别技术,利用人的特征实现个体的区分。其中技术包括图像采集、特征定位、身份的确认和查找等等。
简单来说,就是从照片中提取人脸中的特征,比如眉毛高度、嘴角等等,再通过特征的对比输出结果。
在应用上,人脸识别也分很多层级,目前在我国应用最多还是1:1等级,也就是人脸识别中最初级的“证明你是你”。
1:1等级的人脸识别通常是用户上传符合规则的照片在系统上,线下拍照,于系统中的照片进行对比。在机场、高铁站这种为线下拍照提供了较好条件(灯光、拍照像素等等)的环境中,说实话对于技术的硬性要求不算太高。而知乎中还有网友提到,关于人脸识别终端算法部署授权只需要500元/套,其使用成本可见一斑。而这一技术也绝非最近才出现,在高中时期,我的学校就用过刷脸考勤查验课间操跑步圈数。
对运算环境要求更高的是1:N级和N:N级的人脸识别。也就是单一特征对比多种特征和多种特征对比多种特征。而这两种等级的人脸识别在应用上也常常无法提供较好的环境,比如1:N级人脸识别可以应用于失踪人口搜索中,在特殊情况下拍的照片存在角度、光线的复杂性,加大了特征提取、对比的难度。
LBP,人脸识别的魔法根源
或许我们可以更深一步探究人脸识别的算法,比如Local Binary Pattern(局部二元模式)。这种算法可以将某一像素周边的灰度值和该像素作比较,从而去除光线的影响提取特征。
除了LBP外,常用的特征提取算法还有很多,像是Gabor滤波器。当然,提取特征只是第一步,接下来还要根据特征进行分类,这时就要应用贝叶斯、决策树等等分类算法。
最近大火的深度学习也正逐渐被应用于人脸识别中,深度学习将特征提取和分类两个步骤融合在一起。利用神经网络黑盒子的特性计算出最适合的特征提取模式,从而可以直接跳过“特征提取影响识别结果”这一怪圈,让算法的应用范围更大。
当然,由于深度学习需要应用大量的数据样本和较长时间的训练时间,对于整体运算环境要求也很高,相比物美价廉的LBP,应用范围还不大。
算法基础?实用性更重要!
虽然有人认为人脸识别只是个很基础的算法,但我们认为在应用上范畴上,人脸识别还是一座未经发掘的宝矿。
单纯从身份验证、识别角度来看,就有远程信贷、证券事务办理、实名制系统验证、来访记录、安检审核等等范畴的应用。在提高识别准确性的前提下,还可以利用进行罪犯/失踪人口追踪排查,总之科幻片里通过大街小巷摄像头找人的情节完全可以进入现实。
除了这些落地性强的应用模式,目前讨论热度最高的还有大数据+人脸识别,也就是通过大量人脸样本的累积,从中提取特征并总结规律。像是提取表情特征,构建情绪判断系统;或者通过面色、皱纹、斑点等等特征分析病情。不过这些应用范畴距离落地应用还很远,想要实现情绪判断、视觉诊断等等目的,人脸识别是否是最好的方式也不得而知。
总体看来,在中国的技术企业中,人脸识别算是泡沫较高的一个类别,不光Face++、云从等等企业都拿过千万美金级别的融资。各个企业也将该技术的引用视作踏入AI的一步,大肆PR吹捧,就连一些自拍工具也想来蹭一蹭热度。
其实目前人脸识别的应用还停留在基础上,也就是在较好环境中实现1:1人脸识别,而拍照美颜更仅仅应用到了人脸特征定点提取,连识别预处理都算不上,这样也要强吹只能说发言人的心理素质有些过于强悍了。
我们不应该神化任何一种技术,至于那些混淆视听蹭热度的,恰恰展示出了对于自家产品的不自信。对于流量的吹嘘或许可以“公关在前”,钱拿到了再做实,可技术不是靠营销就能堆砌出来的,最后往往只剩下打脸一个结果。