为什么中国的“刷脸”技术领先世界?
“刷脸”技术频频进入日常生活,从火车站到零售商店再到十字路口,刷脸技术的频繁使用让人们想起电影里的场景——在公共的空间中,“you are being watched”(总有人看着你)。
阿里巴巴创始人马云演示人脸识别技术
美剧《疑犯追踪》里有一个场景:在茫茫人海当中,架设在路口的摄像头可以捕捉到人脸,精确的识别出相对应的信息:你是谁,多大年龄,从哪来……并且还能够一路跟踪和绘制他的行动轨迹。很炫酷,对不对?
看看人脸识别技术在中国的应用场景,可以说是遍地开花:
8月30日消息:北京科技大学迎3000余新生 首设人脸识别技术新生“刷脸报到”
8月29日消息,武汉市民“刷脸”办政务,民警“扫扫”抓坏人。
8月28日:苏宁全国首家“无人店”在江苏南京正式营业。 在“刷脸”进店之前,所有首次进店的用户需先下载苏宁金融APP进行“绑脸”操作。消费者进入店内购买商品以后,无需排队付款,出店时通过付款通道,系统即可自动识别用户身份,随后通过苏宁金融实现交易付款。
……
中国人脸识别技术的广泛应用使得越来越多的科技企业加大了投入和研发的投入。根据产业研究院去年发布的报告显示,2016年,中国的人脸识别行业的市场规模已经超过10亿元,预计未来五年里,中国的人脸识别市场规模平均复合增长率将达到25%,到2021年,人脸识别市场规模将达到51亿元。
人脸识别,作为人工智能中一种技术,是从何时开始,在中国迅猛发展起来的呢?
应用驱动型发展
在北京中关村科技园,旷视(Face++)的员工们进门只需“刷脸”,无需刷卡。踏入玻璃门后,正对着大门的摄像头会捕捉到员工的脸部特征,头顶上方的大屏幕上会有相对应的信息显示。
进入到办公区域后,会发现格子间旁有一大面屏幕,上面演示着Face++的得意之作之一——天眼系统。天眼系统中的摄像头在不停地捕捉人脸的信息,一旦数据库中已有相对应的信息录入,识别出来的信息就会显示在大屏幕的右侧。
据介绍,旷视的天眼系统能够输出年龄、性别、身高、身份比对,人群热力图监测等结果,实现电影级的快速识别定位、多人实时识别。目前,这个系统应用于平安城市的基础建设,已在无锡、苏州、合肥、乌鲁木齐等城市纷纷落地并投入实战,在线抓逃。
旷视北京总部里演示的天眼系统
旷视的办公室的墙上贴着一句标语——为了人工智能终将创造的所有美好。在办公室茶水间的走道里,还有一张有五颜六色的颜色绘制的机器人人头的卡通形象图。如同负责人所说,这家年轻的企业由很多Geek(极客)组成,轻松且复合科技达人价值观的工作环境才能使他们最大限度地发挥自己的才能。
近几年,人脸识别技术本身从比对关键点到成功率上都有进步。从业界最早的五个关键点的比对到目前商用里的106个关键点比对,技术本身也是一种计算方式。
在旷视副总谢忆楠看来,和最老的一批人脸识别技术相比,目前的技术最大的不同在于现在的人脸识别技术已经可以拿到很多行业里去用了。也可以在行业中产生数据服务。
旷视最早是从做平台开始,几年前,人工智能的概念还没有火起来时,大家对人脸识别的概念认识得不深。平台开放也主要是服务于开发者,不断的拓展不同的应用的场景,最典型最的案例就是美图秀秀。
简单来说,就是P图的时候,APP的后台技术能够准确把握用户的脸部特征,将人脸变成标准比对的数据后,可以进行比对。提供给开发者的标准产品可以应用在美颜、解锁、测面相等。到2014年,旷视的开放平台的调动量超过2000万次,这一点上是比腾讯和百度要早几年。
数据优势
在人工智能业界看来,这一波人工智能技术在中国的发展主要是得益于大数据,因为算法上目前没有太多的变化,但中国海量大数据的储存,一方面是给了科技企业以及技术开发者广泛的练手的平台。 另一方面,五花八门的场景应用也提供给企业可以变现的通道。
国务院在7月20日公布了《新一代人工智能发展规划》,为中国在人工智能领域领先世界制定了雄心勃勃的计划。到2020年,人工智能的核心产业规模超过1500亿元,带动相关产业规模超过1万亿。
人工智能是非常消耗大数据储备的“监督性学习场景”,有足够多的量才能满足训练数据。2014年后,旷视预见到了基于人脸识别可以实现的深度型的应用,2016年,旷视的ID在线身份服务系统已经为2.1亿人实现实名的验证服务,并未银行、保险、证券、社保、出行等行业提供了人脸识别身份的验证服务。
IDC行业分析师张卓认为,从技术层面上看,中国的人脸识别技术虽然从基础研究的角度要晚于欧美,但从数据量和技术的创新角度是慢慢赶上了国外的水平。国家对人工智能的顶层设计也吸引了更多创业公司以及风投机构。
据媒体报道,中国政府已经向全国的大学和研究机构投入了大量的资金,同时也把这项技术应用到国家管理的方方面面。在张卓看来,国内的技术水平有独特之处在于庞大的数据量,从数据量上来看,会很快超越美国。因为算法和模型也需要大量的数据支持,政府也在政府云和大数据方面给予了很多支持。谷歌和Facebook也在积极做产品的研发,比如,谷歌掌握了10亿张图片的图库,所以在图像识别上也成为领先的科技企业之一。
“谁掌握数据,谁就有巨大的优势。”张卓说。
中科院百人计划中的科学家周曦也感受到中国在数据上有明显的优势。“数据对于人工智能而言就好比原材料,没有原材料就好比我们通俗说的‘巧妇难为无米之炊’。”他说。海量数据表现出来的效果是无论是从识别率和识别速度上来看,国内的人脸识别技术应用的场景还是占优势的。但这一点也是占相对优势,比如中国在黄种人人脸识别上的数据上的处理比欧美的处理优势更大一些。
在银行业的人脸识别应用上,中国拥有上亿黄种人的数据储备可以拿来训练。但国外的数据可能是基于白种人的数据来训练的。但周曦认为,通过迁移学习(transfer learning) 的算法,在黄种人身上的实验达到好的效果后,也是可以把技术拓展到白种人的应用上的。
“数据和算法就像两只手,如果数据足够多,即使算法简单粗暴一点,效果也是不错的,”周曦说。
人才回归
旷视的创始人之一印奇早在清华就读本科时便开始在微软亚洲研究院(MSRA)实习。那时候在图像识别组积累的项目经历,也为他之后和另外两位在清华姚期智实验班读书的同学——唐文斌和杨沐一起成立旷视打下了基础。
本科毕业后,印奇赴美国哥伦比亚大学攻读3D相机方向博士学位。但感受到国内的科技创业的热度后,印奇选择回国创业。
和印奇一样,周曦也拥有丰富的海外研学的背景。周曦在获得中国科技大学学士和硕士学位后,赴美国伊利诺伊大学(UIUC)研修博士学位,师承美国工程院院士、“计算机视觉之父”Thomas Huang(黄煦涛)教授。他也曾在IBM TJ Watson研究院、微软西雅图总部研究院、NEC美国加州研究院等科研机构从事研究工作。
但美国的人脸识别的需求对比中国而言要小很多。因为巨大的需求,像印奇、周曦这样的科技人才看到了中国市场的潜力,并且积极拓展研发团队,有的团队甚至有200-300人,这一点是美国的研发团队不能达到的规模。
在人脸识别这个技术上,中国和美国的水平是相当的。但不可否认的是,在基础理论方面,比如深度学习领域,美国的公司仍然处于领先的水平。
美国的科技企业有自己各自发展的方向。例如谷歌凭借对“人工神经网络”的研究,DeepMind早已超越了在棋盘上挑战人类脑力的阶段。Facebook(脸书)从搜集图像数据到收购面部识别企业face.com,庞大的用户群体,着力强化智能人机对话的研发。而老牌的科技企业IBM关注人工智能在大数据分析及决策上的优势。
看到越来越大的应用市场后,越来越多拥有海外背景的科技人才回归到中国人工智能发展的队伍当中来,也是中国科技行业发展主要推动力。