——访IEEEFellow,国际知名计算机视觉、模式识别、机器学习、生物特征识别领域理论、技术和应用研究专家,英国Surrey大学博士,中科院资深研究员,中科院优秀百人计划,生物识别与安全技术研究中心主任,中科奥森创始人李子青。
比尔·盖茨曾下过这样的断言:生物识别技术将成为未来几年IT产业的重要革新。盖茨言论的背后支撑是,越来越多的个人、消费者、公司乃至政府机关都承认,现有的基于智能卡、身份号和密码的身份识别系统是远远不够的,生物特征识别技术将在未来提供解决方案方面占据重要的地位。
尽管我国人脸识别技术起步较晚,但发展非常迅速,在人脸识别精度方面,更是屡屡打破世界纪录,取得世界瞩目的成绩。随着人脸识别技术的快速提升,人脸识别应用领域也在加速落地。近两年,人脸识别在银行、证券、金融社保、交通、教育、电子商务、高考、机场、地铁等场景应用频频刷屏,热度居高不下。
近期,《大数据周刊》专访了IEEEFellow,国际知名计算机视觉、模式识别、机器学习、生物特征识别领域理论、技术和应用研究专家,英国Surrey大学博士,中科院资深研究员,中科院优秀百人计划,生物识别与安全技术研究中心主任,中科奥森创始人李子青。他就人脸识别技术的精准度、安全风险以及主要挑战做了分享。
从2000年加入微软研究院起,李子青博士即开始以应用为导向,把计算机视觉、机器学习应用到人脸识别及监控视频分析。在国内,李子青制定了十多个TC28/SC37国家标准和TC100/SC2的公安部行业标准,包括生物特征识别术语、人脸识别应用分类、动态人脸监控,近红外人脸识别、出入口控制、人证核验、人脸活体防伪、人脸数据格式与接口等。迄今参与的国家级应用包括2005年的深圳罗湖自助通关的人脸识别系统,2008年北京奥运人票实名核验,2010年上海世博的出入口管理,2012年国家物联网应用示范(无锡市公安局落地)的人脸识别平台,2013年罗湖水客识别系统等。
人脸识别标准,行业发展必备标尺
《大数据周刊》:工信部发布的《促进新一代人工智能产业发展三年行动计划》,其中一个目标是到2020年,复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%,支持不同地域人脸特征识别。那么当前人脸识别有效检出率和正确识别率是多少?实现这一目标要做好哪些准备?
李子青:这个行动计划说明国家对生物特征识别、视频理解、跨媒体融合等技术创新,发展人证合一、视频监控、图像搜索、视频摘要等典型应用,拓展在安防、金融等重点领域的应用的重视和支持。但其中的“有效检出率超过97%,正确识别率超过90%”,提法不专业,因为检出率和识别率,每个都指标必须是两个数字成对出现,也就是还需要加上相对应的“虚警率”,所以解读时不必纠结其中的两个数字的实际技术含义。另外,技术指标一定和测试数据的构成和难易程度有关。该《行动计划》提到了“复杂场景”这个概念,这也比较模糊,我想它所指的主要是安防监控场景的行进中的动态人脸识别,这个的确是目前最难的应用场景之一,有赖于技术的提升和突破。
《大数据周刊》:有人担心人脸识别的准确率越高,在互联网环境下风险就越大,因为一旦采用生物特征认证,就会有特征数据库来记录,如果密码泄露还可以换,而生物特征不可再生,您怎么看待目前的信息安全?大家在刷脸的时候该注意什么?
李子青:这个说法不准确,正相反,人脸识别的准确率做到百分之百准确才是最好。这个担心应该指的是,人脸识别的准确率越高,则更有可能被假体攻击–这是一个质疑,但并非完全如此,因为人脸身份识别和假体攻击识别是一个应用中的两个技术问题。提出这个质疑,反映了公众对人脸识别应用的一些担忧。的确,对授权类的人脸识别应用来说,比如个人账户登录、个人业务办理、关键出入口控制等利用人脸进行身份核验的业务等,需保障使用者的身份不被假冒,所以这类应用系统应具有识破假体攻击、并加以阻止的能力,对非值守的身份核验应用,尤为如此。
假体攻击主要有三种类型:人脸图片/照片打印、人脸图像视频显示器播放、各种材料的面具,其中仿真皮面具成本最高,也最具攻击性、最难防。假体攻击识别与人脸识别,是两个技术上相关联但不同的环节,一般是使用两套不同的核心算法。防假体攻击的技术核心是,识别人脸图像来自肉身还是假体。采用纯算法软件实现成本最低,但安全性保障不足,比如2017年315晚会上爆出的人脸识别安全性漏洞,即为对纯算法软件的防伪方式的成功攻击。光电硬件+算法软件的解决方案,可靠性会高很多,比如中科奥森首创的双目多光谱人脸活体检测防伪解决方案。
用户在使用人脸识别作为授权认证时应谨慎,照顾好自己的隐私信息不要泄露,刷脸的使用方式,在刷脸成功率方面,按照使用的提示做;在活体防伪方面,使用者没有可以控制的能力,安全性由该应用提供方人脸识别系统的防范假体攻击能力所决定。我制定了一个刷脸的活体防伪行业标准,目前正在做一个相应的国标,其中制定了防假体攻击的技术要求。
突破发展瓶颈,大数据是关键因素
《大数据周刊》:目前人脸识别技术的主要挑战是什么?发展到了哪个阶段,在哪些领域应用较成熟?
李子青:这个可以从AI和大数据的角度来看。AI经历了随符号主义的盛行到其第二个寒冬的衰落。神经网络,在联结主义框架下,作为当年与符号主义对立的技术学派,也经历了一个半死不活的过程,直到2006年,被深度学习再度激活,并奇迹般发展壮大,不仅带动了计算机视觉、语音识别等AI子领域的技术与应用发展,更是引发了AI的第三波热潮。
深度学习带来的成就,离不开标注大数据的支撑;有监督深度神经网络的性能很大程度上依赖于数据标注规模和质量。目前深度学习通过架构、算法改进,以及标注数据规模的扩大,仍然有一定的提升空间,但这个速度将会比较缓慢。由于数据标注资源现在已经用到了接近极限(见李开复谈AI与大数据)。我个人认为,目前深度学习引擎的性能已比较靠近天花板。
人脸识别在两个方面仍然需要有技术完善和技术突破。第一个是前面提到的刷脸应用中的人脸活体检测与防伪。第二个是非配合条件下的人脸识别,如反恐、治安视频监控中的动态人脸识别,核心引擎的准确率尚未能满足实际应用需求,其表现为误报率太高,经常发生“狼来了”的误报警。
上述问题本质上仍然是前面所说的深度学习瓶颈–受限于正确标注的大数据。解决这个瓶颈或突破天花板,是人脸识别、计算机视觉和AI的关键所在,也是国际巨头研发的主攻方向之一;如Google的Capsule、Facebook的进化学习,DeepMind的AlphaZero。
创新解决当下,赋能未来
《大数据周刊》:2018年AI有怎样的发展趋势?中科奥森作为全球领先的人脸识别技术及解决方案供应商,2018年在AI领域将怎样布局?
李子青:前面说到人脸识别和AI其他技术,在目前有监督深度学习框架下,已经出现瓶颈、性能已接近天花板。
中科奥森目前在开展的重要工作之一,是解决目前有监督深度学习受限于标注数据规模的制约,突破途径是利用生产环节大数据,在半监督或无监督学习框架下,自主提升,突破深度学习引擎性能天花板,使得在监控类非配合条件下的动态人脸识别性能获得成百上千倍的提升,也就是把误识率降低数百到数千倍,这与各厂家PK比较几个百分点,有本质的不同,是突破性大数据技术,其成果能够真正满足实际应用的严苛需求。
中科奥森在做的另一个创新工作是新一代视觉传感器。10年前中科奥森曾发明了近红外人脸识别,利用光电传感器的创新,弥补当时智能算法能力的严重不足,做出了世界上第一个实用的人脸识别门禁考勤产品,并由国内的厂商推广到国外。其后又提出了异质人脸识别方法,即可见光人脸图像与近红外人脸图像之间的交叉比较,扩大近红外人脸识别产品的应用范围。再后来又创新了双目多光谱(RGB+NIR)人脸活体检测,并将其应用在授权类人脸识别的假体防伪。我们推出的技术一直被人模仿,但从未被超越。
中科奥森的最新视觉传感器技术ApolloEye,是智能结构化视觉传感器(专利技术产品),采用单目摄像头即能采集RGB+NIR+3D多模态图像,并且能够适应从夜晚弱光暗光到夏日强阳光和强逆光等极端不利光照条件变化、输出质量一致的图像和人脸/人体/车辆检测输出。在严苛条件下实现多模态、高性能的图像采集和视觉目标抓拍,需要综合光学、电学、图像处理、AI算法及工程化等方面进行统筹设计与优化;综合性解决方案,解决交叉学科关键问题。
ApolloEye为应用提供丰富可靠的视觉信息,具有广阔的应用前景。对监控类应用,它能显著提升复杂场景下的人脸识别准确率;对授权类应用,它能有效阻止假体攻击。其他应用场景包括无人超市、机器人、自动驾驶,等等。
两年前我为中科奥森提了一个口号:AI照进现实(AIBrightensReality)-意思是让AI技术落地,灵感来自于我很喜欢的一部电影《梦想照进现实》(徐静蕾、韩童生、王朔)。现在我又提出了一个进一步的口号:创新解决当下,赋能未来(InnovationsEmpowerSolutionsandtheFuture)-针对AI的当下落地与面向AI未来的发展,是我更具体的战略行动计划。
1988年我怀揣梦想去英国留学,第一站是爱丁堡大学AI系。经历了AI的第二次热潮和寒冬,以及现在的第三次热潮。研究AI理论与核心技术,持续不断的创新,解决当下实际应用问题,开创未来前沿技术与产品,是我热爱和痴迷的工作。