不久前,在2017年美国国家标准与技术研究院组织的全球人脸识别技术测试上,一支中国人工智能技术团队超过来自俄罗斯、美国、法国的对手,成为靠前个获得佼佼者的中国团队。
参赛团队需要在百万量级人脸数据库中找到目标人脸或判断其在不在库中。查询照片来自出入境等真实业务场景,包含识别对象不在摄像头前特定位置的“非配合性”照片。机器面临曝光过度、逆光、侧脸、远距离、低像素的挑战。衡量指标在于搜索的准确率,以千万分之一误报率下的性能为评估标准。检索准确率越高,就意味着参赛者的算法可以在更大规模的人脸数据库中获得可靠检索结果,可以更准确、高效地完成身份验证。
赢得佼佼者的中国团队——依图科技的首席执行官朱珑认为,这除了说明来自中国的算法技术超过了全球的竞争对手,还有更大的意义:我们的算法已经在十亿分之一的误报下达到超过90%的识别率,已经能够超越所谓的国际主流标准。
人脸识别就是科学家口中的计算机视觉,作为人工智能极其重要和关键的领域,目前正处在超乎想象的快速发展阶段。“从我们自己的经验看,我们的算法效率几乎以每年100倍的速度在提高。现在在几亿量级的面孔中识别出一个人,并不是什么难事。”之前,依图科技搭建了全球首个10亿级人像比对系统。
朱珑说,简单讲,计算机视觉是制造有人类视觉能力的机器,让计算机通过学习算法接近人类对图像的理解程度。而当计算机实现了对图像和视频的初始理解,计算机视觉就能帮助人类突破局限性,改善生活。例如,目前依图的主要技术聚焦在计算图像识别和自然语言理解在安防、医疗、金融领域的应用,同时也在进行人机交互、人工智能芯片等研发。
不同于计算机,人一睁眼就能迅速看到和看明白一个场景,因为人的大脑皮层至少有一半以上的海量神经元参与了视觉任务的完成。在互联网、云计算、大数据等帮助下,科学家们也开始利用深度学习、神经网络等模型和方式来教会计算机识别物体。有意思的是,尽管人类希望计算机视觉接近人类智慧,但在很多场合特别是机器得到海量数据的学习训练后,科学家们发现计算机视觉处理能力似乎已经超越了人类大脑。
“计算机识别人脸和物体的时候,有点像从人眼看见物体到大脑译出终结果的过程。我们的计算模型也类似人的神经元传递方式,一层一层搭建起高级的神经网络。”朱珑和导师、闻名科学家霍金的弟子艾伦·尤尔,早在实验室中研发出新系统,通过递归式塔状结构来表示物体的结构,而不是像传统识别方式那样,需要事先被告知物体特征,从而会导致巨大的数据存储量。朱珑认为,技术人才的储备、市场环境的成熟和实践的基础、数据资源,是中国人工智能可以和全球强对手竞争的巨大优势。无论是对国家还是从业者而言,人工智能都将迎来极其难得的机遇。