计算机看了你的儿时照片,还能认出长大成人的你吗?

人脸识别系统不断进步,它们将能更好地识别不同年龄阶段的人,甚至是低龄儿童。

本文用一个简单的问题来开头:如果一个人脸识别系统处理过某个儿童的大量照片,当照片中的他/她长大之后,它能够识别出来吗?

假如我把我小时候的所有照片都上传到Facebook(或是未来的某个Facebook),生物特征识别系统能将这个塌鼻子、圆脸蛋、西瓜头的小孩和我成年之后的脸联系在一起吗,我的鼻子、脸蛋、发型都完全变样了。

这并不是个无聊的问题:父母们将孩子们数以百万计的照片上传到社交网络,当孩子长大会用Facebook及类似网站后,他们自己也会这么做。当他们继续成长,这些照片能否一直被识别,将他们少时的萌照与成年身份联系在一起?

或是说,这种自然老化过程为我们提供了某种程度的保护,避免被人脸识别算法所窥探?如果说我都认不出我小时候的照片,计算机又能有多少希望?这个问题没有简单的答案,即使理论上年龄的限制不大:对于人脸识别系统,要将低于7岁小孩的照片与同一人成年后的照片匹配起来,是非常困难的。

而且,在实践中,这一领域大多数人脸识别系统距离有能力进行此类识别都还很远。然而,这并不能缓解如艾米·韦博(Amy Webb)等技术思想家们的忧虑,她最近告诫父母不要上传孩子的照片,因为“普适的生物特征识别技术(ubiquitous bio-identification)才刚刚起步。”

关键在于我们有多想将小孩产生的媒体文件与他们的成年身份联系起来?对于现在大多数的成年人,我们小时候的照片和视频都是不可搜索、不可访问的,除了手动挑选的“老照片(throwback Thursday)”。

如今成长于互联网时代的孩子比起过去有着更大范围、更深程度的数字脚印。危险在于这也许会限制他们成长为未来人类的自由。程序算法在掌握某人童年情况的基础上可以调控他们的发展可能性。

如果你小时候的照片(或YouTube视频)能与你的成年身份连接起来,它至少会增加上传或托管儿童照片的伦理复杂性。

让我们谈谈技术细节。

这一类人脸识别工作产生于非常不同的领域:法医学科学家,纯理论计算机科学家以及人脸识别从业者。法医学科学家试图解决一个非常实际的问题:如果一个小孩走失了很长时间,执法部门如何生成一幅他的近照?他们想要研制一个能人工老化走失儿童面部照片的系统。我们都知道孩子的面容变了,但这不是严密的分析,不需要P一张五年后的小孩脸出来。人工老化基本上就是人脸识别的逆运算。

婴儿期到3岁期间,以及青春期(10岁之后)到成年期间是人脸变化最快的时期,多伦多大学信息学院( the University of Toronto Information School)的监视专业博士研究生阿历克斯·齐布尔斯基(Alex Cybulski)这样表示。“颅面形状及面部纹理在人早年时期变化很快,你就可以明白事情有多复杂,因此要用计算机建模来进行人脸识别很难。

很难,也许不是不可能。齐布尔斯基提到了肯特大学( the University of Kent)法医学学者斯图尔特·吉布森(Stuart Gibson)的研究工作,他“这样说,是因为研究认为七岁之后的人脸变化是最大的,因此人脸变化可以估算,并且可以可靠地比较。”

吉布森所做的工作是拍下儿童在不同年龄时期的照片,然后建立计算机模型来进行人工老化。下图就是例子,最左(A)列和最右(F)列是被试者的真实照片。B列至E列展示了基于他的模型的不同算法预测结果。

你可以想到,对于骨骼结构、皮肤纹理及其它美学变量进行定量建模,可以使人脸识别系统得到改进。

这个不切实际的问题带我去到另一处地方,见到了诸如威斯康辛大学麦迪逊校区的数学家奈吉尔·波士顿(Nigel Boston)。他提到了加州大学洛杉矶分校斯蒂芬·索亚托(Stephen Soatto)的工作。

在索亚托看来,人脸是带有某些属性的形状空间。“你的身份就是经过某类变换后的不变量,”他对我这么表述。对于他来说,如果我们想要匹配照片或是分辨不同的人,要面对两类变化,这才是问题所在。一类称为固有变化——我现在的脸与我二十五年前的脸相比——而另一类称为“危害性变化(nuisance variability),”即与我身份无关的图片特征。

索亚托写过一篇论文,讨论如何消除由图像焦距引起的此类变化,它严重地扭曲了人脸(特别是手机的前置摄像头:“你看不见你的耳朵,鼻子也变大了”)。而他发现了在这项研究与定量老化效果之间的数学相似性。在我们这个特定问题中,我们试图消除的危害性变化是时间,而且“尽管时间对于数据的影响非常复杂,但在数学上它还是一个使你脸变形的一元态射(1-parameter morphism),”索亚托表示。

他认为上述焦距研究中的方法可以应用到老化问题以及人脸识别。他们可以将大量的图片输入模型中并“学会这种变化,”,他这样说到。

“从概念上讲,两者是同一件事。唯一的困难在于获取数据。你必须明白这将是一项长期的纵向研究。”当然,挑战在于我们的老化有着不同的方式,但是“存在着几何不变性,因为人脸不是可任意改变的对象。”例如,你可以预测到眼角的鱼尾纹和歪下巴。或是对于儿童,你可以想象额头几乎占了脸的一半大小。也许,人脸的某些特征是不变的,或者说它们之间的关系是不变的。

内布拉斯加大学人脸识别研究学者采用的29个人脸特征。

对于这种计算,计算机系统能力有多强呢?密歇根州立大学计算机视觉教授阿尼尔·杰恩(Anil Jain)在电子邮件中对我这样说到:“假设我们有你相隔x年的两张照片。简单起见,假设它们都是标准的肖像照(正面,表情自然,照明统一)。大体上讲,如果x小于10年,现有的人脸识别系统就能够准确地进行匹配。但是因为不同的人老化的过程也不同,x的值也因人而异。”

当然,儿童的情况更为困难。而且,杰恩注意到,“无约束条件(unconstrained settings)”下的人脸匹配如监视视频或是随机抓拍“挑战更大。”

但是学者们完成的研究工作大多只有几十张至几千张照片。如果达到了Facebook的规模,照片总数以十亿计,每个人随着时间累积都有几千张(甚至几万张)照片,那时会发生什么?

斯坦福大学网络与社会中心研究人脸识别的附属学者雅娜·韦林德表示,“一旦社交网络建立起包含人们不同年龄数码照片的数据库,对它的研究就会越来越多。”你可以相信Facebook正在尝试识别它的用户,无论他们的年龄或是照片中的年龄多大。而他们很有希望干得不错,因为“数据不可理喻的威力(unreasonable effectiveness of data)”可以改进他们的算法。

计算机会比人类更厉害吗?

索亚托就是质疑这种说法的人之一。毕竟人脸识别是个相当难的任务,但(几乎)所有的人类都长于此技。他表示,“实际情况是,人脸识别很复杂,但人类对于脸部细微的特征有着很好的理解,要让工程系统来模拟或是超越人类的推断力非常困难。”

问题涉及到“认识与学习的核心是什么”,索亚托说。“数据有很多,但数据不是信息。信息是要经过你挑选去芜存菁的结果。你找到了危害性变化的源头之一,即年龄,但它也是个麻烦事。但同样的难题在认识与学习领域的各个分支都普遍存在。”

问题的本质也许意味着,除非机器能像我们一样的学习,要想在人脸识别方面取代我们非常困难。

收藏 评论

关于作者:toolate

(新浪微博:@人墙裂) 个人主页 · 我的文章 · 13

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部