夏洛特的AI实验室

梅姨落网背后,AI如何帮找回被拐儿童

· 1min read
梅姨落网背后,AI如何帮找回被拐儿童

三月二十日,“梅姨"落网的消息在网上炸了。

24小时内,全网380万条相关信息;抖音48小时100亿次播放。这个数字不是流量,是一个民族压抑多年的情绪出口。

新京报"动新闻"通过3D技术还原的"梅姨"面部特征:讲粤语和客家话、脸盘较大较圆、单眼皮、嘴巴较大、鼻孔外露 图片来源:新京报"动新闻” 2019年11月梅姨案特征还原报道

我看到很多人在问同一件事:这次凭什么能抓到?

答案里,有DNA、有AI、有大数据——但这三个词被说了一遍又一遍,却几乎没有人解释清楚,它们到底做了什么,怎么做到的。

作为一个做AI科普的人,今天我想用最普通的语言,把这件事讲清楚。


梅姨案:如何找到那9个孩子

在"梅姨"本人落网之前,那9个被拐的孩子,已经在2019年到2024年间陆续找回来了。

其中有一个案例让我印象特别的深。

在梅姨案里,有一个叫欧阳佳豪的孩子,3岁被拐,直到22岁才和父母相认。中间隔了足足19年,容貌早已天翻地覆了,记忆也几乎归零。

那是什么把他找回来的呢?

南昌铁路公安局有个民警叫汪挺,擅长大数据人脸识别。他用AI对比了欧阳佳豪儿时的照片和成年后的图像,在海量人口数据里把他找了出来。

这件事之所以让我震惊,不是因为技术本身有多神奇,而是因为——19年前,人工是做不到这件事的。

照片里的一个3岁的孩子,长大后鼻子的弧度、颧骨的角度、眼距的比例,肉眼几乎无法比对。但AI却可以。它不疲惫,不会被相似的脸迷惑,能在几秒内跑完人工要跑几个月的比对量。


第一项技术:DNA数据库——给每个人建一份"生命指纹档案"

先从最基础的说起吧。

DNA数据库这件事,中国其实从2000年就开始做了。公安部牵头,建了全球最早的"打拐"DNA专项数据库之一。到了2009年,全国联网,所有省市的数据打通。

咱们可以把它理解成:给每个被拐儿童的父母、以及疑似被拐的孩子,建一份"*生命指纹档案"。

具体能怎么用?

假设一个孩子5岁被拐,父母报了案,采集了DNA。15年后,这个孩子长大了,换了名字,换了省份,甚至不记得自己的亲生父母。但他的DNA里,那一半来自父亲、一半来自母亲的"生命密码",一直没变。

只要警方在任何场合采集到他的DNA——哪怕只是一个常规的身份核查——放进数据库一比对,就能比出"你跟四川某地一对失孤夫妻的DNA有50%的重合率"。

之前经常出现在新闻里的案例:《失孤》原型郭刚堂的儿子郭振、《亲爱的》原型孙海洋的儿子孙卓——这两个孩子找回来,走的都是这条路。

现在的技术更厉害了。

早期DNA比对只能用在近亲之间。现在有了Y-STR父系比对、SNP位点检测——即使是远亲,跨代比对,成功率也在大幅提升。

有一个细节让我觉得很触动:现在有些已知被拐家庭的孩子,在不知道自己被拐的情况下参与了普通的DNA检测(比如做亲子鉴定或者健康筛查),就这样无意中被数据库"认出来"了。

不是寻找,是等待。数据库一直在等。


第二项技术:AI人脸识别——时间可以改变脸,但改不了比例

人脸识别大家都听过,但多数人理解的是"刷脸进地铁"那种——站在镜头前,系统识别你是不是你。

但在寻亲场景里,AI做的是另一件事:跨越时间的比对。

一个3岁孩子的脸,和同一个人22岁时的脸,普通人看不出联系。但AI看到的不是"这张脸好不好看"“这两张照片像不像”,它看的是:骨骼结构、器官比例、面部特征点之间的几何关系。

这些东西,随着年龄增长会有变化,但变化是有规律的。AI在大量人脸数据上训练,学会了"一个人从3岁到22岁,哪些比例会怎么变化"——用这个规律,反向推算出:这张儿童照里的孩子,长大后最可能长什么样。

然后拿这个预测结果,去和全国人口数据里的人脸做比对。

你可以理解成:AI是一个不会疲惫、不会被相似的脸欺骗、还会"预测衰老"的超级侦探。

在"梅姨案"里,欧阳佳豪就是通过这个思路被找到的。


第三项技术:大数据追踪——从海量信息里找那一根针

这第三项,可能是最难解释清楚的。

所谓"大数据追踪",不是说系统在盯着某个人。而是说:当足够多的数据被汇总在一起,某些异常就会自动浮出水面。

举一个生活类比。

假设你是一个社区超市的老板。平时你们社区100户人家,每周进货量、买菜种类、消费金额——都有规律。突然某一周,某户人家的日常消费完全消失,但同时在另一个区的超市出现了同样的消费特征——你会觉得奇怪吗?

大数据做的,就是这种"异常识别"。只不过数据源是:人口流动记录、交通出行数据、手机基站信号、购物记录、学校入学信息……

当一个孩子被拐到外省,以新的身份生活,他/她的"数据轨迹"会出现一些异常:

  • 某地突然多了一个没有本地户籍、没有出生记录的孩子
  • 某家庭的出行路线与案发区域有重合
  • 某孩子的上学记录里缺乏早年信息

这些信号单独看,每一个都微弱,都不足以构成证据。但系统把它们叠加在一起,就能产生"这里有问题"的预警

2021年公安部"团圆"行动,就是大数据技术的一次集中爆发——那一年,帮助10932个孩子找到了家。不是一个,是近11000个。


团圆系统,你手机上可能推送过

说到这里,我得专门提一个东西:“团圆"系统

2016年,公安部推出了这个"儿童失踪信息紧急发布平台”。

逻辑很简单:孩子失踪的头几个小时是黄金时间。让最多的人在最短的时间内看到失踪信息,就能最快锁定目击者和线索。

这个系统和高德、微博、微信、今日头条、支付宝等25个平台打通。孩子在哪里失踪,系统就以那里为圆心,向周围人的手机推送消息。时间越长,圆圈越大。 如果你在路上收到过那种"附近某某儿童失踪,特征如下……“的推送,那就是团圆系统在工作。

截至2023年,团圆系统已发布失踪儿童信息超过5000条,找回4900余名,找回率超过98%。

98%这个数字,不是技术秀肌肉,是一个个家庭的重聚。


为什么92%的人说科技是"终极武器”

梅姨落网的消息出来之后,有机构做了一个调研:92%的受访者认为科技是反拐的终极武器。

这个数字不让我意外,但让我想多说一句。

技术确实越来越强。但技术本身,不会主动去找人。

它需要:

数据。 DNA数据库需要失散儿童的父母主动去采集;寻亲系统需要有人录入信息。如果父母不知道去哪里采血、不知道怎么登记,技术就找不到他们。

录入。 现在仍有很多被拐儿童的父母,没有进入DNA数据库。因为他们不懂流程,或者当年报案没有被重视。

时间。 很多案子积压了几十年。技术再强,也只能帮已经录入系统的案子往下走。新的被拐案件,需要第一时间启动这一套机制。

这也是为什么网友们在呼吁:全国统一DNA数据库全覆盖、安珀警报系统落地、区块链儿童身份证这些不是口号,是技术要发挥作用的前提条件。

技术是武器。但要让武器能用,还需要系统建设。


写在最后

我做AI科普,平时写的大多是"这个工具怎么用"“那个功能怎么上手”。

但梅姨案这件事,太令人感概。

AI不只是提效率的工具。DNA数据库、人脸识别、大数据追踪——这些技术背后,是19年没有过一天安稳的父母,是被强行插入陌生生活、连名字都被改掉的孩子。

当技术帮助一个22岁的年轻人找到素未谋面的"爸爸妈妈",那一刻,这些冷冰冰的算法和数据库,就成了世界上最温暖的东西。

我们生活在一个AI正在改变一切的时代。它改变我们的工作方式,也改变了人间能不能有团圆这件事。

希望今天这篇文章,让你对AI多了一点不一样的理解。

感谢观看。