十几年老码农,讲讲互联网、软件行业的那些事儿。欢迎关注同名公众号:"屋顶的闪闪星光 " 我对高校就业、IT公司进行分析的文章都有一个共同点,出发点和落脚点都是个人发展,成长、选择、就业是"小荷才露尖尖角"这个系列永恒的话题。 看破纷纷扰扰的人工智能战场的上篇从行业视角分析之前站在风口,如今有些没落的AI四小龙,而这个下篇则从人脸这个最成熟、最热门的领域,以微观的视角做一下解剖。 人脸识别已经渗透到我们生活的方方面面了:进公司时刷脸开门槛;支付宝刷脸查下公积金;银行App刷脸进行大额转账;政务类App上面刷脸提交材料在线办事。 用到人脸技术的产品有很多,绝大多数都不是企业自研的, 市场上真正可以提供人脸方案的厂商不多,除了华为、百度、腾讯、阿里这样的大厂之外,也只有四小龙的产品到了一定规模,技术实力比较强 。 上面提到的这些场景中用到的人脸识别技术 要么是人脸搜索,要么是人证核验 。 人证核验比较复杂,比如像银行转账、支付宝刷脸查公积金这种,需要用户提供人脸和身份证给系统,系统计算出来人、证是否匹配。 这里我们详细拆解一下人证核验这种场景下,"刷脸"的过程中到底发生了哪些事: 一、 业务系统通过App采集人脸 这就是我们常见的"张张嘴"、"摇摇头"、"眨眨眼"了,在用户做出这些动作的同时,App会在手机端完成"活体检测",并筛选出一些高质的人脸照片上传到云端的人脸系统。 这一步最关键的技术是"活体检测",就看你是真人还是照片、甚至提前录制的视频等。 二、 人脸系统完成风控检查 这一步要判断的东西比较多,涉及到安全策略的东西都属于企业的核心机密,每家厂商也都会有自己的策略。常见的有:设备安全性检查、App安全性检查、刷脸次数/频率控制待。 三、 人脸数据源 常见的人脸数据源,既有官方机构的数据,比如公安部人脸库等,也有客户信息积累的数据,比如,银行在让自己的用户做人脸认证时保存的信息等。 人脸技术的厂商一般会接入这些人脸数据源,把采集到的用户人脸、身份证信息发送过去。人脸数据源将数据与自己人脸库中的数据比对之后,告诉人脸技术厂商是否比对成功。 通过人脸数据源比对成功之后,只要人脸技术厂商把自己采集到的用户人脸、身份证信息保存下来,就可以建立自己的人脸库了 。问题来了,他们会不会这样干呢? 四、 人脸比对 人脸数据源在接收到人脸技术厂商的比对请求之后,要做的事核心就一件:通过身份证号检索出自己人脸库中对应用户的人脸照片,与人脸技术厂商传过来的人脸照片做比对,看两张照片中的人脸相似度。 如果相似度大于某个阈值,就判定比对成功,如果达不到这个阈值,就判定比对失败。 当然,中间会涉及到很多细节上的技术,比如,人脸特征提取、再一次的活体检测、人脸比对等。 以上我们列了一下最常见的人证核验技术经典流程,让大家对这个领域有一个基本的了解。 除了人证核验之外,另外一种人脸搜索的流程比较简单。 比如小区门禁,提前录入所有业主的人脸,当业主进入小区刷门禁时,在人脸库中检索看是否有匹配度比较高的人脸就可以了。 接下来讲讲人脸技术中存在的一些问题。 合规问题 这里会有一些灰色地带。比如,2020年9月的时候,李开复在一次公开演讲中说自己早期帮旷视拿到了很多蚂蚁的数据;2021年3.15,央视点名批评智能摄像头滥用人脸识别等。 这类事件现在比较敏感,我们不去过多地谈它们。事实上,不管是微信、支付宝、手机百度这样的大厂App,还是线下无处不在的摄像头,由于广泛的用户覆盖度,确实可以做到采集大量的人脸库。 而且,中国之前对于数据隐私、安全、合规这方面在管理上并不健全,人脸技术厂商在收集到人脸数据之后,不管是在自己公司内部不同业务间共享,还是在公司不同客户间共享,甚至与合作伙伴之间互换,都有可能。 毕竟,接入市场上公开的人脸数据源都是要收费的,而自己建个人脸库则好处多多:业务做得越多,覆盖的用户量越多,人脸库越大,产品竞争力越强。 作为普通用户,让我开心的是, 形势在今年发生了很大的变化,随着个保、数安等一系列法规的落地,人脸技术服务商面临很大的合规风险 。 相信这会驱动人脸技术厂商更多关注普通用户的隐私和数据安全,加强人脸数据的存储安全管理,以及在体验和安全之间权衡,妥善解决用户人脸数据的跨实体、跨场景流动问题。 而且 企业和消费者都已经在行动了 : 微软在2019年时删除了一个创建2016年的公共人脸库MSCeleb。并且说,当时开放只是用于学术目的,并强调:"这是由一名已从微软离职的员工运营的"。 还有发生在浙江杭州的"中国人脸识别第一案",教法律的老师将杭州野生动物世界告上法庭,说他们在办理年卡时,约定采用的是以指纹识别方式入园,园方后来以系统升级为由要求采集照片信息,超出了法律意义上的必要原则要求。 另外,消费者人脸数据在隐私、合规方面的治理,可能会让人脸技术厂商出现两极分化 。 对于腾讯、阿里、百度等互联网巨头来说,自身产品覆盖用户范围极大,业务场景也很丰富,自身就会产生足够多的数据,只要砸资源来补齐算法这个短板,退可服务自己的业务,进可SaaS化售卖产品能力。事实上,现在百度、腾讯、阿里云都有自己的人脸技术产品在售卖。 但对于旷视、商汤等作为技术服务商帮助其它企业服务消费者的企业来说, 做人脸技术服务但拿不到数据,是个很头疼的事 。再牛逼的算法,把你放到客户的私有云中,你触碰不到人脸数据,算法如何进化?巧妇难为无米之炊啊!我们来猜一猜,在人脸技术领域,四小龙会不会因此而没落呢? 安全问题 半个月前网上出了一则新闻:一位女士睡着后,前男友拿用手机刷她的脸,用手翻开眼皮通过了活体检测,最终盗走了她十几万元。 其实从技术角度来讲,这个案例并不能证明人脸技术有什么大问题,毕竟一般人碰到这种事也不会去怪刷脸技术。但却也说明了人脸技术也是有安全问题存在的。 技术上的攻防来说,可以有很多办法去攻破人脸,比如:将手机Root之后,Hook住捕捉活体检测的方法,喂给他一段提前录制好的视频;Hook住人脸比对的方法,注入一张提前拍好的人脸照片。 可能像腾讯、阿里、百度这样的大厂在安全攻防方面积累深厚,被攻破的概率很低,四小龙这样持续投入大量资源搞研发的厂商也能自保,但那些刚刚创业起步的公司做出来的产品呢? 想一想,我们在银行App中刷脸转账,进入园区办公,用支付宝查社保、取公积金,在政府各部门的App中刷脸办事等,如果出现安全问题导致数据泄露,后果真的不堪设想。 针对这些问题,工信部下属的中国信通院发起了"可信人脸守护计划",来制定人脸识别在技术、应用等方面的可信标准。只有把人脸技术这个牌子做得够硬,才能真正普及起来。 这个守护计划中集齐了公安部、中国人民公安大学、中国支付清算协会、中国信通院云大所、工商银行、招商银行、阿里、腾讯、百度、商汤、旷视、依图、华为等人脸技术领域上下游、监管等角色,希望能推动人脸技术的健康发展。毕竟,这是个真正可以造福社会的技术。 接下来我们回到这个系列文章最初的落脚点,以从业者的视角来思考人工智能 。 人脸识别只是因为技术最成熟,并且已经找到了足够刚需的应用场景,所以迅速普及开来。其实这只是人工智能(AI)落地应用的一个场景, 整个社会的数字化改造已经风起云涌,数字化之后就是智能化,用机器代替人工决策,有无数的新场景等待从业者去发现、开拓 。 这是个很有前景的赛道。 熟悉我文章风格的人都知道,我是个大厂吹。我自己的成长经历比较丰富,呆过多家中小公司、新锐上市公司、大厂,自己也创过业,对各种类型的公司算是都有比较深的了解。 正因如此,我才知道,对一个正在成长中的人来说,大公司有多么重要!不管是公司在培养员工方面投入的资源,还是一个好平台带给员工的宽阔视野、丰厚而稳定的收入,甚至单纯与优秀的人一起共事就能让人受益匪浅。 对于人工智能这样的技术门槛高的赛道来说,这个规律更加的重要。在任何领域,人工智能要想成功落地,除了算法模型之外,离不开场景、数据,而只有头部大厂才有海量的数据和丰富的场景,让我们去探索前沿理论、应对其它地方没有的复杂问题,从而获得个人的飞速成长。 当然,如果你度过了菜鸟阶段,已经在某个领域成为可以独挡一面的专家了,而你又发现大厂人才济济,卷不过别人,那当然可以利用自己的优势,选一些中小公司去突破一下自己的瓶颈。 在一种新技术逐渐走向成熟、方兴未艾之时,倚仗自身的专业优势,选择一个有资源、有场景,甚至找到现成的应用场景和客户,能够支撑新技术落地的新兴公司,做成一些有影响力的事,无论个人成就感、自身能力提升,还是突破职业瓶颈,都会是一件幸事。 不过,这里经常会有一些坑,需要识别、不要踩进去。 首先, 要避开那些过于炒作新概念的公司 。没有核心技术,也没有应用场景资源的中小公司,无论创始人背景多么靓眼、融了多少钱,如果对产品不看重,或买、或租、或为了圈钱造假,给再多的钱也不能去。 再次, 要避开缺乏做产品的耐心的公司 。先行者需要在探索、迭代过程中具备超前一步的眼光、高额的投入、基本的耐心和定力,如果决策者太浮躁,不顾技术发展的客观规律,那也风险很高。 最后, toC场景的任何应用,都因为可以短时间内投入大量资源来快速规模化而被巨头垄断 ,后来者很难再做大,最好的结局也就是卖身,甚至巨头一个部门就能把你干趴下。 而toB场景还有很多可供中小公司挖掘的机会。而对toB企业来说,对市场有深入的理解,有存量的固定客户资源,有现金牛可以养活公司并持续在新领域去投入等,都非常重要。