投递人 itwriter 发布于 2018-08-13 14:48 原文链接 [收藏] « »

图片来源:视觉中国

  毫无疑问,人脸识别已经成为手机厂商日益重视的功能模块。

  不论是 vivo 今年发布的旗舰机 X21,还是 OPPO 的主打款 Find X,更不用提 iPhone X 在 2017 年问世时基于 3D 视觉感知的 Face ID ,与人脸识别相关的应用模块已明显成为趋势。

  从具体的应用来说,诸如屏幕解锁、人脸支付、人像捕捉、美颜修图等功能背后,均由 3D 的视觉方案来支撑。

  什么是 3D 的视觉方案?

  如钛媒体作者 Kiwi_s在介绍 OPPO 的 3D 视觉方案中谈到的:如果我们把手机比喻为眼睛,那么在传统识别技术中,手机这双“眼睛”看到的都是一个平面的世界,而 3D 视觉技术,则让手机从平面视觉升级为立体视觉,从而对人脸识别的速度、精度实现质的提升。

  目前行业中三种主流的 3D 视觉方案为:双目立体视觉方案、3D 结构光方案、TOF 方案。

  在三种不同的 3D 视觉方案中,它们各自都有鲜明的优缺点和不同的使用场景。其中,双目方案属于被动采集,而 3D 结构光和 TOF 技术则为主动采集方案,满足了 3D 视觉上拍摄距离不同的应用场景细分。

OPPO、vivo 最爱的人脸识别,背后的 AI 公司生意该怎么做?

  被称为国内“视觉识别 AI 四小龙”之一的旷视科技,就是为这些手机厂商提供人脸识别方案的幕后关键角色。

  今年 6 月,旷视率先为 OPPO、vivo 提供基于安卓系统的 3D 视觉感知技术支持,并于近期发布业内首个“软硬一体”的移动端 3D 感知全栈解决方案。

  根据旷视的官方披露,所谓全栈方案,就是从算法创新、应用开发、设备制造到解决方案,形成完整的产业闭环,具体来说,在旷视发布的软硬一体移动端智能 3D 产品解决方案中,最上面一层是 3D 应用层,往下依次至 AI 算法、解决方案,最后到摄像、传感等硬件设备制造上。

  “手机 3D 视觉领域虽然已有多种类型的应用案例出来,但该领域包含算法和模组的软硬一体整体解决方案仍是缺位的,旷视科技正在尝试一种从上往下的整合方案。”旷视科技云事业部高级副总裁吴文昊介绍称。

旷视科技云事业部高级副总裁吴文昊

  旷视科技云事业部高级副总裁吴文昊

  把一个全新的生态通过整合形成更具效率的角色分配,这件事并不容易,不过,旷视之所以成为这条产业链的“攒局者”,当中的深层原因一方面来自手机 AI 落地本身的难度;另一方面是来自行业客户的需求。

  从行业总体来说,在手机人脸识别背后的视觉感知技术方案,目前仍属于起步阶段。

  苹果就曾在人脸识别方案的落地遭遇过巨大挑战,苹果原本计划在 2016 年便推出 Face ID 技术,并在当时已量产了 4 万台 iPhone X 用以验证方案。但鲜为人知的是,由于苹果并不是一家做算法的公司,相关的底层技术、算法并不完善,出于对用户体验的考量,苹果不得不推迟一年用以测试,到 2017 年才发布搭载 Face ID 的新一代 iPhone。

OPPO、vivo 最爱的人脸识别,背后的 AI 公司生意该怎么做?

  产业链角色的分散,是手机端 AI 方案落地面临的第一个难点。吴文昊谈到了旷视与手机客户讨论项目的场景:开会时有十多家厂商参与,他们既来自世界各地,又分属产业内传感器、模组、光电等不同环节,每一家都如同一个孤立的零部件,整个产业无法得到串联。

  “大家相互分散,很多做硬件的不懂软件,做软件的对硬件把控也不足,而最后的落地又需要应用去驱动。”吴文昊对钛媒体说,他以刷脸支付举例,当中识别人脸的精度、支付安全标准、对活体工攻击的能力防范,这些问题都需要应用场景来反推验证,并由产业链上的各个角色配合完成。

  按照人脸识别在手机落地需要的 AI 方案,旷视也联合多家合作伙伴,搭建了软硬一体的移动端产品矩阵,具体为:

  • 3D 应用:旷视研发的 3D 人脸识别解锁和 3D 人像光效应用已经实现了规模化,同时在安全支付、3D 美颜、3D 整形等领域均有所涉猎,根据旷视透露,下一步将投入到 AR 游戏、虚拟试穿等应用。
  • 3D 算法:在 AI+3D 的底层算法研发方面,旷视专注于识别和重建两个大类。识别即机器感知、理解世界的能力;重建即把识别出的物体进行三维重建,是开发针对人、针对物的 3D 视觉应用核心所在,旷视目前已与 Bellus 3D、Altizure 等 3D 视觉企业开展了联合研发合作。
  • 解决方案:旷视根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,整合结构光、TOF、双目等不同的摄像、传感系统架构,设计出基于双摄、三摄、深摄的解决方案。
  • 硬件模组:移动端 3D 产业链最下面一层是硬件制造,包含摄像头、传感器、芯片等硬件模组的研发。结构光、TOF 和双目方案涉及到高清摄像头、IR 投射器、IR 接收器、激光发光器等设备的搭配组合,旷视目前已经与艾迈斯半导体等 3D 硬件模组厂商展开合作。

所谓全栈方案,就是从算法创新、应用开发、设备制造到解决方案,形成完整的产业闭环

  旷视最新推出的 3D 视觉全栈方案,即从算法创新、应用开发、设备制造到解决方案,形成完整产业闭环。

  可以看出,旷视在全栈方案的四层中主要涉及 3D 应用层与算法,而在旷视不太擅长的硬件及解决方案中,则采取了与三维技术集成商珠科创新、光场应用服务商叠镜数字、传感器服务商艾迈斯半导体等合作伙伴共同开发的方式;此外,旷视还宣布将联合主要芯片厂商合作研发算法适配性更强的芯片,进一步优化手机 3D 应用能力。

  随着手机厂商对 3D 视觉识别技术的青睐,旷视在产业链上明显的抱团动作,实则也是用“生态”形成壁垒的一种方式。而在 AI 服务手机场景的战场上,旷视的另一位竞争对手商汤科技也同样动作频频。

  今年 5 月,商汤实现了从 2D 人脸识别向 3D 结构光人脸识别的升级,这一技术已搭载于最新发布的小米 8 透明探索版,商汤科技联合创始人、研究院院长王晓刚在接受界面新闻采访时,也谈到了对生态链的看法。

“苹果、三星这样的厂商是软硬一体,可以提供整体的方案;国内的手机公司和技术提供方是分开的,这就需要两边更好地结合,才能和外国厂商抗衡。”

  而在具体的合作方面,商汤科技的做法是,在头部厂商落地方案之后,再把相关的技术标准化,形成类似 SDK 的整合,然后提供给更加长尾的客户。之后,商汤科技还会逐渐形成一个平台,来提供更加综合性的服务。

  这样来看,商汤主打技术产品化形成的“平台”,旷视则专注于搭建“生态”后成为软硬一体的服务商。对于如何构建自己的门槛,旷视科技云事业部高级副总裁吴文昊表示:“没有哪一种策略是不能通过时间与金钱完成的。但重要的是,首先愿不愿意做改变,这是一个定位的问题;其次才是改变的决心和能力。”

 
来自: 钛媒体
找优秀程序员,就在博客园 收藏 新浪微博 分享至微信

24小时阅读排行

    最新新闻

      相关新闻