最新機器人與 A.I.文章

Image credit:

Google 解释 Pixel 4 手势雷达背后的技术

Soli 的运作机制可能未必如你预想的一样,而且它还经过了许多的深度学习和训练。

Sanji Feng
2020 年 3 月 13 日, 傍晚 09:26


Soli 动作感应系统是 Pixel 4 系列的一大卖点,理论上它可以快速地识别用户手势然后执行相应的操作。不过这套方案背后的工作原理可能未必如许多人所想像,而在日前发布的一篇博客中 Google 专门对此进行了一番解释。首先,Soli 的短距离雷达主要是被用来做两件事,其一是探测到人的存在从而让面部辨识组件迅速做好扫描人脸的准备,其二则是认清滑动之类的隔空手势。这第二项是体现 Soli 功能性的核心,而为了让相关组件小到可以被塞进手机,Google 在雷达识别倾向上的优先级是将动作放在形状前面的。

这种做法还带来了一项额外的好处,那就是 Soli 相对来说不容易对用户的隐私构成侵犯。因为它没有办法记录清楚的图像,因此 Google 就「没有足以辨别出人脸或身体的照片可供利用」了。而为了能在各种使用场景下更快更准确地捕捉使用者一闪而过的动作,Soli 是以一种 3D 视图的方式来观察周围的世界。如下图所示,它会用纵轴来代表对象的距离,同时以横轴来代表对象靠近或远离手机的速度。而每个像素的亮度反映的是探测对象的相对尺寸,下图左中右分别是用户走近设备、用手伸向设备和在设备上方做滑动动作时 Soli 看到的景象。

Google Pixel 4 soli gestures radar
Google 以此为基础建立了 AI 模型,并招募了大量志愿者结合 TensorFlow 机器学习框架来帮助 Soli 进行手势识别的训练。由此得来的成果还需要经过专门的优化,最终才能依靠 Pixel 4 定制的低功耗 DSP 直接在手机上加以运用。虽然就目前的情况来看,Soli 还只能认出一些相对简单的动作,但在 Google 眼中这项技术未来还有相当大的潜力可挖。他们相信 Soli 日后也有望被整合到诸如智能手表这样尺寸更小,因而更适合通过手势来操作的设备之中,另外在安全、娱乐、教育等领域它或许也能起到更多的作用。