AR:为什么比VR眼镜难做得多?(上)



在前几年的科技热潮中,VR 和 AR 经常被并列着说起。但实际情况是,VR 真正落地了,从现在起至少会维持一个 10 年的长期增长,这个趋势非常明显。

但 AR 哪去了呢?甚至有些人都忘 AR 眼镜是干嘛用的了。

其实,AR 的 “A” 是 Augmented,是增强的意思,也就是说,靠它显示出来的内容是真实视觉与虚拟视觉的叠加。而 VR 的 V 是 Virtual,虚拟的意思,所以在视觉里并没有真实视觉的成分。

对工程有敏感度的用户听到这里,已经知道为什么 AR 的发展比 VR 缓慢得多了。

接下来,我们就用三期《科技参考》来梳理一下,AR 在这几年的产品和今后的发展趋势。今天这一期,我先介绍目前最先进的三款 AR 眼镜,它们分别是 AR 眼镜的鼻祖——谷歌眼镜、微软的 Hololens 和 Magic Leap 的 One。

有人可能还听说苹果也要出 AR 眼镜,但由于目前没有任何细节公布,所以我们先不讨论它。

 

为什么失败产品能带来投资热潮?

首先,咱们说谷歌眼镜。简单用一句话介绍就是:它是一个试验形式的产品,而且比较失败,但为产业界带来了投资热潮。

由于谷歌发布它之前,给出的官方宣传视频太过高大上,所以等到产品真的出来的时候,给满心期待的科技爱好者造成了过大的心理落差。

比如,在最初的广告宣传里,眼镜可以用全息的方式显示出一个环绕式的屏幕。大约在一个人面前 170° 的范围里都能显示信息。这就好像把手机屏幕里的东西排成了长条状,用手指在眼镜腿上划一划,就能在天气、日程安排、视频通话、电影、地图导航等等界面里随意切换。

但实际情况是怎么样呢?可以说,用起来的体验非常糟糕。首先,只有右边镜片的一小部分区域能显示信息,而且这个区域非常小,所以只能显示一些简单的文字信息。

其次,看信息的时候,右眼还要专门进行瞄准,没有点随时瞪出斗鸡眼儿的功夫还真看不到东西。

而所有这些代价,换来的只有四个功能——打电话、拍照片、录视频、烫头。

前面三个功能你可能还能理解,打电话毕竟加个麦克风和喇叭就可以了;想实现拍照和录视频功能,那不过也就是加一个微型摄像头。可烫头又是怎么回事呢?其实,这是网友讽刺谷歌眼镜的功耗控制不合格。正常使用起来,大约 2 小时电就耗光了。因为体积小、功耗大,所以用起来时,右边的眉头还真挺烫的。

这个产品虽然失败了,但谷歌是第一个大规模投入资金做 AR 眼镜的公司,所以给业界带来了很多希望,于是后来涌现出不少 AR 创业公司。

在这之后,大家对在如此小的体积下,供电怎么解决、显示效果能到什么程度等都有了初步认识,也知道了创业之路并不好走。这大概就是谷歌 AR 眼镜给业界带来的作用。

 

AR眼镜比VR眼镜难在哪?

这第二款 AR 眼镜,你可能没听说过它的名字,但你很可能见过它的广告宣传。起码我就在微信群里见过好几次。

这个广告宣传是这样的:一头蓝鲸突然从室内篮球馆的木地板里一跃而出,然后木地板也变成了水面的样子,接着鲸鱼又落回水中。如果你还没看过,可以看看这个场景的动态图片。

 

说了半天,还没提到它的名字呢,它就是 Magic Leap 的 One。从目前出现过的所有 AR 眼镜里看,它的性能是最强的。

但今天,Magic Leap 公司已经名存实亡。它在 2021 年裁员 1000 多人,创始人也离职了,靠着发布 PPT 一次次拖延下一代产品的发布。它的第一代 AR 眼镜从 2018 年上市至今,总销量只有大约 1 万台。

这家公司经营得如何暂且不论,它的这款眼镜还是很值得我们说一下的。因为它能让我们理解 AR 眼镜为什么难做。

这款 AR 眼镜的性能之所以强,是因为眼镜部分和计算部分是分开的。

眼镜部分有点像我们去配眼镜时戴的镜框,就是验光时戴的那个大大的、能插多个镜片的架子。而计算部分有点像一个铁饼一样的暖手宝,这个需要揣裤兜里。两者之间用数据线相连。用起来的时候,外人看着是很奇怪的,就好像佩戴者后脑勺有一根线连在屁股上那样。

但这样做的好处是,铁饼一样的计算单元能容纳更沉的零件。比如说,计算单元里的 CPU 是一个四核心 ARM 构架 Cortex A57,大约是高通骁龙 810 的性能,还是不错的。GPU 则是来自英伟达,有 256 个 CUDA 核心,性能大约是 2021 年安卓旗舰手机图形性能的一半。

使用这款眼镜的时候,要先为 3D 空间建模。说白了,就是让它记住你所在的空间是什么样子的。只有建模后,它才能创建出来一个虚拟空间和真实环境互动,不会“穿模”。“穿模”是一个游戏里的用词,比如说,游戏中的门还没开,但游戏人物的一半身体已经从门里露了出来,这就是穿模了。

想让 AR 效果逼真,必须先要精确地建模。但建模的过程是很痛苦的,你需要戴着眼镜,撅着屁股看遍屋子里每个角落,看起来像一个正在同时给嗅觉和膝盖做康复训练的病人。实际上,这是在通过镜头扫描,把屋内的所有空间坐标确定下来。

建模完成后,一些有意思的 App 就能工作了。比如说,你可以用“手柄”在地面上码放多米诺骨牌,然后玩儿推骨牌的游戏。而让人感受到 AR 科技的瞬间是——

如果你码放完骨牌,然后在最后一张牌的旁边,真实地放一个书包去抵住它。之后再戴上眼镜,在虚拟空间里推倒骨牌,前边的多米诺骨牌都会挨着倒下,但到了最后一张时却只会搭在真实的书包上,不会倒下。因为真实空间里的书包把它抵住了。

从这个细节里,我们就可以看出 AR 的实现有多麻烦。首先,它需要把现实场景里的所有元素都建模;然后,再和虚拟生成物合成在一起,用内置的物理引擎计算相互作用的结果;最后,只输出虚拟部分的结果。

在这个过程里,只要现实世界里有什么坐标没有对准,或者现实中有东西发生了变化,而 AR 眼镜没有及时处理,那么虚拟物体和现实互动的体验就是一团糟。

比如,如果在骨牌一张张倒下的过程中,我在倒数第二张骨牌倒下的时候,突然拿走了书包,那么 AR 眼镜是来不及反应的,也就是说,无法重新实时计算出最后一张骨牌的运动结果。体现在视觉上的效果就是,在实际上已经没有书包抵住它的情况下,骨牌会半倒不倒地悬停在半空中。这就很影响使用体验。

而 VR 就并不用担心这个因素,因为它的一切都是在虚拟世界里运作的。

而且,除了虚拟图像要与真实场景匹配之外,连声音也是这样的。

比如,我们虚拟出一个音箱出来,当我们移动音箱时,声音的来源换了方向,听起来声音就应该不一样。或者我把虚拟音箱放在真的衣柜里,听到的效果也应该不一样。可问题是,到底听起来应该是怎样的感觉呢?其实都是需要计算的。

当然,这些声音工程的内容已经不是 AR 公司从头开始做了,而是从类似 BOSE 或者索尼这样的音频技术大拿那里得到授权。

如果你留意了我刚刚说到的一个点,就是在玩多米诺骨牌那个游戏时,我说的是用“手柄”码放一排多米诺骨牌。其实,用“手柄”也是一种无奈。这反映的是目前 AR 在交互方式上还不成熟。

这并不是我的苛责,如果它是 VR 的话,我就不会有这样的要求。因为 VR 就是虚拟世界,就像我们平时玩 VR 游戏一样,自古以来的控制就是靠手柄或者和手柄发挥同样功能的鼠标和键盘。但 AR 由于是和现实互动,所以最自然的互动方式就是用四肢和五感,而不是用手柄。

但只要我们对比另一款,也是今天最顶级的 AR 眼镜设备——微软的 HoloLens,就会知道,目前也只能暂且先用手柄,用四肢互动的效果实在不好。

 

最顶级的AR眼镜性能如何?

最后,我们说说微软的 AR 眼镜,刚刚提到过,那就是 HoloLens。

它是没有把计算部分和显示部分分开的,看起来就像半个瓜皮头盔。头盔前方有个可以揭开和拉下的护目镜,这个护目镜就是 AR 眼镜了。

做成半盔的样子,就可以适当的增加重量。比如摩托车头盔,半盔大都有 1.0 – 1.4 公斤。当然,那是为了高速运动下的防护,做到足够保护必须这么重,人戴着也觉得还算正常。

目前,HoloLens 已经出了 2 代,重量大约是 600 克,这是一个尽量把性能最大化的设计方案。

我们在“微软用 687 亿美元收购动视暴雪”那两期参考中也提到,HoloLens 是它们实现元宇宙中的一块拼图。

今天,在 HoloLens 里可以生成很多虚拟物品,当然,要互动的话一样需要事先扫描大量的 3D 场景,只不过比起 Magic Leap 的眼镜要方便快速得多。

比如,我用 HoloLens 在桌子的右上角生成一个地球仪,之后不论我从什么方向上看,不论头部如何晃动,地球仪的空间位置都是固定的,也就是说,增强实现出来的地球仪也应该是始终不动的。

而要实现这样的效果并不容易。因为头部细微的动作、你的视野微小的变化,都会导致虚拟物品跟着动。所以,只有虚拟物品的坐标也跟着不断改变,才能实现最终看上去不动的效果。这就需要复杂的计算,但 HoloLens 完成得不错。

而且,微软 AR 眼镜中生成的虚拟物品,哪怕是关机了,下次启动时也会自动加载出来。最简单的应用,就是把家里的墙纸换一遍。只要换一次,你以后再戴这个眼镜的时候,就都能看到自己换的墙纸了。

从这一点我们就可以看出,微软构建虚拟世界的意识已经有了,但这个眼镜的效果也就仅此而已了。

微软在 HoloLens 的官网上列出了目前的 50 大客户,其中不乏大品牌,比如空客、奥迪、固特异轮胎、奔驰、雷诺、丰田、三菱等等。

但实际能用在哪里呢?看了微软的官网我们就发现,微软还是把它的 AR 眼镜定位在工业应用上了。接下来两期,我们就详细说说微软为什么这样做,同时介绍一下中国的 AR 眼镜发展情况。

这就是今天的内容。你使用过 AR 眼镜吗,又有什么样的感受呢?欢迎在留言区写下你的想法。

聯系郵箱:0xniumao@gmail.com