微纳制造
服务信息网

Karl Guttag:谷歌硬刚苹果 Vision Pro?Android XR 生态全解析与 Meta 的双面战

2026-03-10

[2025年3月9日更新 – 将MITRE的激光扫描光波导技术新增至激光扫描企业名录]

引言

每年一月,随着CES和SPIE的AR/VR/MR大会接连召开,我总是忙得不可开交。今年,我先后与60多家公司进行了交流,或聆听了他们的演示。收获的新发现足够我写上一整年的专栏。因此,我必须精挑细选,聚焦那些最有趣或最具影响力的内容。我许多聚焦单项技术的文章,从技术研究、图片拍摄处理到最终成文,往往需要耗费数周时间。

起初,我打算将所有公司汇于一篇文章中,但面对近50家公司的素材,即便只是简短点评,也显得过于冗长臃肿。于是我决定分门别类,逐一呈现。开篇的首组文章,聚焦于两大巨头——谷歌(Android XR)与Meta,它们均在AR/VR/MR 2026大会上亮相。在本文末尾,我也会简要列出我于一月接触、并计划在未来文章中深入探讨的其他公司。

Android XR (谷歌篇)

img

在AR/VR/MR 2026大会上,Android XR生态系统负责人Hugo Swart发表了题为《Android XR:未来已来,前景可期!》的演讲。他首先重点介绍了谷歌的Gemini AI助手,随后阐述了谷歌与三星、高通在XR领域的合作。他还提到,团队正与传感器、显示、电池、芯片、摄像头及内存等领域的多家公司展开合作,但未透露具体名称。Swart将三星的Galaxy XR称为“我们生态系统的扛鼎之作”。他现场询问谁体验过Galaxy XR,看到举手者寥寥,便恳请观众务必一试(现场互动环节总是充满变数)。从功能上看,Galaxy XR是一款支持摄像头透视的VR头显,外观和功能上都与苹果Vision Pro极为相似,但售价仅为后者的一半,约1799美元(而且没有Vision Pro正面那个略显滑稽的“电子外眼”)。

img

Swart指出,同一套Android XR软件将横跨多个产品形态:从XR(摄像头透视)头显,到XR有线眼镜(如Xreal Aura),再到无线XR眼镜(类似Meta Ray-Ban智能眼镜,但由谷歌及其合作伙伴共同研发),以及AI眼镜(仅有音频和摄像头,无显示功能)。

AI眼镜:无屏款将至,有屏版可期

img

随后他简要介绍了搭载谷歌Gemini的AI眼镜,分为带显示和不带显示两种版本。引用Swart的原话:“在产品的另一端,是专为全天候佩戴设计的AI眼镜。我们正致力于开发两种不同类型的眼镜:一种是配备摄像头、麦克风和扬声器的纯AI眼镜;另一种是带显示的AI眼镜,其视场角较小,采用光波导技术,通常是单目设计,用于呈现 glanceable 的即时信息。”(英文原话引用 “At the other end of the spectrum, we have AI glasses designed for all-day wear. And we are working on two distinct types of glasses. One is an AI glasses that have cameras, microphones, and speakers. Also working with display AI glasses, which have a smaller FOV, waveguide, and are often monocular, for glanceable content.”)

简而言之,谷歌及其合作伙伴(尤其是三星)似乎在效仿Meta已有的Ray-Ban AI眼镜和Meta Ray-Ban Display眼镜的产品路线。三星已证实正在研发将于2026年亮相的无显示AI眼镜,但尚未确认是否会有带显示的版本。据我所知,在Google I/O大会上展示的基于Raxium MicroLED的AI显示眼镜(参见:谷歌XR眼镜:采用自研Raxium MicroLED,光波导实验室出售给Vuzix)目前仍处于研发阶段,距离真正产品化还有数年之遥。

与Xreal联手打造的有线XR眼镜及Aura项目

Swart用了近一半的演讲时间,重点介绍了与Xreal联合开发的有线XR眼镜及Aura项目,并深入探讨了相关光学方案。在该配置中,眼镜本身集成了麦克风、扬声器、IMU(惯性测量单元)、视觉追踪及手势识别摄像头,而所有的处理、显示生成、通信及供电任务,则交由一个外置的计算机或专用的Android XR计算单元(本质上就是一台无屏幕的手机)来完成。这一概念已存在数年,例如Sightful’s Spacetop最初使用Xreal眼镜搭配定制的无屏主机,后来也可连接传统笔记本电脑;而XREAL Beam Pro计算终端(运行Android系统,自带屏幕,本质上就是一部去掉电话功能的手机)自2024年起已上市。据称,Aura的计算单元性能更强,与谷歌Gemini的整合度更高,且虽无自带屏幕,但能为眼镜提供更强大的算力和更持久的续航。

img

Swart提到Aura采用光学透视(OST)方案,但需要指出的是,Aura在最透明状态下,其基于LCD的全局调光器也仅能达到约20%的透光率,意味着它会阻挡80%的环境光。就光学部分而言(传感器、摄像头、麦克风、扬声器等配置可能有所不同),Aura眼镜本身相比Xreal One Pro(其光学原理详解参见:Xreal One Pro光学解析:与Ant-Reality及谷歌的渊源)并无显著提升,即便是有也只能算是微调。

谷歌的Compound LightGuide(即Xreal Flat Prism)

Swart花了大量篇幅介绍其Compound LightGuide(复合光导,简称CLG)技术。他表示:“我们提出了混合光学系统的构想”(即CLG)。事实上,这一光学设计源自谷歌2024年收购的Ant Reality(即AntVR)。

img

img

Swart将CLG描述为介于birdbath(鸟盆)光学和pancake(折叠)光学之间的产物。我个人更倾向于将其视为birdbath光学的一种变体:它利用固体光学元件和内全反射光路,使得整体厚度比传统birdbath方案更薄。所有这些方案都结合使用了偏振分光镜、四分之一波片和非偏振曲面半反射镜。看来谷歌与Xreal在光学技术上的合作相当深入,即便双方对同一技术有不同的命名。

有趣的是,这与Xreal在Pro 1上推出的“Flat Prism”(平面棱镜是完全相同的光学设计(详见:Xreal One Pro光学解析:与Ant-Reality及谷歌的渊源及下图)。我猜测谷歌与Xreal之间可能存在某种未公开的授权协议,以共享这项光学技术。

img

图自 XReal One Pro Optics and Its Connections to Ant-Reality and Google

CLG技术的利与弊

不管这项技术披上了什么样名字的皮,与光波导方案相比,他几乎都有下面这些相同的优缺点:

优势:

  • 相较于瞳孔扩展光波导,图像质量非常出色

  • 相比鸟盆方案,能在更小巧的形态下实现相对宽广的视场角

  • 制造成本远低于光波导

不足:

  • 遮挡至少75%的现实世界光线(相当于佩戴中度深色墨镜)

  • 虽然比鸟盆方案更薄,但仍远厚于光波导(约15毫米 vs. 约1毫米)

  • 重量明显高于光波导

  • 由于显示模组和光学器件的存在,眼镜的“眉部”区域显得厚重

  • 厚度与重量的叠加导致眼镜头重脚轻

  • 采用OLED微显示器,在同等功耗下亮度不及搭配LCOS或MicroLED的光波导方案(因此更可能需要外接线缆

  • 与偏光显示屏(包括LCD和车载HUD)可能存在兼容性问题

在我看来,CLG本质上是一款大幅改良的鸟盆方案, 而并非冲着全天候可穿戴眼镜形态去的(至少对大众市场而言)。光学器件的厚度意味着,虽然从正面看它可能像普通眼镜,但实际上它比基于光波导的设计要多突出约15毫米。

更为致命的是,无论是鸟盆方案还是CLG设计,本质上都会阻挡超过75%的现实世界光线,佩戴体验犹如戴着一副深色墨镜。相比之下,光波导设计通常只阻挡10-20%的环境光。CLG这类光学方案对小型公司或许意义重大,但我实在不明白谷歌为何对它如此高调。考虑到潜在市场的规模,CLG存在的这些问题注定它无法成为千万级出货量的产品。对于谷歌的一些合作伙伴(如Xreal)而言,这或许是个不错的小众市场。

因此,我更倾向于将Xreal的鸟盆方案和“平面棱镜”设计归类为便携式VR设备——它的“透视”功能是为VR体验服务的,让用户能看到周围环境,虽然透光率有些勉强。这类眼镜常与掌上游戏机(如Steam Deck)搭配使用,或者用于便携观影。所以很明显这与智能眼镜是截然不同的两类XR产品。

双引擎CLG(源自Ant Reality 2022年的Crossfire设计)

Swart还展示了一款“双引擎CLG”,这其实就是Ant Reality在2022年AWE大会上亮相的Crossfire方案。我早在2022年6月就与Brad Lynch在一期视频中讨论过这个概念。

img

img

Google 的 Raxium MicroLED 和 Magic Leap 是怎么回事?

尽管我认为 Google 在 CLG(共形激光导光)光学技术上谈论得太多,但他们对基于 2022 年收购 Raxium 公司所进行的 MicroLED 开发却只字未提(详见:Google XR 眼镜使用 Google 自家的 Raxium MicroLED,而波导实验室被卖给了 Vuzix)。据报道,Raxium 的 MicroLED 被用于其 XR 眼镜中,该产品曾在 Google I/O 2025 上展示过。此外,有传言称 Google 正在与 Magic Leap 合作开发衍射波导技术。我实在无法理解 Google 那种零散的技术收购策略(包括 Raxium MicroLED 和 Ant Reality),同时又与三星和 Xreal 等系统厂商进行合作的举动。

Meta

从新奇到必要:为下一个十亿用户扩展 AR 革命

演讲者:Jason Hartlove,Meta Reality Labs XDO 副总裁

img

在谈到 Jason Hartlove 在“AR/VR/MR 2026”上的演讲之前,我想先展示他在两个月前(2025 年 11 月)于湾区 SID 大会上的一张幻灯片。这与我 2025 年 5 月讨论的图表几乎相同(详见:Meta 和 Google 在 LCOS 与 MicroLED 或 LBS 路线图上的对比),但这张新图表现在加入了时间轴上的具体日期;最引人注目的是,它显示 MicroLED 在 2034 年左右成为主流,而激光显示(激光束扫描 LBS 或激光照明 LCOS)预计在 2034 年左右起步,直到 2043 年左右才成为主流。虽然绿色单色 MicroLED AR 眼镜今天已经可用,但全彩 MicroLED 似乎总是还需要“再等几年”。激光显示被推向了遥远的未来,大约 8 年后才开始萌芽,并需要近 18 年的时间才能成熟(这已经超出了大多数人的关注范围——请原谅我的怀疑)。我计划在 2026 年 9 月于埃因霍温举行的 MicroLED 和 ARVR Connect 大会上,主持一场关于各种显示技术(LCOS、MicroLED 和激光)优缺点的专题讨论。

据 Hartlove 称,Meta Ray Ban 显示眼镜 (MRBD) 的“销售额超出了 [预期] 300% 以上”。他提到了 MRBD 在成本和电池续航方面存在的问题,这些问题需要在未来的产品中加以解决。

Hartlove 在“AR/VR/MR 2026”的演讲中探讨了 Meta Ray Ban AI 眼镜(仅具备摄像头和音频功能,无显示屏)如何实现数百万台(据报道约 700 万台)的销量,以及这如何为带显示屏的 AR/AI 眼镜奠定基础。他进而讨论了 AI 如何赋能应用程序,以及显示屏将如何提升这些设备的功能。

img

img

然后,他讨论了将显示眼镜推向大规模生产所面临的挑战,主要是成本问题。部分成本是由光学堆栈/目镜的复杂性驱动的,Hartlove 将其称为“不可能的三明治”(The Impossible Sandwich)。

img

img

他演讲的核心内容是,要达到年产 1 亿台的目标——即每年约 12.5 亿部智能手机销量的 10% 以下——需要付出什么。Hartlove 粗略计算了波导显示器每年所需的玻璃晶圆产能,结果显示,如果智能眼镜达到智能手机的销量规模,其所需的晶圆产能将是台积电 (TSMC) 处理的半导体晶圆产能的 6 倍(见左下图)。虽然波导的制造复杂度和难度远不及半导体器件,但这仍然能让人了解未来任务的艰巨性。

随后,他利用处方 (RX) 模型作为指导(见右下图),基于 Meta 在非显示类 AI 眼镜上的经验,讨论了市场弹性与价格之间的关系。

img

img

Meta 的模型显示,相比普通处方(Rx)眼镜,其溢价空间为 $325 ± $80,或者相比非显示类 AI 眼镜的溢价为 $200;由此推导,每只眼睛的显示系统(包括光学器件、显示设备及相关电子元件)预算为 $100。这些数字似乎是指“市场定价”,而非成本溢价。更糟糕的是,这 $100 必须分摊给波导、显示光学器件、显示设备、电子元件,以及上述“不可能的三明治”中的各种光学组件。对于每一个组件来说,剩下的资金并不足以支撑其巨大的研发投入。

这里似乎隐含了一个假设:即价格溢价将以成本价的形式叠加,这意味着任何利润都必须来自“二级收入来源”,比如销售软件、服务和数据。也许是我遗漏了什么,但我正在努力厘清所呈现的这些数字,以及为了实现目标究竟需要做些什么。

由此他得出一个结论:要达到年产 1 亿台(100 million units)的规模,显示系统(显示屏、波导和电子元件)的成本必须降至每只眼睛 $100,即他所谓的“100/4/100”(以 $100 的成本实现 1 亿台的年销量)。

img

img

我并不同意“100/4/100”这一概念的前提,因为它完全弄错了限制 AR 眼镜发展的关键因素。对于高科技新产品而言,实用性远比成本更重要。如果一样东西确实有用,即使初始成本很高,也会有人买单;随着销量的增加,成本自然会下降(这是经典的科技学习曲线)。如果把成本作为首要驱动力,最终往往只会得到一堆没用的垃圾。

正如我多次提到过的,包括在《Apple Vision Pro(第一部分)——相比 Meta Quest Pro,苹果做对了什么》一文中,我并不同意那些认为 Vision Pro 太贵了的观点。Vision Pro 的问题在于它没能满足人们的需求。1977 年发布的 Apple II 基础售价为 1298 美元,按今天的货币计算超过 5000 美元。2007 年第一代 iPhone 问世时,大多数手机制造商都在专注于制造更小、更便宜的手机来扩大市场,且手机必须能轻松装进小衬衫口袋;事实证明,人们认为 iPhone 太实用了,因此愿意花更多的钱并接受更大的设备。你不可能靠像小鸟一样不停地叫着“便宜、便宜、便宜”(cheap, cheap, cheap)来创造出一款伟大的科技产品。

img

Hartlove 随后提出了每只眼睛 $100 的显示性能指标。这个最低要求与 Meta Ray Ban 显示器(除了成本外)非常接近。

仅支持 ±4 屈光度(且没有散光校正?)的基础要求似乎限制太多了。在“高端”类别中,虽然支持完整的处方镜片,但渐进多焦点镜片(progressive lenses)却不被支持,除非作为“未来趋势”。老花眼(远视)通常在 40 岁以后就会找上大多数人。我根据自己的经验知道,戴着隐形眼镜的同时还要戴没有渐进镜片的 AR 眼镜简直是一团糟。这变成了一场数字游戏,处方问题限制了可以使用 AR 眼镜的人群比例。我不愿相信渐进镜片的技术实现难度竟然与解决 VAC(辐辏调节冲突)或全息技术一样遥远。

“环境对比度”(显示屏尼特与环境光反射尼特的比值)似乎定义模糊:什么是环境光,这是否包含调光?为什么不直接说亮度和尼特值?而且,当对比度小于 10:1 时,色彩空间是 Rec 709a 的 85% 还是 124%,我认为没有什么区别。

img

Hartlove 在演讲的最后为“AR 联盟”(AR Alliance)做了推介。AR 联盟的前身是 LaSAR 联盟,最初由意法半导体(STMicroelectronics)于 2020 年创立,旨在推广激光扫描 AR 技术。2024 年,该联盟扩展至包含所有 AR 技术,并更名为 AR 联盟,Meta 成为创始董事会成员。2025 年 11 月,AR 联盟并入国际光学工程学会(SPIE)。曾任职于 Meta、现任罗切斯特大学扩展现实中心(CXR)主任的 Barry Silverstein 是 AR 激光显示技术的支持者,他在 AR 联盟内部主持了一场关于激光显示工作组的会议。

基于 SiN PIC 集成 PZT MEMS 悬臂梁的 AR 片上激光束扫描技术

演讲者:Oguzhan Avci,Meta 光学科学家

Meta 的光学科学家 Oguzhan Avci 展示了一种用于在芯片上生成和路由多组 RGB 激光束的 PIC(光子集成电路)。他还展示了如何将激光器与 PIC 结合,并集成 PZT(锆钛酸铅,一种压电材料)悬臂梁一维扫描仪。遗憾的是,此次演讲中他只展示了一个工作在 18 至 36 kHz 之间的原型,未提供有关该系统的详细信息。

img

img

虽然他没有提供系统示例,但该设备似乎与 Meta 在 AR/VR/MR 2025 大会上发表的《AR 眼镜基于 MEMS 的激光扫描显示进展》(Advances in MEMS-based laser scanning displays for AR glasses)中所述的“相干利萨茹扫描 (Coherent Lissajous Scanning)”概念有关(见下图)。该概念利用多组激光来扫描出多组平行的 RGB 激光束,从而在无需极高水平扫描速率的情况下支持更高的分辨率。根据我自 1998 年以来对激光扫描显示技术进展的观察,我对其在通过光栅扫描或利萨茹扫描进行多激光扫描时,修正所有不可避免的均匀性问题的能力持怀疑态度。我仍然怀疑该技术在 2043 年之前(即 Hartlove 图表中的时间点)是否能达到实用化,但在接下来的 17 年里,任何事情都有可能发生。我更倾向于看到那些在未来 5 年内就可能实现的技术。

img

img

其他即将讨论的主题与公司

在这里,我希望列出我在 2026 年 1 月见到或接触过的 60 多家公司中的大部分。我按类别对它们进行了分组,并附带了非常简短的业务描述。我计划在接下来的几周内针对其中许多公司撰写后续报道。

  • 头显与光学器件: Avegant(小型 LCOS 引擎及参考设计)、Cybersight(带波导的绿色 MicroLED)、Engo(小尺寸 OLED 眼镜)、Even Realities(绿色 MicroLED,轻量化 AR/AI 眼镜)、Everysight(小尺寸 OLED 眼镜)、Goeroptics/歌尔股份(光学引擎、衍射波导、碳化硅波导及头显制造)、Innovega(视力受损人群使用的眼镜和隐形眼镜)、Lynx(视频透视 XR)、Rokid(带波导的绿色 MicroLED)、INMO(Air3,采用一维反射式波导和 OLED)、TCL(带波导的全彩 X-Cube MicroLED)、Tozo(采用 Birdbath 方案的 OLED)、Vuzix(针对消费、工业和军事应用的各种尺寸头显,也是衍射波导供应商)、Xreal(采用 Birdbath 和平视棱镜的 OLED,并与 Android XR 有关联)。

  • 调光技术(非偏振): Flexenable(客-主型液晶,响应速度 >0.1 秒,双轴弯曲)、Goeroptics(电致变色,响应速度 >2 秒)。

  • 创新技术: A-Star(1 微米 LCOS,配备超材料纳米天线)、Gixel(可控视窗的微型镜阵列)、Kaist(透明微型 OLED)、Smith Display(带非线性波导的激光器)。

  • 激光显示技术: Appotronics(利萨茹扫描 LBS 引擎)、Brilliance(激光合束与驱动集成)、Indi EXALOS Lasers、Meta(基于 SiN PIC 集成 PZT MEMS 悬臂梁的 AR 片上激光束扫描仪)、南洋理工大学(光纤扫描显示——似乎是 Magic Leap 的 FSD 的翻版,见:Magic Leap 光纤扫描显示 (FSD) —— 核心部分的“大骗局”)、Sony(激光阵列和微型激光器)、VitreaLab(用于 LCOS 照明的激光路由导光板或 PIC)、MITRE(用于小型化高分辨率的单波导或扫描激光波导阵列)。

  • LCOS: Creal(FLCOS,激光照明和时间序列像素复制)、Kopin(小像素 FLCOS)、Raontech(LCOS、MicroLED 和 OLED——与 Int Tech 合作)。

  • OLED: Int Tech(首款 10 万尼特 OLED 微型显示器——使用 RaonTech 背板)。

  • MicroLED: Mojovision(采用量子点全彩转换的 MicroLED)、Plessey(原生彩色 MicroLED 和量子点颜色转换)、Porotech(多孔氮化镓 MicroLED)。

  • 处方镜片: Addoptics(由橡胶模具制成的树脂塑料镜片并支持电子集成)、Tobii(用于树脂塑料的玻璃模具并支持电子集成)。

  • 反射式波导: Lumus(70 度视场角,低成本且高效率的 30 度视场角方案)、Envision Photonics(带 OLED 微型显示器的一维反射式波导、约 30 度视场角的二维反射式波导、二维混合反射-衍射波导以及 60 度衍射波导)、INMO(一维反射式波导)、Optinvent(模压塑料的二维反射式波导)、Schott(反射式波导玻璃及制造、衍射波导玻璃晶圆)。

  • 衍射波导: Appotronics(包括来自单个 LCOS 投影仪的双波导衍射波导)、Goeroptics(碳化硅和玻璃衍射波导)、Envision Photonics(同上)、Dispelix(具有各种视场角和特性的衍射波导设计)、Mitsui Chemical(用于衍射波导的塑料晶圆,最大 12 英寸)、Mojie(塑料波导)、Morphonics(大规模衍射波导制造)、Magic Leap(衍射波导设计和制造)。

总结

很明显,产品不能贵到几乎没人买得起,就像我上面所言,我认为 Meta 的“100/4/100”概念存在缺陷,且至少在当前的开发水平下,可能会将技术引向错误的方向。我更希望看到一种哪怕售价在 2,000 美元甚至 3,000 美元,但能证明自身极具实用价值的产品;之后再让产量和技术去发挥作用来降低成本。回顾历史,例如汽车、计算机和手机的技术普及过程,都是通过创造出一些初期只有少数人买得起、但具备新颖实用价值的产品开始,随后依靠规模化和技术改进来驱动成本下降的。

我不明白为什么 Google/Android XR 会花掉近一半的演讲时间来谈论有线 XR 和他们的复合导光板(Compound Light Guide)。这个市场规模远不足以让 Google 感到兴奋。这或许是进入该领域的一种起步方式,但这更像是初创公司会谈论的内容,而非我对 Google 这种规模的公司所应有的期待。

作为一个在大公司和小公司都工作过的人,我觉得 Google 和 Meta 在 AR 上的做法令人费解。如今,我们要么看到的是为了迎合所谓“消费者成本价位”而显得极其孱弱的 AR 设备,要么就是如果不计入所有研发成本,单台造价就要数万甚至数十万美元的实验室项目(例如 Meta 的 Orion 以及在 Google I/O 上展示的 Raxium MicroLED 眼镜)。

关于“AI 是推动 AR 市场的解决方案”这一说法,目前仍有太多夸大其词的成分。我所看到的 AI 应用演示似乎都微不足道或过于聚焦细分领域。尽管翻译和提词器被作为案例提及,但这对大多数人来说并不是必需的。如果有人打算每天都佩戴这些 AR 眼镜,那么它们就必须具备许多人每天都会用到的应用功能。我希望看到像 Google 和 Meta 这样的大公司能够展示一些比其他公司都在展示的那些“陈词滥调”更高级的内容,并证明 AR/AI 何以能产生真正的吸引力,以及为什么它可能不仅仅只值每只眼睛 100 美元

*翻译自原文https://kguttag.com/2026/03/09/ces-ar-vr-mr-2026-quick-takeaways-part-1-android-google-xr-and-meta/

Share this on