使用人工智能实时生成3D全息图
一种称为张量全息术的新方法可以为虚拟现实、3D打印、医学成像等创建全息图,并且可以在智能手机上运行。尽管多年来大肆宣传,但虚拟现实耳机尚未取代电视或电脑屏幕,成为观看视频的首选设备。原因之一:VR会让用户感到恶心。可能会导致恶心和眼睛疲劳,因为VR会产生3D观看的错觉,尽管用户实际上是盯着固定距离的2D显示器。更好的3D可视化解决方案可能在于为数字世界重新打造的60年前技术:全息图。
全息图提供了我们周围3D世界的特殊表现。另外,它们很漂亮。(继续-查看您的Visa卡上的全息鸽子。)全息图根据观看者的位置提供变换视角,并且它们允许眼睛调整焦深以交替聚焦于前景和背景。
长期以来,研究人员一直试图制作计算机生成的全息图,但该过程传统上需要一台超级计算机来进行物理模拟,这既耗时又可能产生不那么逼真的结果。研究人员说,现在,麻省理工学院的研究人员已经开发出一种几乎可以立即生成全息图的新方法——这种基于深度学习的方法非常高效,眨眼间就可以在笔记本电脑上运行。
“人们以前认为,使用现有的消费级硬件,不可能进行实时3D全息计算,”该研究的主要作者、麻省理工学院电气工程与计算机科学系(EECS)博士生梁石说。“人们常说,商用全息显示器将在10年内问世,但这种说法已经存在了几十年。”
Shi相信,这种被团队称为“张量全息术”的新方法最终将使这个难以捉摸的10年目标触手可及。这一进步可能会推动全息技术扩散到VR和3D打印等领域。
Shi与他的顾问和合著者WojciechMatusik共同完成了这项发表在《自然》杂志上的研究。其他合著者包括EECS和麻省理工学院计算机科学与人工智能实验室的李北辰,以及前麻省理工学院研究人员ChangilKim(现供职Facebook)和PetrKellnhofer(现供职于斯坦福大学)。
追求更好的3D
典型的基于镜头的照片会对每个光波的亮度进行编码——照片可以忠实地再现场景的颜色,但最终会产生平面图像。
相比之下,全息图对每个光波的亮度和相位进行编码。这种组合可以更真实地描述场景的视差和深度。因此,虽然莫奈的“睡莲”照片可以突出画作的色觉,但全息图可以使作品栩栩如生,呈现每个笔触的独特3D纹理。但是,尽管它们很现实,但全息图的制作和分享仍然是一个挑战。
最早于1900年代中期开发的早期全息图是以光学方式记录的。这需要分裂激光束,其中一半用于照亮对象,另一半用作光波相位的参考。这个参考产生了全息图独特的深度感。生成的图像是静态的,因此无法捕捉运动。而且它们只是硬拷贝,因此难以复制和共享。
计算机生成的全息通过模拟光学设置来回避这些挑战。但这个过程可能是一个计算过程。“因为场景中的每个点都有不同的深度,所以不能对所有点应用相同的操作,”施说。“这显着增加了复杂性。”指挥集群超级计算机运行这些基于物理的模拟可能需要几秒钟或几分钟才能获得单个全息图像。此外,现有算法不能以逼真的精度对遮挡进行建模。所以施的团队采取了不同的方法:让计算机自学物理。
他们使用深度学习来加速计算机生成的全息图,从而实现实时全息图生成。该团队设计了一个卷积神经网络——一种使用一系列可训练张量来粗略模拟人类如何处理视觉信息的处理技术。训练神经网络通常需要一个大型、高质量的数据集,而3D全息图以前不存在这种数据集。
该团队建立了一个包含4,000对计算机生成图像的自定义数据库。每对匹配一张图片——包括每个像素的颜色和深度信息——与其对应的全息图。为了在新数据库中创建全息图,研究人员使用了形状和颜色复杂多变的场景,像素深度从背景到前景均匀分布,并使用一组新的基于物理的计算来处理遮挡。这种方法产生了逼真的训练数据。接下来,算法开始工作。
通过从每个图像对中学习,张量网络调整了自己计算的参数,连续增强了其创建全息图的能力。完全优化的网络运行速度比基于物理的计算快几个数量级。这种效率让团队自己感到惊讶。
“我们对它的表现感到惊讶,”Matusik说。在短短几毫秒内,张量全息术可以根据具有深度信息的图像制作全息图——这些信息由典型的计算机生成图像提供,并且可以通过多摄像头设置或激光雷达传感器(两者都是一些新智能手机的标准配置)进行计算。这一进步为实时3D全息技术铺平了道路。更重要的是,紧凑型张量网络需要不到1MB的内存。“考虑到最新款手机上有数十和数百GB的可用空间,这可以忽略不计,”他说。
这项研究“表明真正的3D全息显示器是实用的,只需要适度的计算要求,”微软首席光学架构师乔尔科林说,他没有参与这项研究。他补充说,“与之前的工作相比,这篇论文的图像质量有了显着的提高”,这将“为观看者增添真实感和舒适感”。Kollin还暗示了像这样的全息显示器甚至可以根据观众的眼科处方进行定制的可能性。“全息显示器可以校正眼睛的像差。这使得显示图像比用户使用隐形眼镜或眼镜看到的更清晰,这只能校正低阶像差,如聚焦和散光。”
“相当大的飞跃”
实时3D全息将增强从VR到3D打印的一系列系统。该团队表示,新系统可以帮助VR观众沉浸在更逼真的风景中,同时消除长期使用VR带来的眼睛疲劳和其他副作用。该技术可以轻松部署在调制光波相位的显示器上。目前,大多数经济实惠的消费级显示器仅调节亮度,但如果广泛采用相位调制显示器的成本会下降。
研究人员说,3D全息还可以促进体积3D打印的发展。事实证明,这项技术比传统的逐层3D打印更快、更精确,因为立体3D打印允许同时投影整个3D图案。其他应用包括显微镜、医疗数据可视化以及具有独特光学特性的表面设计。
“这是一个相当大的飞跃,可以彻底改变人们对全息的态度,”Matusik说。“我们觉得神经网络就是为这项任务而生的。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订