AIGC 施展“物理魔法”,3D视觉突破“精度极限”
文|姚悦
【资料图】
编|王一粟
“没有艺术,全是物理!物理让你快乐,不是吗?”
近日,在世界计算机图形会议 SIGGRAPH 2023 上,英伟达创始人、CEO 黄仁勋宣布,将生成式AI与仿真模拟平台Omniverse结合的时候,如同他宣布“AIGC是iPhone时刻”一样兴奋。
不同于大语言模型只能应用在图文,有了基于物理规律的仿真模拟平台,生成式AI就可以直接用到现实世界。
除了黄仁勋,美国斯坦福大学李飞飞团队,近期也将大模型接入机器人,不仅使得机器人能够与环境有效交互,还能够在无需额外数据和训练的情况下完成各种任务。
“基于物理世界模拟的生成式AI,是生成式AI 2.0”,跨维智能创始人、华南理工大学教授贾奎对光锥智能表示,与具身智能的结合,生成式AI 将发挥出更确定性的作用。
而随着通用能力的增强,AI也有望打破商业化的“魔咒”。
当生成式AI学会物理
将生成式AI与物理世界结合,并不容易,这里面涉及的技术链条非常长。
首先,需要对物理世界基本规律的掌握,才能将真实世界建模到仿真模拟平台。
仿真模拟平台,不仅可以仿真物理场景,还可以模拟真实世界中物体之间相互作用、运动和变形。
而生成式AI的加入,会让仿真模拟平台拥有“预演”能力。
“人类从小就知道的物理常识,AI却不知道。”黄仁勋表示,“生成式AI和仿真模拟平台结合,就是要让AI的未来能够在物理上扎根。”
黄仁勋进一步解释,让AI在虚拟世界中学习如何感知环境,并通过强化学习来理解物理行为的影响和后果,让AI实现特定目标。
这就需要用生成式 AI,预测物理世界中的千万种、甚至上亿种可能性,形成有价值的合成数据。
比如机械臂需要通过3D视觉的“眼睛”才能精准抓取,但如何排除环境变化的干扰,认出待抓取的物体(比如工厂里的零部件)?
通过仿真模拟平台掌握了“光线对场景目标的反射、折射影响”等物理规律,生成式 AI就能预测模拟出一个瓶子,在不同场景光照下,周身不同的反光程度;同一光照下,金属、塑料、木制品等不同材质物体表面呈现的状态;一堆钉子,所有可能出现的散落状态……
再次,需要将所有数据,都在仿真模拟平台中用AI都跑一遍。
这一步,就是在训练3D视觉大模型。区别于大语言模型,3D视觉大模型对于理解和推理视觉场景的组成特性至关重要,需要处理对象之间的复杂关系、位置、以及现实环境中的变化等。
最后,再连接上机械臂等具身智能的硬件,才能让其学会智能化操作。
可以看到,生成式AI与物理世界结合的整个技术链条,不仅涉及物理学、图形学、计算机视觉、机器人多学科交叉,还包括数字孪生、几何深度学习、运动学解算、混合智能、智能硬件等多维前沿技术。
相应的,整个产业的链条也比较复杂,需要从数据到模型,再从模型到部署。
在这些环节中,有一个节点和此前AI的路径非常不同,那就是“合成数据生成”。
用基于物理规律的生成式AI合成的数据,去训练大模型,将给实体产业带来跨越式的革命。
不用一张真实图片,训练3D视觉大模型
为什么不直接用真实数据训练大模型?
目前,行业内多数基于3D视觉的机械臂,其控制系统的算法训练所使用的就是真实数据。因为商业隐私等问题,这些真实数据很难在通用数据中获取,基本都是企业自行采集。
然而,自采真实数据,首先在“效率和成本”这两个运营的关键指标上,性价比就非常低。
这是因为,终端应用场景碎片化,数据根本不能通用。采集真实数据,企业就需要一个一个行业,一个一个工厂,一个一个场景的“地毯式”采集。而且,采集回来的数据也不能直接用,还需要进行一系列处理。
这个过程中,甚至产生了“人工智能悖论”。
“采集真实数据,AI技术的成本构成中,半数以上都是数据成本,而对数据的采集、清洗、标注、增强等处理过程,往往是大量人力堆积的结果。”有分析人士就曾指出,人工智能的本质是代替人工的智能。“讽刺的是,这样的AI具备显著的劳动密集型产业特征。”
如果用合成数据呢?
“用五六年、上千个案例积累的真实数据,通过合成数据,几天几周就能完成。”贾奎告诉光锥智能,相比于人工采集与标注数据,合成数据的成本能够实现几个数量级的降低。
最关键的还是,在训练效果上,合成数据能够更优于真实数据。
由于本身就是基于物理规律合成,合成数据天生自带绝对精确的标注,这就意味着,AI学习起来效率非常高。
另外,合成数据的“全面性”是真实数据难以比拟的。“生成式AI 2.0可以创造无数个世界,而且可以让这个世界快速演进。”贾奎表示。
而落地到3D视觉行业,机械臂就犹如有了“上帝之手”,可以掌控一切过去未来。
“当然,这不能是物理世界的规律之外的。”贾奎强调。
“目前,我们不使用一张真实图片,就可以完成机械臂复杂场景作业的3D视觉模型训练。”贾奎告诉光锥智能,完全使用合成数据训练的模型引导机械臂的柔性操作,可以实现现场99.9%以上的稳定抓取。
也正是因为此,合成数据,被称为大模型的“数据永动机”。
当前,除了3D视觉领域,许多领域也都因通用数据缺乏和噪点多等问题,开始尝试使用合成数据。但也有对合成数据抱有强烈质疑的观点,称如果没有经过精心调试,在训练时大量使用,会引发模型崩溃,造成不可逆的缺陷。
从技术演进的角度,合成数据不会是大模型的唯一解。
但贾奎指出,“没有找到更好的办法之前,合成数据就是目前能够解决实际问题的最好办法。如果还采用人力堆砌的真实数据,在包括3D视觉在内的很多领域,AGI(通用人工智能)永远不可能实现。”
打破AI的商业化“魔咒”
在机器视觉领域,对合成数据的需求更加旺盛,生成式AI 2.0能够释放的价值也就会更大。
作为机器视觉非常重要的感知手段,3D视觉对于合成数据的需求就十分迫切。
“在一堆相似的零件里‘找不同’,物体换一个材质、颜色,都需要去调整参数。”一位3D视觉从业人士表示,不同领域的需求不同,使得落地场景过于碎片化,只能做完一个项目再重新定制另一个项目。
这就意味着,企业很难通过着力解决一个或几个项目需求,就能形成标准化产品。也就无法进而通过快速复制,打入并拓展市场,追求利润规模。
边际成本难以降低,会将一家技术公司,变成项目公司,最终拖垮。
“魔鬼”藏在细节中。
传统3D视觉感知有多脆弱?贾奎向光锥智能描述,“机械臂在抓取过程中,如果有人路过产生光线变化,任务就可能失败。”
这是由硬件3D相机的成像原理造成的,3D相机成像容易受环境、物体形状、材质、颜色、散射介质等影响,而且这一问题短时间内难以解决。
“解决一个问题可能是一百步,但最后一步付出的努力可能跟前面99步加起来是一样的。”商汤科技联合创始人杨帆曾表示,企业大部分的精力都需要用来应对小部分长尾问题。
但现在,“通用性能力很强的生成式AI 2.0,能够解决长尾问题,对于产品标准化至关重要。”贾奎表示。
相较于行业传统定制化开发的模式,企业基于生成式AI 2.0,就可以利用通用大模型,实现产品模块化开发,做到开箱即用地部署,进而实现同行业直接拓展,不同行业也能有效复用。3D视觉行业的商业化难题也就迎刃而解。
与此同时,数据、开发、部署、硬件、行业拓展,每一个环节的成本也都实现骤降。
而在生成式AI 2.0的催化下,3D视觉一旦爆发,也就意味着,在机械臂、机器人、无人驾驶、元宇宙等等高度依赖3D视觉技术的垂直场景,都将加速吃到AI的红利。
不少数据已经印证了这一点,像数据标注、合成数据、工业机器人、机器视觉等领域,全球市场规模都在高速增长,尤其是合成数据的年复合增长率甚至都超过了30%。
这背后,实际上是生成式AI 2.0的战略价值,已经受到了科技和众多制造业巨头的高度重视。
从西门子、福特等老牌制造企业,到英伟达、特斯拉、谷歌等一众科技巨头,再到Waabi等明星初创公司,都开始纷纷在工业、机器人、无人驾驶、医疗、零售等诸多领域,探索生成式AI 2.0更大的可能。
与此同时,资本的热情也被极大地调动起来。据不完全统计,近年来,国外合成数据的相关融资,累计已接近8亿美元。
在国内,合成数据相关企业也同样引起了资本的注意。2022年6月,跨维智能宣布完成Pre-A轮融资,融资金额数千万元,成立不到一年时间累计融资近亿元;今年7月,光轮智能也宣布完成天使+轮融资,融资金额累计数千万元。
可以说,从会作诗到学物理,生成式AI 2.0正在开启一个产业数字化的宏大未来。
标签:
为您推荐
- 小麦玉米价格高位回落,为何粮库1.53元依旧收不到粮?
- 兜牢民生底线 增进民生福祉丨周海鹰走访调研区民政局
- 华声漫评:铁腕治污,不容弄虚作假
- 赞美孩子的奖状的句子
- 8月18日生意社冰晶石基准价为7850.00元/吨
- 海南龙塘大坝项目二期首片预制梁顺利浇筑完成
- 记者:拜仁与佩雷茨达成口头协议,拜仁报价200万欧+奖金
- 表扬孩子们棒棒的句子
- 信维通信:拟收购维仕科技约96.84%股份
- 影史第一!2023暑期档票房破纪录
- 厦门哪些银行站点能办理带押过户
- 「广东」东莞市新山科技有限公司对医用外科口罩主动召回
- 菲佣是什么意思(关于菲佣是什么意思的基本详情介绍)
- 鼓励生育 杭州又成“模范生”| 新京智库
- 长城华西银行将发行5亿元绿色金融债
- 219期祥子福彩3D预测奖号:百位参考
- 恒誉环保(688309):8月17日技术指标出现看涨信号-“红三兵”
- 8月17日生意社烧碱基准价为758.00元/吨
- 喷墨打印机销量不断增加:大墨仓设计、低打印成本、多功能
- 世贸组织发布美诉中方针对美钢铝232关税措施的反制措施世贸争端案专家组报告,商务部回应
- 1手机怎样查银行卡余额农业银行短信(手机怎样查银行卡余额)
- 2纳斯达克中国金龙指数跌2%
- 3广安:守好“米袋子” 全力保丰收
- 4瑞达期货:短期生猪震荡走势
- 5云南白药现4.02亿元折价大宗交易
- 6抢抓未来产业新机遇
- 7东北暴雨,水稻等粮食作物影响几何?
- 8江苏有哪些城市和县城 江苏有哪些城市
- 9中电兴发:8月15日融资买入332.63万元,融资融券余额1.8亿元
- 10体坛联播|梅西连续6场比赛进球,张帅因伤退出美网
- 1杭州亚运会线上火炬传递活动“跑”进北京、广州、杭州
- 27月外汇市场运行保持理性有序
- 3学校气象灾害敏感单位认证管理与实践(关于学校气象灾害敏感单位认证管理与实践简述)
- 4董鹿生(关于董鹿生简述)
- 5河北省承德市2023-08-15 21:36发布雷电黄色预警
- 6连锁品牌下沉乡村市场 多方发力充实百姓“钱袋子”助力消费提质
- 7丰泽区城东街道:成立街道级国企和招商中心 硬招实招力促高端综合服务区发展“加速跑”
- 8机器人控制方法、机器人控制系统及控制逻辑配置方法(对于机器人控制方法、机器人控制系统及控制逻辑配置方法简单介绍)
- 9恐龙骨奖励(巨型恐龙骨头怎么兑换)
- 10宣恩“信用+风险”监管助企稳健发展
- 看手机的几秒钟,车报废了 | 覆车之戒
- 快讯2023-08-15 12:17:52
- 售价18.98万元起 长安神骐T30EV正式上市
- 美国夏威夷毛伊岛大火死亡人数升至99人
- 定位百万级超跑,广汽埃安昊铂 Hyper SSR 完成工信部申报
- 大规模超前点映,是“不讲武德”还是市场选择?
- 她比学生还会玩 课堂活动都有趣 “向日葵老师”带孩子在玩中长本事
- 新加坡经济增长不及预期
- danny brown(关于danny brown的介绍)
- 禾美农业拟收购安徽禾美51%的股权消除潜在竞争风险
- 杭州亚运会竞赛项目调整为40个大项、61个分项、481个小项
- 中国黄金:上半年归母净利润同比增长22.31%至5.37亿元 黄金产品销量增加及金价上涨
- 夏季行动 | 榆阳公安:坚持破案挽损同步推进全面回应群众迫切期盼
- 大宗交易:紫金矿业成交3.09亿元,成交价12.32元(08-14)
- 8月14日巨人网络涨5.74%,华夏中证动漫游戏ETF基金重仓该股
- 灾后重建:人民子弟兵全力以赴
- 公路边惊现男尸,是谁害死了他
- m202四联火箭筒_202 61 88 12
- 争取中国支持,乌克兰找对了路,中方交的底,没打消俄方的顾虑
- 银河基金袁曦:洞察行业景气度 做长期正确的事