Meta推出世界模型V-JEPA 2 拥有先进的视觉理解和预测性能
美东时间周三,Meta推出了一款新的开源模型V-JEPA 2,可以让人工智能更好地理解3D环境并推理物理世界的运作规律。
Meta声称,V-JEPA 2是一款世界模型,可以帮助机器人和其他人工智能主体理解物理世界,并预测物理世界将如何对它们的行动做出反应。

据悉,这种被称为世界模型的系统从物理世界的逻辑中汲取灵感,并按照现实世界的规则构建内部虚拟环境,从而让人工智能能够以更接近人类的方式进行学习、规划和决策。
Meta表示,V-JEPA 2是一个拥有12亿参数的模型,经过了超过100万小时的视频训练,在物理世界中实现了最先进的视觉理解和预测性能。
例如,在Meta的新模型中,V-JEPA 2可以识别从桌子上滚下来的球会掉下来,或者隐藏在视野之外的物体不会消失。
Meta认为V-JEPA 2在自动驾驶汽车和送货机器人等方面的应用具有很多优势,因为它们需要在复杂多变的环境中安全地工作。
与依赖大量标记数据或视频片段的模型不同,V-JEPA 2通过简化后的“潜在空间”进行推理,以理解物体是如何移动、相互作用以及如何响应的。
根据Meta的说法,V-JEPA 2比英伟达的Cosmos模型快30倍,后者也试图发展与物理世界相关的人工智能。然而,Meta可能会根据不同于英伟达的基准来评估自己的模型。
Meta首席人工智能科学家Yann LeCun声称,让机器理解物理世界与让它们理解语言是截然不同的。“世界模型提供了一个虚拟的、简化版的现实世界,人工智能可以参考它来理解世界,预测其行为的后果,因此它将能够计划一个行动方案来完成给定的任务。”
LeCun补充说:“我们相信,世界模型将为机器人技术开启一个新时代,让现实世界中的人工智能助手能够在不需要海量训练数据的情况下,帮助人们完成家务和体力劳动。”
(文章来源:财联社)
- 信达策略:银行股上涨行情可能扩散到非银金融板块
- 亚马逊CEO告知员工:未来几年里 你们中的一些人会被AI抢走饭碗
- 【风口研报】固态电池重要会议密集召开 产业化进程有望加速
- 支持提取公积金付首付,西安发布楼市新政
- 西北两家上市银行“补血”计划密集获批,合计不超120亿元,银行“二永债”发行再提速
- 高水平通过FDA飞检 东北制药质量管控体系铸就国际市场“金钥匙”
- 西部黄金溢价14倍收购实控人金矿 过半资源为“推断”
- 辅助驾驶将有“国标” 将强制对驾驶员状态监测
- Meta推出世界模型V-JEPA 2 拥有先进的视觉理解和预测性能
- 农夫山泉“杀入”元气森林腹地
- Veloce Primo补全完整的SoC验证环境
- 有色金属行业今日净流入资金2.37亿元,紫金矿业等11股净流入资金超5000万元
- 续航短板?7.4V车载手持吸尘器驱动方案问题所在--【其利天下】
- 力积存储港股IPO,蓄力研发AI存算方案
- 深港携手,车联网协同进化揭秘,两地打出了哪些组合拳?
- 高压放大器在喷墨打印和电流体喷印中的作用和实验