您的位置:财经 > 正文

LIBERO评测榜刷新:具身智能从“炫技”走向“实用”_每日快看

来源:中国经营报 时间:2026-06-01 12:05:04


(相关资料图)

近日,深圳具身智能企业越疆科技公布了其自研“空弈DobotWAM”具身大模型在LIBERO基准上的评测结果。在LIBERO包含的四个标准任务套件中,该模型取得平均99.25%的成功率,是目前该榜单上已公开数据中的最高分。同一榜单上,还包括π0.5、π0、GR00T-N1.5、π0+FAST等外界较为熟悉的模型。

LIBERO是具身智能领域一套标准化的操作能力评测基准,下设四个子套件,分别对应不同的能力维度:LIBERO-Spatial考察空间关系理解,LIBERO-Object考察对物体外观和类别变化的泛化能力,LIBERO-Goal考察任务目标与指令理解,LIBERO-10则聚焦长时序、多步骤任务的执行。根据越疆科技公布的数据,空弈DobotWAM在LIBERO-Object上实现了100%成功率,在其余三个套件上均达到99%。

这一成绩背后,是行业近两年在具身智能技术路线上演进的缩影。当前,视觉—语言—动作模型已成为具身智能动作生成的主流范式,在数据覆盖充分、任务边界清晰的场景下展现出了较高效率。但不少从业者也观察到,过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,容易出现动作漂移、目标丢失或局部动作正确而全局任务失败的问题。如何让模型超越单纯的“模仿”,建立起对动作深层次结构的理解,成为行业集中攻关的方向。

从越疆科技披露的技术信息来看,空弈DobotWAM的技术架构反映了这一思路。它在视觉—语言—动作建模的基础上,引入了四项互相配合的设计:一是3D-Aware Spatial Representation,将三维空间信息显式引入模型,使其能够感知物体位置、空间关系与操作目标之间的几何结构,而非仅依赖二维图像纹理;二是Joint Dynamic Geometry Loss,在训练损失函数中融入机器人关节动态信息与末端执行器几何约束,使模型在生成动作时更贴近真实运动学规律,减少轨迹漂移和姿态不连续;三是Advanced VLM Task Decomposition,利用高级视觉—语言模型骨干对复杂指令进行语义理解与任务拆解,将长流程操作分解为阶段性子步骤;四是High-Quality Data Flywheel与Real-Robot Recap机制,以真机实验为核心构建数据闭环,持续吸收成功、失败及长尾场景的真实经验,以提升从仿真基准到真实环境的迁移能力。

据了解,越疆科技本身在协作机器人领域有多年积累,这一背景使其在获取真实机器人操作数据、理解物理交互特性方面具有先天条件。其公布的高精度接触类任务测试案例——插充电器和插笔帽——也指向了同样的方向:这两项任务考验的是小目标定位与姿态估计、强几何约束下的末端控制,以及接触过程中的稳定执行与误差修正能力。这类任务的连续稳定完成,在当前行业内仍被视为高难度挑战。

从行业层面看,空弈DobotWAM的发布是具身智能从展示型动作向真实场景操作能力迈进的一个案例。行业评价标准正在从“能否完成单次演示”,转向“能否在动态、多变环境中稳定可靠地执行长流程任务”。这一转变对模型的空间理解、任务规划和持续进化能力提出了更高要求。如何在更大范围、更开放的真实场景中保持此类高成功率,仍是包括越疆科技在内的所有具身智能企业需要持续验证的课题。

精彩推送

公司

一系列金融支持民营经济、民营企业发展的政策举措正密集出台加速落地。

详细>>

9月份以来,人民币汇率持续走低。9月8日,离岸人民币对美元汇率盘中最

详细>>

国家统计局发布的数据显示,8月份,全国居民消费价格指数(CPI)同比上

详细>>

国家统计局9月9日发布的数据显示,8月全国居民消费价格指数(CPI)同比

详细>>

今年前8个月,郑州商品交易所累计成交量约25亿手,同比增长64%。这是记

详细>>

中国电影观众满意度调查2023年暑期档调查结果显示,暑期档电影观众满意

详细>>