8月12日,2025世界机器人大会正式闭幕。此次展会仍然是各家企业的展示台,但比起单一技能的展示,多家企业正在将完整的场景搬至大会现场。在其背后,“泛化智能”的发展态势渐趋明朗,VLA(视觉—语言—动作)大模型作为高频词亮相于多个展台。
“今年尤其在人形机器人板块,出现了更多关于灵巧操作、高动态行为、复杂环境适应能力的展示。”机器人领域投资机构首程控股董事会办公室总经理康雨在大会现场告诉《证券日报》记者,“我们看到人形机器人能力维度从‘精准高效’向‘泛化智能’延展。从‘结构优化’到‘行为泛化’的转向已成为人形机器人产业新的方向”。
VLA大模型成大会高频词
来自银河通用的Galbot机器人忙碌在货架和收银台之间,有条不紊地从满满当当的货架上精准取出货物,并将货物放置在收银台上。
“很快北京的很多门店就都会上架我们的这款机器人产品了。”北京银河通用机器人有限公司(以下简称“银河通用机器人”)产品合伙人傅强在展台前告诉《证券日报》记者,这个场景的难点在于,人形机器人操作的货架物品摆放很满且密集,货品覆盖袋装、瓶装、挂钩类等多样化的产品。
他表示,为了让人形机器人能够适应实际应用场景中复杂多变的应用需求,银河通用机器人为人形机器人接入了该公司全自研的GroceryVLA大模型,基于大规模仿真数据和多场景训练,该模型可直接泛化至全新环境,使人形机器人能够拥有跨品类、跨物体的泛化能力。
北京星动纪元科技有限公司则展示了人形机器人在物流分拣场景中的相互协同的工作状态以及360度旋转等能力。工作人员告诉记者,机器人能够高效协同执行动作的技术为公司自研的通用端到端VLA具身大模型,它不仅能够驱动机器人完成复杂运动与操作,还可以让机器人具备持续进化的服务智慧,形成“数据采集-模型训练-场景落地”正向循环。
技术路径差异化渐显
此次大会上,多家展商在介绍产品时谈及产品背后的自研VLA大模型,同时机器人尤其是人形机器人多样化的技术路径亦随之浮现。
乐聚(深圳)机器人技术有限公司(以下简称“乐聚”)展出了全尺寸人形机器人“夸父”,以其卓越的“多面手”能力引发广泛关注。“夸父”不仅能流畅执行工业料箱搬运、物料分拣、SMT(表面贴装技术)料盘出库等工业任务,还能胜任商业服务场景下的前台接待、导览讲解以及5G-A户外远程配送等多样化任务,充分展现了人形机器人从实验室走向生产生活一线的稳定应用能力。
乐聚工作人员向记者介绍:“我们的工业场景应用采用分层规划与Model-based强化学习技术路线,即先构建环境模型,再基于此优化决策过程。此外,我们还结合了多模态具身模型,整合视觉与语言信息,用于环境感知、认知和动作生成。”
在深圳市优必选科技股份有限公司(以下简称“优必选”)的展台上,近二十台机器人正在进行着共同作业。优必选副总裁兼研究院院长焦继超告诉《证券日报》记者,在这个场景中,优必选展示了面向多任务工业场景的通用人形机器人群体作业解决方案。
谈及技术差异,焦继超认为,目前来看,VLA大模型仍需要进一步基于更多高质量的实际场景数据进行迭代,同时在成本方面,优必选的解决方案成本更低。从目前公司产品所深耕的工业场景来看,优必选人形机器人背后的多模态推理大模型已在多家车企工厂批量实训,能够完成搬运、分拣、质检等复杂工作。
焦继超告诉记者,优必选更关心产品商业化落地的速度。在他看来,机器人产业下一个值得期待的时间节点可能会出现在2027年前后,届时机器人产业有望迎来爆发式增长。“预计那时工业场景会迎来人形机器人的大规模落地,优必选每年的交付量也将达到万台级别。”
康雨认为,不同企业在VLA与强化学习等技术路径上出现差异在线股票配资查询门户,但这并不是“二选一”的问题。架构才是核心与底层问题,决定了后续的训练成本与效率。“一套优秀的模型架构可能只需极少的数据就能完成泛化,这正是核心竞争力。”
长胜证券提示:文章来自网络,不代表本站观点。