据京东云介绍,京东云近期与领先学术机构合作,发表了题为《RL-VLA³:使用完全异步加速强化学习VLA》的研究论文。在本文中,我们首先提出并支持视觉-语言-动作(VLA)模型的完全异步强化学习训练框架。在LIBERO基准测试中,该框架的性能相比现有的同步训练策略可提升高达59.25%,经过广泛优化后可提升126.67%,为通用大规模机器人智能训练提供了新的AI基础架构范式。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号社交媒体平台用户上传并发布,提供仅 des 信息存储服务。
聚焦每日最新娱乐八卦与独家内幕,助你轻松掌握娱乐圈风云!