数码之家

 找回密码
 立即注册
搜索
查看: 985|回复: 1

[业界] 基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能

[复制链接]
发表于 2023-10-21 10:33:18 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
英伟达研究院(NVIDIA Research)今天宣布,它已开发出一种名为"尤里卡"(Eureka)的新型人工智能代理,该代理由 OpenAI 的 GPT-4 支持,可自主教授机器人复杂的技能。
该公司在一篇博客文章中说,Eureka 可以自主编写奖励算法,它首次训练机器人的手像人类一样完成快速转笔技巧。尤里卡还教会了机器人打开抽屉和柜子、抛接球、操作剪刀等近30项任务。
"强化学习在过去十年中取得了令人印象深刻的胜利,但仍然存在许多挑战,例如奖励设计,这仍然是一个试错过程,"NVIDIA 公司人工智能研究高级主管、Eureka 论文的作者阿尼玛-阿南德库马尔(Anima Anandkumar)在博文中说。"Eureka是开发新算法的第一步,它整合了生成学习和强化学习方法来解决困难任务。"
NVIDIA Research还发布了Eureka人工智能算法库,供人们使用NVIDIA Isaac Gym(一款用于强化学习研究的物理模拟参考应用)进行实验。Isaac Gym基于NVIDIA Omniverse构建,Omniverse是一个基于OpenUSD框架构建3D工具和应用的开发平台。

基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能© 由 cnBeta.COM 提供



人工智能代理的热潮已持续数月之久,包括今年四月Auto-GPT、BabyAGI和AgentGPT等自主人工智能代理的兴起。

目前 NVIDIA Research 的工作建立在先前工作的基础上,包括最近的 Voyager,这是一个使用 GPT-4 构建的人工智能代理,可以自主玩 Minecraft。本周,《纽约时报》发表了一篇关于将聊天机器人转变为在线代理的文章,英属哥伦比亚大学计算机科学教授、曾担任 OpenAI 研究员的杰夫-克鲁尼(Jeff Clune)说:"这是一个巨大的商业机会,有可能带来数万亿美元的收益。这对社会有巨大的上升空间和巨大的影响。"
在一篇题为《Eureka:通过编码大型语言模型进行人类级奖励设计》的新研究论文中,作者说,"Eureka利用最先进的 LLM(如 GPT-4)非凡的零点生成、代码编写和上下文改进能力,对奖励代码进行进化优化"。
由此产生的奖励可用于通过强化学习获得复杂的技能。"在没有任何特定任务提示或预定义奖励模板的情况下,Eureka生成的奖励函数优于人类设计的专家奖励。在一套包含 10 种不同机器人形态的 29 种开源 RL 环境中,Eureka 在 83% 的任务中表现优于人类专家,平均归一化提高了 52%。"
"Eureka是大型语言模型与英伟达GPU加速仿真技术的独特结合,"英伟达高级研究科学家Jim Fan在博文中说,他也是该项目的贡献者之一。"我们相信,Eureka 将实现灵巧的机器人控制,并为艺术家提供一种制作物理逼真动画的新方法。"

发表于 2023-10-21 14:04:17 | 显示全部楼层
可以训练拔枪开枪技能。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2024-4-29 01:06 , Processed in 0.171600 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2023 smzj.net

快速回复 返回顶部 返回列表