资源技术动态OpenAI发布Procgen Benchmark,防止AI模型过度拟合

OpenAI发布Procgen Benchmark,防止AI模型过度拟合

2019-12-10 | |  111 |   0

原标题:OpenAI发布Procgen Benchmark,防止AI模型过度拟合 

来源:人工智能媒体平台   [发表: KING]         链接:http://www.atyun.com/47688.html


在机器学习模型的训练方面,总是存在过度拟合(或过于接近)特定数据集的风险。实际上,流行的机器学习基准(例如Arcade Learning Environment)鼓励过度拟合并不是不可行的,只是因为它们不太重视泛化。

 image.png


这就是为什么OpenAI今天发布了Procgen Benchmark的原因,Procgen Benchmark是一组利用16种程序生成的环境(CoinRun,StarPilot,CaveFlyer,Dodgeball,FruitBot,Chaser ,Miner,跳线,Leaper,迷宫,BigFish,Heist,Climber,Plunder,Ninja和BossFight)来衡量模型学习通用技能速度的模型。它在初CoinRun工具集基础之上构建,该工具集使用过程生成来构建训练和测试级别集。

ezgif-4-3630016ea205.gif

 

OpenAI在博客中写道:“我们希望两全其美:一个包含许多不同环境的基准,每个环境从根本上都需要泛化。为满足这一需求,我们创建了Procgen Benchmark,以致力于实验上的便利,环境内的高度多样性以及环境之间的高度多样性。CoinRun现在成为Procgen Benchmark的首创环境,为其多样性做出了贡献。”


根据OpenAI的说法,Procgen环境的设计具有很大的自由度(受基本设计约束),从而为AI驱动的代理带来了有意义的通用化挑战。还对它们进行了校准,以确保基准代理在训练了2亿个时间步之后可以取得显着进步。

ezgif-4-595437be450c.gif


此外,Procgen环境支持两个“经过良好校准”的难度设置:简单和困难。(前者的目标用户是计算能力有限的用户,因为这需要大约八分之一的资源进行训练。)并且他们模仿了许多Atari和Gym Retro游戏的风格,与先例保持一致。


随着训练集的增长,AI模型的性能通常会提高。博客作者解释说:“我们认为,培训绩效的提高来自不同级别的隐性课程。如果在训练集中的各个级别进行概括,那么更大的训练集可以提高训练效果。”


OpenAI写道:培训和测试表现之间的巨大差距揭示了在按照固定级别的顺序进行环境的培训中一个关键的隐藏缺陷。OpenAI让未来的工作更加复杂,它相信这将为更强大,更高效的AI模型提供借鉴。

ezgif-4-0ab91494c637.gif


OpenAI先前发布了Neural MMO,这是一个“大规模多主体”虚拟训练场,可以在类似于RPG的世界中代理;而Gym则是强化学习算法的试验场。最近,它提供了SafetyGym,这是一套用于开发AI的工具,该AI在训练时遵守安全约束,并用于比较算法的“安全性”以及这些算法在学习过程中避免错误的程度。

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:别人家的高中生:入大学前,Ta详细梳理了GAN的发展脉络

下一篇:人工智能胶囊系统以最先进的精度区分物体

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...