资源行业动态强化学习,深度学习的合作伙伴

强化学习,深度学习的合作伙伴

2019-12-12 | |  61 |   0

原标题:强化学习,深度学习的合作伙伴

来源:AI 研习社  [ 发表: KING ]          链接:http://www.atyun.com/48039.html


今年,我们已经看到了有关AI深度学习的许多研究。借助最新的研究成果,深度学习证明了其在许多行业中执行诸如图像识别、语音识别、价格预测之类任务的实用性。深度学习有一个相对未知的合作伙伴:强化学习。当AI研究人员冒险进入未知的学习领域并尝试提供AI学习功能,强化学习将发挥关键作用。 

 image.png


什么是强化学习? 

想象一个通过与环境互动来学习的孩子。每次互动都会产生一种感觉,可以带来反馈。例如,花的宜人香味会诱使孩子再次去闻花的气味。花茎刺引起的疼痛会提醒孩子,避免再次触摸茎梗。 


在每种情况下,当孩子与环境互动时,环境都会通过反馈孩子不同的感觉来往复运动并教给孩子。这孩子正在反复试验中学习。 


这就是强化学习。在强化学习中,主体从中立状态开始,然后在采取措施时,环境帮助主体从中立状态过渡到其他状态。在这些其他状态下,可能会对主体有所反馈。

1576137815280903.png

 

强化学习的应用


强化学习已经在许多行业中广泛使用,例如制造、库存管理、交付管理和金融。


在制造业中,机器人使用强化学习在装配线上精确地按顺序学习特定任务。 


在交付管理系统中,强化学习可用于在不同路线的不同车辆之间划分客户的订单,以到达目的地。 


在金融行业中,强化学习用于评估实现金融目标的交易策略。 


大多数时候,这些强化学习算法与深度学习算法集成在一起,以创建可以处理更复杂任务的深度强化学习算法。 

1576137852827597.png

 

强化学习在人工智能中的作用


人工智能研究的最重要方面之一是强化学习领域。深度学习使AGI能够发现隐藏的模式以建立联系,而强化学习使AGI可以进行抽象以理解模式背后的含义并进而指导行为。 


在深度强化学习中将深度学习与强化学习相结合时,AGI可以计划,理解和制定应采取的行动。 


DeepMind的MuZero算法就是一个例子,它是一种深度强化学习算法,能够构造代理,这些代理可以在不知道规则的情况下计划如何下棋和下棋。 


这是人工智能的第一步。 


如果AI可以使用有限的数据来计划,理解和制定行动计划,而无需明确地“教导”,那么AI就会更接近实现通用情报。 


结论

在未来,我们可能会看到深度强化学习算法在不同行业中的更多应用。这是一个令人兴奋的时刻。随着不同行业中的许多应用,这些算法的使用将变得更加普遍和复杂。通过大量的研究和应用迭代,我们可以真正看到有一天可能实现通用智能的AI的潜力。 

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:语音识别揭秘,它与人工智能是什么关系?

下一篇:Facebook、微软等公司联合推出了Deepfake检测挑战

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...