首页
强化学习中agent与actor的区别
返回

强化学习中agent与actor的区别

2023-03-18 综合百科 By:佚名
最佳答案Agent无处理逻辑,只收lambda,用lambda加工自己的状态。Actor有逻辑,收消息,消息可以是数据也可以lambda,Actor处理消息。关键区别是:Actor有个主动过滤消息的过程;而agent没有,是被动的,不论什么lambda都要执行。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一...

Agent无处理逻辑,只收lambda,用lambda加工自己的状态。Actor有逻辑,收消息,消息可以是数据也可以lambda,Actor处理消息。关键区别是:Actor有个主动过滤消息的过程;而agent没有,是被动的,不论什么lambda都要执行。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的常见模型是标准的马尔可夫决策过程。

猜你喜欢
李小龙传奇插曲安静(李小龙传奇插曲)

李小龙传奇插曲安静(李小龙传奇插曲)

01-04 0 阅读
豆渣饼的做法家常做法窍门(豆渣饼的家常做法)

豆渣饼的做法家常做法窍门(豆渣饼的家常做法)

05-27 0 阅读
诗史是谁的诗歌(诗史是谁)

诗史是谁的诗歌(诗史是谁)

01-04 0 阅读
I9500 Root 线刷包(i9500 root)

I9500 Root 线刷包(i9500 root)

12-31 0 阅读
原谅我不能娶你(关于原谅我不能娶你的基本详情介绍)

原谅我不能娶你(关于原谅我不能娶你的基本详情介绍)

01-02 0 阅读
报童小学(关于报童小学的基本详情介绍)

报童小学(关于报童小学的基本详情介绍)

01-02 0 阅读
热门推荐
李小龙传奇插曲安静(李小龙传奇插曲)

李小龙传奇插曲安静(李小龙传奇插曲)

01-04 0 阅读
豆渣饼的做法家常做法窍门(豆渣饼的家常做法)

豆渣饼的做法家常做法窍门(豆渣饼的家常做法)

05-27 0 阅读
诗史是谁的诗歌(诗史是谁)

诗史是谁的诗歌(诗史是谁)

01-04 0 阅读
I9500 Root 线刷包(i9500 root)

I9500 Root 线刷包(i9500 root)

12-31 0 阅读
原谅我不能娶你(关于原谅我不能娶你的基本详情介绍)

原谅我不能娶你(关于原谅我不能娶你的基本详情介绍)

01-02 0 阅读
报童小学(关于报童小学的基本详情介绍)

报童小学(关于报童小学的基本详情介绍)

01-02 0 阅读
什么头什么尾四字成语

什么头什么尾四字成语

07-22 0 阅读
会面的英语单词怎么写(会面)

会面的英语单词怎么写(会面)

01-03 0 阅读
889(关于889的基本详情介绍)

889(关于889的基本详情介绍)

01-01 0 阅读
日本纤寄蝇(关于日本纤寄蝇的简介)

日本纤寄蝇(关于日本纤寄蝇的简介)

12-31 0 阅读