直接策略的RL直接优化目标函数，对策略进行参数化表示，与值函数相比，策略化参数的方法更简单，更容易收敛

点击这里，快速搜索网课答案！

人工智能导论知到智慧树答案2024 z13517

ꕁ︎︎

霸哥知到智慧树答案

人工智能导论知到智慧树答案2024 z13517

第一章单元测试 1、下列关于智能说法错误的是（） A:细菌不具有...

8月前
浏览 20
￥5

≡

+

↑