DQN 简单入门

DQN简单入门背景描述这是一个走迷宫的过程回报矩阵描述为,也就是上图的一个转化,也就是所谓的Q(S,A)的值,行代表S现在状态,列代表A动作现在的状态S\下一步状态1234561-1-1-1-10-12-1-1-10-11003-1-1-10-1-14-1-1-10-1-150-1-1100-110
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×