网络资源管理系统.doc

约46页DOC格式手机打开展开

网络资源管理系统,页数 46字数 20885摘要强化学习是近几十年来迅速发展起来的一类机器学习算法,并且从1980年以来逐渐成为机器学习研究的一个比较活跃领域,引起了包括计算机科学、控制科学以及心理学领域的学者的极大关注。 所有的类型机器人或机制设计自控器对于科学家和工程师是具有很大的挑战性, 由早期的计算机时代至今。通...
编号:10-25630大小:650.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 猛龙 发布


网络资源管理系统
页数 46 字数 20885
摘 要
强化学习是近几十年来迅速发展起来的一类机器学习算法,并且从1980年以来逐渐成为机器学习研究的一个比较活跃领域,引起了包括计算机科学、控制科学以及心理学领域的学者的极大关注。
所有的类型机器人或机制设计自控器对于科学家和工程师是具有很大的挑战性, 由早期的计算机时代至今。通过机械控制可以模拟简单动物的行为,如步行或游泳, 在人工的机械装置中模拟或仿真在向外延伸上是非常困难的。这个论题是介绍人工神经网络和增强激发学习的一些技术帮助如何解决这样问题的研究。在许多领域的重要应用中找到控制动力系统的最佳的行动是至关重要的,例如,机器人技术,工业的加工和处理,或太空船中飞。通过对一些问题的研究使得一些主要的研究成果被应用到更高阶的理论问题中, 并且提供实际的方法建立有效率的控制器。
最后,对于外部环境动力学信息已知的强化学习问题,动态规划是解决它的好方法,经过分析发现,Dijkstra回溯是算法快速收敛的关键。本文对动态规划算法进行了深入地研究,并在动态规划算法的基础上进行了改进。



关键词 神经网络,强化学习,机器学习,动态规划;


目 录
摘要 …………………………………………………………………………….Ⅰ
Abstract ………………………………………………………………………..Ⅱ
第1章 绪论 ……………………………………………………………………1
1.1 人工智能 ...………………………………………………………………1
1.2 神经网络 .………………………………………………………………..2
1.3 机器学习 ………………………………………………………………...2
1.3.1 机器学习的基本原理 ………………………………………………2
1.3.2 机器学习的发展 ……………………………………………………4
1.3.3强化学习 …………………………………………………………….5
1.3.3.1 强化学习的现状及发展 .……………………………………..5
1.3.3.2 强化学习在神经网络中的应用 ……………………………...7
1.3.4进化计算 …………………………………………………………….7
1.4 本课题的意义及课题来源 .……………………………………………..8
1.5 本课题的主要内容 ……………………………………………………...8
第2章 强化学习模型及其主要算法 …………………………………………9
2.1 强化学习模型 .…………………………………………………………..9
2.2 值函数 ………………………………………………………………….10
2.3 强化学习的主要算法 ………………………………………………….11
2.3.1 动态规划 .………………………………………………………….11
2.3.2 蒙特卡罗算法 .…………………………………………………….12
2.4 小结 ……………………………………………………………………13
第3章 动态规划算法 ………………………………………………………14
3.1 动态规划算法提出的背景 .……………………………………………14
3.2 动态规划算法 ………………………………………………………….15
3.2.1 离散问题 …………………………………………………………..15
3.2.1.1 有限的确定的离散状态的决策过程 ...……………………..15
3.2.1.2 变量迭代 .……………………………………………………..16
3.2.1.3 策略的评估 .…………………………………………………..18
3.2.1.4 迭代策略 .……………………………………………………..19
3.3 连续问题 ……………………………………………………………….19
3.3.1 问题的定义 .……………………………………………………….20


3.3.2 问题的离散化 ……………………………………………………..21
3.3.3 收敛性问题 ………………………………………………………..22
3.4 简单例子 ……………………………………………………………….23
第4章 基于动态规划算法的改进及其应用 ………………………………25
4.1 动态规划算法的改进 .…………………………………………………25
4.1.1 算法的描述 ………………………………………………………..26
4.1.2 改进算法的证明
4.2 改进算法与动态规划算法的比较
4.3 例子
结论
参考文献
致谢
附录1
附录2