毕业设计论文 高斯消去法求解线性方程组.doc
约43页DOC格式手机打开展开
毕业设计论文 高斯消去法求解线性方程组,43页共计16900字摘 要高斯消去法是求解线性方程组的最基本的方法之一。为了充分利用gpu (graphics processing unit,图形处理器)的并行处理能力,本文改进了高斯列主元消去法的实现过程,从而提高了求解线性方程组的速度。并研究了在不同方程组阶数下,gpu对这此算法的加速效果。nvidia新近推出...
内容介绍
此文档由会员 bfxqt 发布
43页共计16900字
摘 要
高斯消去法是求解线性方程组的最基本的方法之一。为了充分利用GPU (Graphics Processing Unit,图形处理器)的并行处理能力,本文改进了高斯列主元消去法的实现过程,从而提高了求解线性方程组的速度。并研究了在不同方程组阶数下,GPU对这此算法的加速效果。NVIDIA新近推出的GPU计算平台采用矩阵型的计算架构,对处理大型矩阵具有极大的优势,且相对CPU有着更高的算法可并行性和计算效率。本文力图基于GPU的CUDA开发环境,利用GP-GPU的计算特性实现求解线性方程组,以提高算法的运行效率。最后,本文用C语言实现了高斯列主元消去算法求解线性方程组的基本过程,并分别在NVIDIA GPU并行计算平台和Intel CPU计算平台上加以运行,同时进行了两种计算平台上算法实现的性能比较。
目 录
第一章 绪论 1
1.1 引言 1
1.2 论文研究背景 1
1.3 论文研究的目的和意义 2
1.4 论文结构安排 3
第二章 求解线性方程组的基本理论 4
2.1 高斯-约当消去法 4
2.2 矩阵三角分解法 5
2.2.1 直接三角分解法 5
2.2.2 追赶法 5
2.3 平方根法 6
2.4 迭代法 6
2.5 高斯消去法 7
2.6 高斯列主元素消去法 10
第三章 NVIDIA CUDA并行计算平台 12
3.1 GPU 技术简介 12
3.2 CUDA介绍 14
3.3 CUDA编程模型 18
3.4 应用程序接口 21
3.4.1 C编程语言扩展 21
第四章 功能实现和相关函数介绍 23
4.1 程序在CPU上的实现 23
4.1.1高斯列主元消去算法实现过程 23
4.1.2 各文件中的主要功能函数介绍 25
4.2 程序在GPU上的实现 27
4.2.1 CU文件中C语言的扩展 27
4.2.2 CU文件编写过程 30
4.2.3 并行性实现 32
4.3性能比较与结果分析 33
第五章 总结与展望 37
致谢 38
参考文献 39
关键词:求解线性方程组;高斯消去法;GPU;CUDA;并行计算
参考文献
[1] . 都志辉.《高性能计算并行编程技术—MPI并行程序设计》.北京:清华大学出版社.2001.8
[2]. Barry Wilkinson,Michael Allen. 陆鑫达 等译. 《Parallel Programming》(并行程序设计).北京:机械工业出版社,2002.1
[3]. Michael J.Quinn. 陈文光 武永卫 等译. 《MPI与OpenMP并行程序设计》.北京:清华大学出版社,2004.10
[4]. 陈国良. 《并行计算—结构 算法 编程(修订版)》.北京高等教育出版社.2003
[5]. 陈国良,安虹,陈凌等. 《并行算法实践》.北京:高等教育出版社.2004
[6]. Ananth Grama,Anshul Gupta,George Karypis,Vipin Kumar. 张武 等译.《Introduction to Parallel Computing》(并行计算导论). 北京:机械工业出版社 2005.1 第2版
[7]. William H.Press, Saul A.Teukolsky, William T.Vetterling, Brian P.Flannery. 傅祖娜 等译. 《Numerical Recipes in C》(C数值算法). 北京:电子工业出版社 2004.1 第2版
[8]. QuinnU J.Designing efficient algorithms for parallel computers.MCGraw-Hill,1987
[9]. 徐士良 数值分析与算法 机械工业出版社
[10]. 马东升,雷勇军.《数值计算方法》.机械工业出版社 2006.9
[11]. Matt Pharrs,GPU精粹2——高性能图形芯片和通用计算编程技巧.清华大学出版社 2007年5月
[12] . NVIDIA. Nvidia CUDA Compute.
[13]. J. Nickolls and I. Buck,“NVIDIA CUDA software and GPU
parallel computing architecture”. Microprocessor Forum,May 2007.
[14]. 谭浩强,C程序设计.清华大学出版社 2005年7月
摘 要
高斯消去法是求解线性方程组的最基本的方法之一。为了充分利用GPU (Graphics Processing Unit,图形处理器)的并行处理能力,本文改进了高斯列主元消去法的实现过程,从而提高了求解线性方程组的速度。并研究了在不同方程组阶数下,GPU对这此算法的加速效果。NVIDIA新近推出的GPU计算平台采用矩阵型的计算架构,对处理大型矩阵具有极大的优势,且相对CPU有着更高的算法可并行性和计算效率。本文力图基于GPU的CUDA开发环境,利用GP-GPU的计算特性实现求解线性方程组,以提高算法的运行效率。最后,本文用C语言实现了高斯列主元消去算法求解线性方程组的基本过程,并分别在NVIDIA GPU并行计算平台和Intel CPU计算平台上加以运行,同时进行了两种计算平台上算法实现的性能比较。
目 录
第一章 绪论 1
1.1 引言 1
1.2 论文研究背景 1
1.3 论文研究的目的和意义 2
1.4 论文结构安排 3
第二章 求解线性方程组的基本理论 4
2.1 高斯-约当消去法 4
2.2 矩阵三角分解法 5
2.2.1 直接三角分解法 5
2.2.2 追赶法 5
2.3 平方根法 6
2.4 迭代法 6
2.5 高斯消去法 7
2.6 高斯列主元素消去法 10
第三章 NVIDIA CUDA并行计算平台 12
3.1 GPU 技术简介 12
3.2 CUDA介绍 14
3.3 CUDA编程模型 18
3.4 应用程序接口 21
3.4.1 C编程语言扩展 21
第四章 功能实现和相关函数介绍 23
4.1 程序在CPU上的实现 23
4.1.1高斯列主元消去算法实现过程 23
4.1.2 各文件中的主要功能函数介绍 25
4.2 程序在GPU上的实现 27
4.2.1 CU文件中C语言的扩展 27
4.2.2 CU文件编写过程 30
4.2.3 并行性实现 32
4.3性能比较与结果分析 33
第五章 总结与展望 37
致谢 38
参考文献 39
关键词:求解线性方程组;高斯消去法;GPU;CUDA;并行计算
参考文献
[1] . 都志辉.《高性能计算并行编程技术—MPI并行程序设计》.北京:清华大学出版社.2001.8
[2]. Barry Wilkinson,Michael Allen. 陆鑫达 等译. 《Parallel Programming》(并行程序设计).北京:机械工业出版社,2002.1
[3]. Michael J.Quinn. 陈文光 武永卫 等译. 《MPI与OpenMP并行程序设计》.北京:清华大学出版社,2004.10
[4]. 陈国良. 《并行计算—结构 算法 编程(修订版)》.北京高等教育出版社.2003
[5]. 陈国良,安虹,陈凌等. 《并行算法实践》.北京:高等教育出版社.2004
[6]. Ananth Grama,Anshul Gupta,George Karypis,Vipin Kumar. 张武 等译.《Introduction to Parallel Computing》(并行计算导论). 北京:机械工业出版社 2005.1 第2版
[7]. William H.Press, Saul A.Teukolsky, William T.Vetterling, Brian P.Flannery. 傅祖娜 等译. 《Numerical Recipes in C》(C数值算法). 北京:电子工业出版社 2004.1 第2版
[8]. QuinnU J.Designing efficient algorithms for parallel computers.MCGraw-Hill,1987
[9]. 徐士良 数值分析与算法 机械工业出版社
[10]. 马东升,雷勇军.《数值计算方法》.机械工业出版社 2006.9
[11]. Matt Pharrs,GPU精粹2——高性能图形芯片和通用计算编程技巧.清华大学出版社 2007年5月
[12] . NVIDIA. Nvidia CUDA Compute.
[13]. J. Nickolls and I. Buck,“NVIDIA CUDA software and GPU
parallel computing architecture”. Microprocessor Forum,May 2007.
[14]. 谭浩强,C程序设计.清华大学出版社 2005年7月