基于迁移学习的软件缺陷预测研究与实现[独家原创].doc
约31页DOC格式手机打开展开
基于迁移学习的软件缺陷预测研究与实现[独家原创],基于迁移学习的软件缺陷预测研究与实现13800字自己原创的毕业论文,已经通过校内系统检测,重复率低,仅在本站独家出售,大家放心下载使用摘要 软件缺陷预测研究通常使用公司内部数据建模,极少数使用跨公司数据来训练预测模型。由于缺少目标公司训练数据,使用这些建立于公司内部数据的模型是困难的。近来,迁移学习吸引了越来越多的注意...
内容介绍
此文档由会员 jiji888 发布
基于迁移学习的软件缺陷预测研究与实现
13800字
自己原创的毕业论文,已经通过校内系统检测,重复率低,仅在本站独家出售,大家放心下载使用
摘要 软件缺陷预测研究通常使用公司内部数据建模,极少数使用跨公司数据来训练预测模型。由于缺少目标公司训练数据,使用这些建立于公司内部数据的模型是困难的。近来,迁移学习吸引了越来越多的注意力,主要关于使用来自相关源领域的数据在目标领域构建分类器。当训练分布和测试样例不同时,迁移学习就很有用处,但是,它是否适用于跨公司软件缺陷预测呢?
我们考虑源数据和目标数据取自于不同公司的跨公司缺陷预测方案。为了利用跨公司数据,学者们尝试通过开发迁移学习方法来构建更快更高效的预测模型。本课题使用朴素贝叶斯(Naive Bayes)算法来完成对训练数据的分类,实现有效知识的迁移。该算法使用基于合适的特征属性的所有训练样本信息,通过给训练数据加权分类来评估测试数据的分布和跨公司数据的迁移。本文呈现了相关方法的理论分析,并实现了对训练数据的分类。可以得出结论:当只有极少数的本地训练数据用来训练分类器时,这些基于特征层面的不同分布的训练数据的实用信息是有帮助的。该迁移学习方法可带来理想的资源分配策略,即减少软件测试花费以及增加软件测试过程的高效性。
关键词:迁移学习 软件缺陷预测 分类器 跨公司数据
Research and implementation of software defect prediction based on transfer learning
Abstract :Software defect prediction studies usually built models using within-company data, but very few focused on the prediction models trained with cross-company data. It is difficult to employ these models which are built on the within-company data in practice, because of the lack of these local data repositories. Recently, transfer learning has attracted more and more attention for building classifier in target domain using the data from related source domain. It is very useful in cases when distributions of training and test instances differ, but is it appropriate for cross-company software defect prediction?
In this paper, researchers consider the cross-company defect prediction scenario where source and target data are drawn from different companies. This topic using the naive Bias (Naive Bayes) algorithm to complete the classification of the training data, realize the transferring of effective knowledge . by using the information of all the proper features in training data. Our solution estimates the distribution of the test data, and transfers cross-company data information into the weights of the training data. On these weighted data, the defect prediction model is built.This article presents a theoretical analysis for the comparative methods, and shows the experiment results on the data sets. It is concluded that when there are too few local training data to train good classifiers, the useful knowledge from different-distribution training data on feature level may help. We are optimistic that our transfer learning method can guide optimal resource allocation strategies, which may reduce software testing cost and increase effectiveness of software testing process.
Keywords: Transfer Learning Software Defect Prediction Classifier Scientific Projects
目录
第一章引言 1
1.1 研究动机 1
1.2 研究现状 1
1.3 本文的主要工作 3
1.4 本文的组织结构 4
第二章 需求分析与相关技术理论 5
2.1 需求分析 5
2.2 相关技术 5
2.2.1开发环境 5
2.2.2使用的分类算法 6
2.3迁移学习简述 8
第三章 软件缺陷预测与简析 10
3.1软件缺陷预测 10
3.2简析 10
第四章 基于迁移学习的软件缺陷预测 13
4.1 构造朴素贝叶斯分类器 13
4.2相关训练集属性 14
4.3代码实现 17
第五章 实验结果及算法复杂度分析 22
5.1 用于比较的算法 22
5.2算法复杂度分析及比较 22
5.3运行结果 23
5.4小结 24
第六章 结论和展望 25
6.1结论 25
6.2展望 25
致谢 27
参考文献 28
13800字
自己原创的毕业论文,已经通过校内系统检测,重复率低,仅在本站独家出售,大家放心下载使用
摘要 软件缺陷预测研究通常使用公司内部数据建模,极少数使用跨公司数据来训练预测模型。由于缺少目标公司训练数据,使用这些建立于公司内部数据的模型是困难的。近来,迁移学习吸引了越来越多的注意力,主要关于使用来自相关源领域的数据在目标领域构建分类器。当训练分布和测试样例不同时,迁移学习就很有用处,但是,它是否适用于跨公司软件缺陷预测呢?
我们考虑源数据和目标数据取自于不同公司的跨公司缺陷预测方案。为了利用跨公司数据,学者们尝试通过开发迁移学习方法来构建更快更高效的预测模型。本课题使用朴素贝叶斯(Naive Bayes)算法来完成对训练数据的分类,实现有效知识的迁移。该算法使用基于合适的特征属性的所有训练样本信息,通过给训练数据加权分类来评估测试数据的分布和跨公司数据的迁移。本文呈现了相关方法的理论分析,并实现了对训练数据的分类。可以得出结论:当只有极少数的本地训练数据用来训练分类器时,这些基于特征层面的不同分布的训练数据的实用信息是有帮助的。该迁移学习方法可带来理想的资源分配策略,即减少软件测试花费以及增加软件测试过程的高效性。
关键词:迁移学习 软件缺陷预测 分类器 跨公司数据
Research and implementation of software defect prediction based on transfer learning
Abstract :Software defect prediction studies usually built models using within-company data, but very few focused on the prediction models trained with cross-company data. It is difficult to employ these models which are built on the within-company data in practice, because of the lack of these local data repositories. Recently, transfer learning has attracted more and more attention for building classifier in target domain using the data from related source domain. It is very useful in cases when distributions of training and test instances differ, but is it appropriate for cross-company software defect prediction?
In this paper, researchers consider the cross-company defect prediction scenario where source and target data are drawn from different companies. This topic using the naive Bias (Naive Bayes) algorithm to complete the classification of the training data, realize the transferring of effective knowledge . by using the information of all the proper features in training data. Our solution estimates the distribution of the test data, and transfers cross-company data information into the weights of the training data. On these weighted data, the defect prediction model is built.This article presents a theoretical analysis for the comparative methods, and shows the experiment results on the data sets. It is concluded that when there are too few local training data to train good classifiers, the useful knowledge from different-distribution training data on feature level may help. We are optimistic that our transfer learning method can guide optimal resource allocation strategies, which may reduce software testing cost and increase effectiveness of software testing process.
Keywords: Transfer Learning Software Defect Prediction Classifier Scientific Projects
目录
第一章引言 1
1.1 研究动机 1
1.2 研究现状 1
1.3 本文的主要工作 3
1.4 本文的组织结构 4
第二章 需求分析与相关技术理论 5
2.1 需求分析 5
2.2 相关技术 5
2.2.1开发环境 5
2.2.2使用的分类算法 6
2.3迁移学习简述 8
第三章 软件缺陷预测与简析 10
3.1软件缺陷预测 10
3.2简析 10
第四章 基于迁移学习的软件缺陷预测 13
4.1 构造朴素贝叶斯分类器 13
4.2相关训练集属性 14
4.3代码实现 17
第五章 实验结果及算法复杂度分析 22
5.1 用于比较的算法 22
5.2算法复杂度分析及比较 22
5.3运行结果 23
5.4小结 24
第六章 结论和展望 25
6.1结论 25
6.2展望 25
致谢 27
参考文献 28