几类数据变换方法的比较研究.doc

  
约36页DOC格式手机打开展开

几类数据变换方法的比较研究,1.37万字36页原创作品,已通过查重系统 摘要数据加工在统计应用中是很重要的一项内容。为了挖掘出数据的内在规律,经常需要对数据进行变换。本文主要研究了统计中几类常用的数据变换方法。针对单一变量,本文研究了常用的几类正态数据变换方法,发现对数变换应用范围较为狭窄,可以将对数正态分布变换为正态分...
编号:99-1061184大小:820.00K
分类: 论文>数学/物理论文

内容介绍

此文档由会员 changxiaoniu 发布

几类数据变换方法的比较研究

1.37万字 36页 原创作品,已通过查重系统

摘 要
数据加工在统计应用中是很重要的一项内容。为了挖掘出数据的内在规律,经常需要对数据进行变换。本文主要研究了统计中几类常用的数据变换方法。
针对单一变量,本文研究了常用的几类正态数据变换方法,发现对数变换应用范围较为狭窄,可以将对数正态分布变换为正态分布。Box-Cox变换可以针对不同类型数据选择最优幂参数,应用范围较广。Johnson变换可以根据实际情况选择不同的变换族与参数,适用范围最广。通过案例分析,发现三种变换都可减少偏度,但只有Johnson变换后的数据才能通过K-S检验,说明Johnson变换拥有更强的正态变换能力,是数据变异性强的数据正态变换的理想工具。
针对多个变量,本文研究了几类将非正态相关随机变量转换为独立标准正态变量的数据变换。其中,Rosenblatt变换的精度最高,但需已经联合分布函数,要求苛刻,适用范围狭窄。而Orthogonal变换与Nataf变换不需已知联合分布,适用范围广。其中,Nataf变换需计算相关非正态变量转换为相关标准正态变量时相关性的变化,精度高,但计算复杂,而Orthogonal变换假定相关系数保持不变,则精度低于Nataf变换,计算量小,当变量均服从正态分布或变量相互独立时,效果最好。通过案例分析,当已知联合分布时,三种变换中Rosenblatt变换效果最好,Nataf变换次之,Orthogonal变换效果一般,不过最简单易操作,结果较为稳健,因此适用范围最广,是处理相关变量可靠度计算时最常用的方法。
综上所述,针对不同类型的分布类型,会有特定的变换与其对应,将这些变换方法总结下来对比分析,得到它们具体适用的范围,可对今后的数据变换的应用以及数据信息的深度挖掘有着显著的作用。


关键词:对数变换; Box-Cox变换; Johnson变换; Orthogonal变换; Rosenblatt变换; Nataf变换; 比较研究