做自变量的逐步回归法前,需要先将回归变量标准化么

当前位置:----文章正文
区域物流本科论文范文 基于逐步回归的武汉区域物流量预测
关于免费区域物流论文范文在这里免费下载与阅读,为您的区域物流相关论文写作提供资料。 【摘
要】区域物流量的预测是区域物流规划以及经济发展的重要前提。对区域物流量影响较大的因素有很多,从中选择重要且相互独立的变量来建立回归方程比较困难。因此,本文以武汉市区域物流量预测为实例,采用逐步回归分析法建立模型,将影响程度大的变量依次纳入模型中,大大地提高了模型的运算效率。
区域物流是什么
【关键词】逐步回归分析法;区域物流量;物流量预测本文根据武汉区域物流量与相关的区域经济影响因素指标之间存在线性相关的特点,选择了线性回归分析法进行预测分析,具体应用了逐步回归策略建立回归模型,通过对模型的检验实现对模型优化,为武汉区域物流业发展决策提供了一个更确切的依据。一 多元逐步回归算法的原理
回归分析策略就是在大量实验观测数据的基础上,找出这些变量之间的内部规律性,从而定量地建立一个变量和另外多个变量之间的统计关系的数学表达式。回归分析也就是研究一个变量与其他变量间关系的一种统计策略。逐步回归算法是针对多元回归算法的缺点提出来的。多元回归模型的过程是首先将实际理由所提取的全部变量引入到方程,然后再根据变量的显著性检验把方程中不重要的变量逐一剔除,建立新的方程。这样建立的多元回归模型有如下缺点:首先,在实际理由中,要提取合适的变量来建立回归方程本身不是一件很容易的事情,因为实际变量间可能存在高度的相互依赖性,这样会给回归系数的估计带来不合理的解释;其次,变量一次性引入方程,易导致计算量增大,运算效率降低,精度不够等理由。为了得到一个稳健的、可靠的回归模型,这就需要给出一种策略,使得能从影响y的因素中自动根据某种准则将对y贡献大的变量xi引入方程,不重要的变量从方程中剔除,最终在观测数据的基础上建立最优的回归方程。逐步回归算法的形成思路:逐步回归算法根据各自变量的重要性,每一步选择一个重要的变量进入回归方程。第一步是在所有可供选择的变量中挑选出一个变量,使它组成的一元回归方程比其它变量有更大的回归平方和;第二步是在剩余的自变量中选择这样一个变量,它与已选入方程的变量所组成的二元回归方程有更大的回归平方和。如此继续下去,假设已经进行到l-1步,那第l步是在未选的变量中选出这样一个变量,它与选入回归方程的组成l元回归方程,比其它余下的任何一个变量组成的元回归方程有更大的回归平方和。逐步回归不仅考虑到按贡献大小逐一基于逐步回归的武汉区域物流量预测由优秀http://www.zglww.net提供,助您写好论文.挑选重要变量,而且还考虑到较早选入回归方程的某些变量,有可能随着之后一些变量的选入而失去原有的重要性,这样的变量也应当及时地从回归方程中剔除,是回归方程中始终只留下重要的变量。二 武汉市区域物流量的预测
1.武汉市物流发展的基本目前状况。武汉市是湖北省的省会,位于中国的中部,交通便利、四通八达,是中部崛起、带动西部发展的重点城市。在“十一五”期间,武汉区域物流发展势头强劲,由起步阶段向快速发展阶段过渡,逐步成为服务业的重要支柱,为该市区域经济的发展做出了重要贡献。随着经济的快速增长,武汉物流产业总体发展水平和质量不断提高。2010年全市社会物流总额达到14861.12亿元,年均增长24%,是2005年的2.29倍;物流业实现增加值582.53亿元,年均增长17.74%,占GDP的10.2%,占第三产业增加值的20%。根据武汉统计年鉴,从2006年到2011年货物运输量从2.05亿吨增加到4.18亿吨,年均增长19.8%;货物运输周转量从1435.2亿吨公里增加到2644.18亿吨公里,年均增长16.8 %。武汉市区域物流已初具规模,为“十二五”期间物流业的发展和建设全国重要物流中心奠定了坚实的基础。从上面的数据可以看出,在最近几年内,武汉市物流业的发展取得了较好的成绩,但由于大多数物流企业小、散、弱的现象普遍存在,物流综合信息平台构建不完善,资源聚集能力弱,运输服务水平低,使得物流业的总体经营水平不高,物流标准化的进程推行缓慢,物流相关的统计难以实施,这给区域物流量的预测以及区域物流的规划带来了挑战。在物流业快速发展的今天,各省和各地区加大了对物流业的投资,由于对物流需求预测不够准确,不免会产生投资过剩的现象,进而造成资源的浪费和区域经济的受损。为了使武汉市区域物流业与区域经济平稳快速地发展,使物流的实际供应与实际需求相适应,对武汉市区域物流量做好精确的预测显得至关重要。 信阳市区域物流
基于逐步回归的武汉区域物流量预测自考毕业论文开题报告相关参考属性
有关论文范文主题研究:
关于区域物流论文范文集
大学生适用:
2500字自考毕业论文
相关参考文献下载数量:
写作解决问题:
毕业论文开题报告:
论文提纲、论文选题
职称论文适用:
杂志投稿、中级职称
所属大学生专业类别:
区域物流是什么方面
论文题目推荐度:
优秀区域物流选题
2.预测指标体系的确定。对区域物流量的预测我们可以直接统计历年区域的物流量,根据历年数据的规律,利用时间数列法建立模型进行预测。但由于我国物流业起步比较晚,对物流量的统计还没有完整的历史数据,现在我们只能采用间接的策略:通过对影响物流量的相关因素进行分析,找出对物流量影响较大的因素指标,收集和整理相关因素指标历年的数据,利用数学的策略建立模型进行预测。预测指标的选择要遵循强相关性的原则、指标间相互独立性的原则、全面性和可操作性原则。由于物流需求是经济发展的一种派生需求,经济的增长拉动了物流业的发展,增加了物流业的需求,同时,物流业是经济发展的基础,现代物流业的新形态进一步推动了经济的发展。这种相互密切的关系说明了区域物流量的大小与区域经济具有极大的相关性,又由于我国各地区对经济相关指标数据的统计比较齐全,收集起来较为容易,因此,本文从经济角度来预测区域物流量的大小。影响区域物流量大小的经济因素包括区域经济的发展水平、区域经济结构、人们的消费水平和对物流产业的投资等等。通过文培娜、张广福等的区域经济对区域物流的影响的研究,结合武汉区域辐射性发展的特点,在遵循预测指标选择原则的基础上,最后确定武汉市区域物流量的预测指标体系为:区域生产总值x1、第一产业产值x2、第二产业产值写x3、第三产业产值x4、社会消费品零售总额x5、物流固定资产的投资x6。由于物流业起步晚,目前没有对物流量的统计数据,又因为武汉的物流量主要是由运输带来的,这里就用货物运输量作为应变量y来代替物流量进行分析。表1是数据的收集。表1
各指标历年的数据统计来源:历年《武汉统计年鉴》。3.武汉市区域物流量预测模型的建立。一是回归模型的建立。为了大致地分析y与x1,x2,…,x6的关系,先利用表1的数据分别做出y对xi(i=1,2,…,6)的散点图(图略)。由散点图可知,随着xi(i=1,2,…,6)的增加,y的值有比较明显的线性增长趋势,则y与xi(i=1,2,…,6)的关系都可以用一元线性回归模型:y=β0+β1xi+ε(1),来拟合(其中ε是随机误差)。因此,y与影响因素x1,x2,…,x6的关系可以通过建立多元线性回归模型来表示,建立模型如下:y=β0+β1x1 +β2x2+…β6x6+ε。这样建立模型是将影响因素x1,x2,…,x6一次性地引入到回归方程中,然后再通过模型检验来进行一步步优化,将不重要的变量依次删除。由于影响因素变量偏多,这不免会造成计算量过大、运算效率偏低,然而逐步回归法就可以克服这种缺点。二是逐步回归分析法的利用。前面介绍了逐步回归法的思路,这里我们直接应用逐步回归法来建立回归模型,将自变量按照重要的程度依次引入到建立的模型中,保证模型中的只留下对y影响较大的变量。第一步:在影响因素x1,x2,…,x6中选择一个最重要的变量引入模型中,建立一元线性回归模型。在置信水平α=0.05的前提下,分别将x1,x2,…,x6引入到一元线性模型(1)中,在MATLAB中求得每个参数估计的检验值t值和F值,以及回归方程的决定系数R2(R是相关系数)、F统计量值和SR回归平方和,如表2所示:表2
一元线性模型的检验数据模型的检验:线性回归模型的检验包括回归方程拟合度的检验——R2检验、回归方程显著性的检验——F检验、回归系数的显著性检验——t检验,如果是一元线性回归方程,t检验与F检验是等效的。首先,R2检验。判定系数R2是回归方程拟合程度的评价指标,R2越大,模型拟合程度越高;R2越小,模型对样本的拟合程度越差。R■=■=I-■(S■=S■+S■),式中,ST是总的离差平方和,S■=■(yi-■)■;SR是回归平方和,S■=■(■i-■)■;Se是剩余残差平方和,S■=■(yi-■i)■。yi为因变量的实际观测值,■是其样本均差,■i是因变量的理论回归值。本模型中,引入变量x5时R2最大,则可判断该模型的拟合程度最高,回归方程与样本数据拟合得最好。其次,F检验。F检验是回归方程的显著性检验,是根据总离
参考文献:
点评区域物流职称论文撰写技巧?为您写信阳市区域物流毕业论文范文和职称论文提供相关参考文献,变量和物流和方程方面的论文题目提纲开题报告文献综述参考文献的相关大学硕士和本科毕业论文.
相关免费毕业论文范文
区域物流论文有关参考文献推荐
热门区域物流是什么有关优秀论文题目选题
信阳市区域物流有关论文开题报告资料
有关专业写作资料大全
大学生学位本科论文
在职研究生硕士论文
专科论文下载
学术职称论文发表
免费论文提纲范文
热门优秀频道
标准论文格式模板
Free tools|/|/|/|/|/|
//|//|//|//|//|
【求助】多元回归时,是否能先单因素分析??
今天看到一篇文章中写到Logistic回归分析:“将调查数据先进行单因素logistic回归分析,对单因素分析中差异有统计学意义的变量,再进行行多因素非条件logistic回归分析,逐步将变量纳入方程”原文位置:http://www.paper.edu.cn/paper.php?serial_number=但是,看了本书《医学统计学基础与典型错误辨析》(胡良平、李子建主编),讲到“这是一种错误的分析策略,自变量之间可能有交互作用,对应变量得贡献可能受其他因素得影响,所以正确得做法是把所有变量代如回归方程,逐步回归分析,必要是多用几种筛选变量得技术,同时要考虑因素得交互作用,综合分析”请问:1.碰到这种情况到底该如何分析?2.书中所说得“多用几种筛选变量得技术”是指什么?统计学得非常不好,请各位指教,谢谢个人理解如果样本量比较大,一般超过自变量的15~20倍,可以直接采用多因素分析,样本量比较小,需要先进行单因素分析。几种筛选技术包括逐步法、向前法、向后法。对于logistic回归的诊断问题,很多统计教材都几乎没怎么说。变量筛选的几种方法在共线不很严重时也许很方便,但是如果存在多重共线时,也许效果并不好。logistic回归的原理上是和多元线性回归一样的,只是进行了概率转换而已。
logistic回归的诊断也和线性回归一样,基本上线性回归的诊断方法一般是可以用到logistic回归诊断中。也有人提出诸如主成分分析等诊断方法,当然也很麻烦,最后要根据主成分情况要代入logistic回归后方程当中,也许损失一定的信息。更多的情况时,很多书中根本没提logistic回归诊断问题。1,单变量分析是为了解你的数据,是多重分析的前提。2,一般在单变量分析时设定i概率为0。25-。30,这样,对于一些不显著的变量可以不予考虑。3,胡的意思不是说不要做单变量,而是说单的可能有偏倚。4,逻辑回归选变量可以参考一下hosmer的应用逻辑回归。5,变量的选择是专业和统计的结合。一般情况下,单因素logistic回归可作为资料的基础分析,以对变量做初步筛选,将有意义的变量和专业上有意义的变量(不管统计分析结果是否有意义)一起进入多因素分析。多因素回归则可控制混杂因素。但是也有不同意见,有学者说如果自变量数目不多,一般不必进行单因素回归,直接进行多因素逐步回归也可。还有就是,在回归时自变量的离散问题,也是很有说法,有学者说如果不很必要的话可以不离散,以保持信息的完整;也有人说,一般情况下都要离散,否则不利于结果的解释。根据自己情况,斟酌吧。我做的时候,只是做了下相关矩阵大致看了下,相关性很弱,就没继续向下分析了!单因素分析没有什么问题,就是在选择进入多因素分析模型的时候,把单因素分析的a值设高一些,如0.3甚至0.5,以免丢失信息,然后进行多因素分析,当然,建议在进行多因素分析之前检验一下各指标的相关性,如果比较大,还得考虑一下主成分分析或其他的解决办法个人愚见。周末没法上网,非常感谢各位的积极回复,看来到底要用单因素还是多因素是没有定律的,要根据具体情况而定了?统计之星---“样本量比较大,一般超过自变量的15~20倍,可以直接采用多因素分析,样本量比较小,需要先进行单因素分析”,是为什么呢,样本量是怎么影响结果的呢?mrguo1234---“hosmer的应用逻辑回归”,我没怎么听说过,网上有相关的理论么?我了解一下。另外谢谢zhangxiaoke520,yuew_l的经验之谈,不过我还是不太明白,需要再琢磨一下,谢谢了。统计学是我学过的最难的东西,学来学去是“只见树木不见森林”啊!以后还请各位指教。这是两种不同的学术观点,1
一种认为为了避免损失信息,应该全部纳入变量建立方程,然后就如同你所提到的采用多种筛选方法,找出较为适合的模型.
另一种就是我们现在常用的,先进行单变量分析,然后放宽纳入标准(0.6)这个界值不是一定的,和你的研究目的有关,如果你所关心的变量单变量分析p值较大,可以适当放宽标准,当然如果从专业上考虑通过单因素分析无法纳入的变量是你的研究变量可以采用强迫法纳入.2 共线性的问题,除了考虑相关矩阵外还应考虑其几个诊断指标(已有文献发现,相关性并不是共线性诊断的一个凭据).因为logistic回归其实质也是线性模型,所以在进行诊断时(以上战友已提及)可以借鉴多元线性回归的诊断方法3如果想要比较前面的了解一个模型,往往涉及的方面很多,需要相当长的一段时间学习.如果你的目的只是简单的应用,国内的教材就可以满足你的需要.4样本含量的问题,如果你的样本含量不足,那么会造成你最后建立的模型系数估计不稳定,出现意想不到的情况(比如说系数特大)从而影响模型的正确拟和.一般为自变量的15-20倍是一个经验值,一般认为&15倍后拟和的方程就相对比较稳定了.5一点建议,现在比较的倾向是采用单因素分析(0.3-0.6)后,再进行多因素分析.在进行多因素分析时对变量间共线性进行诊断.如果变量间共线性较大.可以采用主成分logistic回归等方法.受益非潜,谢谢rurenlong
您的位置: &&关注今日:24 | 主题:204301
微信扫一扫
【求助】在logistic回归分析中涉及到需要标准化回归系数大家是怎么做的?
页码直达:
这个帖子发布于2年零247天前,其中的信息可能已发生改变或有所发展。
运用SPSS可以方便的对定量变量进行标准化,但对于分类变量(分有序和无序)大家是怎么标准化回归系数的,像性别分1男/2女,吸烟与否赋值1是/2否。一项研究中自变量是多种类型组成的,要在一起比较对因变量的重要性,不知对定性变量如何标准化处理计算。谢谢。 不预先处理,SPSS直接给出的B值不是标准化的吧。
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
rufengwu 编辑于
楼主你解决了没啊?我现在也遇到这个问题了,问了好多,都没人理啊5555
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
遇到相同的疑惑,希望得到专业人士的解答!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
哇哈哈797 遇到相同的疑惑,希望得到专业人士的解答!遇到相同的困惑
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园当前位置: >>
逐步回归分析
第一讲 逐步回归分析 STEPWISE REGRESSION ANALYSIS在多元线性回归分析时,为建立一个较为简化又能准确预测依 变量的最优回归方程,通常是逐个剔除复回归方程中经检验对y影 响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也 是建立最优回归方程的一种分析法。此类分析法还很多,它们多适 用于自变量个数较少,或大多数自变量对y有显著影响的资料分析。 否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自 变量与y影响程度的大小,逐个地由大至小将自变量引入回归方程。 而每引入一个自变量,都要对方程中的各个自变量作显著性检验。 检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者 皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中 的自变量均检验为显著后,再引入另一个与y影响最大的变量,并 进行显著性检验。如此反复,直至没有自变量可再被引入,而方程 中所有自变量均与y存在显著的线性关系为止。 ? SS1b1 ? SP12 b2 ? SP13b3 ? SP1 y ? ? SP21b1 ? SS 2 b2 ? SP23b3 ? SP2 y ? ? SP31b1 ? SP32 b2 ? SS 3 b3 ? SP3 y?2b1 ? 1b2 ? 4b3 ? 2 ? ?1b1 ? 1.5b2 ? 3b3 ? 4 ?4b ? 3b ? 10b ? 5 2 3 ? 1A ( 0)4 ?2 1 ? ? ? 1 1.5 3 ? 4 3 10 ?2? ? 4? 5? ?1.5-1×0.5=1 3-1×2=1 4-1×1=3 0.5-0.5×(-0.5)=0.75 2-0.5×1=1.5 1-0.5×3=2.53-4×0.5=1 10-4×2=2 5-4×1=1 -2-1×(-0.5)=-1.5 2-1×1=1 1-1×3=-2 -0.5-1×(-1.5)=1 1-1×(-1)=2 3-1×(-2)=5A (1)? 0.5 0.5 2 1 ? ? ? ? ? ? 0.5 1 1 3 ? ? ?2 1 2 1? ? ?A( 2)? 0.75 ? 0.5 1.5 ? 0.5 ? ? ? 0.75-1.5×(-1.5)=3 ? ? ? 0 .5 1 1 3 ? -0.5-1.5×(-1)=1 ? ? ? ? 1. 5 ? 1 1 ? 2 ? -0.5-1.5×(-2)=2.5 ? ?a ( 3)1 ? 1.5 2.5 ? ? 3 ? ? ?? 1 2 ?1 5 ? ? ? 1.5 ? 1 1 ? 2? ? ?b1=2.5 b2=5 b3=-2 第一节 逐步回归分析的基本方法逐步回归分析的基本方法可以通过一个实例介绍其分析步骤。 例1 为考察舍内干球温度(x1)、湿球温度(x2)、露点温度(x3)、相对湿 度(x4)及舒适度指数(x5)对罗曼蛋鸡产蛋率(y)的影响。随机抽测12个位点 各64只鸡在56―67周令的平均周产蛋率如表1―1。 表1―1各变量的观察值、平均数及标准差 n=12周令56 57 58 ┇ 65 66 67x1,℃22.1 17.4 20.1 ┇ 13.8 13.0 13.4 17.2x2,℃16.7 12.6 15.7 ┇ 9.4 9.4 10.7 13.3x3,℃13.3 9.0 12.5 ┇ 5.2 6.4 8.3 10.3x4,%58.4 58.6 60.2 ┇ 58.0 60.4 71.2 64.4x568.6 62.2 66.4 ┇ 57.3 56.7 58.0 62.5y,%70.9 66.7 64.3 ┇ 60.5 60.5 58.9 63.4xs4.13.84.47.05.63.8 一、计算相关系数阵1、计算各变量的平均数(为表1―1) 设自变量x1,x2,…,xm与依变量y存在线性关系,m元线性回归 方程为:? y ? b0 ? b1 x1 ? b2 x2 ? ? ? bm xmb0 ? y ? b1 x ? b2 x 2 ? ? ? bm x m若有n对观察值: xk1,xk2,…,xkm,yk, k=1,2,…,n 则各变量平均数:x ? 1 ? x ki n1 n(1―1)(1―2)i=1,2,…,m(1―3) (1―4)y ? ? yk1 n 1n本例计算结果列于表1―1。 2、计算离差阵 自变量平方和ssi,自变量间及其与依变量间的乘积和SPij及SPiy由下式算出:2 SSi ? ?( xki ? xi ) 2 ? ? xki ? (? xki ) 2 n 1 n(1―5) i、j=1,2,…,m,i≠j (1C6) (1―7)SPij ? ?( xki ? xi )( xkj ? x j ) ? ? xki xkj ? ? xki ? xkj n1nSP ? ?( x ki ? xi )( y k ? y ) ? ? x ki y k ? ? x ki ? y k n iy1n于是可得正规方程组? ss1b1 ? sp12b2 ? ? ? sp1m bm ? sp1 y ? sp b ? ss b ? ? ? sp b ? sp ? 21 1 2 2 2m m 2y ? ?? ? ?sp m1b1 ? sp m 2 b2 ? ? ? ss m bm ? sp my ? 本例m=5,n=12 算得: ?184.9b1 ? 167.6b2 ? 184.8b3 ? 72.20b4 ? 251.1b5 ? 135.6 ?167.6b ? 158.8b ? 181.6b ?125.3b ? 232.5b ? 105.1 1 2 3 4 5 ? ? ?184.8b1 ? 181.6b2 ? 212.9b3 ? 188.3b4 ? 261.3b5 ? 103.4 ?72.20b ? 125.3b ? 188.3b ? 539.0b ? 141.2b ? ?77.5 1 2 3 4 5 ? ?251.1b1 ? 232.5b2 ? 261.3b3 ? 141.2b4 ? 344.9b5 ? 171.5 ?(1―8)(1―9) 3、计算相关系数阵 在逐步回归中,为便于计算和表达,通常将离差阵化为相关阵,计算公式为: rij=spij/(ssissj)1/2 i、j=1,2,…,m,y (1―10) rij为x1,x2,…,xm,y间的相关系数,且rii=1,于是正规方程组(1―8)可改 写为:? r11 p1 ? r12 p 2 ? ? ? r1m p m ? r1 y ? r p ? r p ??? r p ? r ? 21 1 22 2 2m m 2y ? ?? ? ?rm1 p1 ? rm 2 p 2 ? ? ? rmm p m ? rmy ?本例由公式(1-10)算得:? p1 ? 0.9762 p 2 ? 0.9312 p3 ? 0.2287 p 4 ? 0.9944 p5 ? 0.7910 ? 0.9762 p ? p ? 0.9875 p ? 0.4283 p ? 0.9936 p ? 0. 3 4 5 ? ? ? 0.9312 p1 ? 0.9875 p 2 ? p3 ? 0.5557 p 4 ? 0.9642 p5 ? 0.7 p ? 0.4283 p ? 0.5557 p ? p ? 0.3275 p ? ?0. 3 4 5 ? ? 0.9944 p1 ? 0.9936 p 2 ? 0.9642 p3 ? 0.3275 p 4 ? p5 ? 0.7325 ?(1―11)(1―12)方程组(1―12)中的pi与方程组(1―8)中bi间的关系为: bi=piSy/Sxi i=1,2,…,m 式中Sxi,Sy为各自变量、依变量的标准差。(1―13) 二、确定显著的F检验水准 为引入有显著作用的自变量,在进行逐步回归计算前,先要确定显著的F检验 水准,作为引入或剔除变量的标准。F检验水准要根据具体情况而定。一般地, 为使回归方程中包含较多的自变量,显著水准α不要定的太小。显著水准F的取值 与自由度有关,而且在逐步回归的分析中,由于自变量引入和剔除的变化,其剩 余自由度也在不断变化,若样本的观察数为n,自变量的个数为m,则剩余自由度 为n-m-1。如果n相对较大,m与n就相差较大。m个自变量被引入的个数的多少对 剩余自由度的影响也就不会太大。此时可确定一个固定的F检验值,不必每次查 表更换之。但本例n=12,m=5,剩余自由度分别为6、7、8、9、10。其F值相差 不太大,故可选一个共用检验的F值,作为引入和剔除自变量的标准。同时也要 注意显著水准α的选定,不能太小,如本例可选α=0.1,F0.1(1,6)=3.78。亦可指定F 值,如本例为F=5。 三、选取自变量 由(1-12)式得相关阵R(0):? 1 ? ? 0.9762 ? (0)= 0.9312 R ? ? 0.2287 ? ? 0.9944 ? 0.7910 ? 0.2 1 0.5 1 0.7 1 0.4 0.5 1 0.6 0.7910 ? ? 0.6615 ? 0.5615 ? ? ? .2648 ? ? 0.7325 ? 1 ? ?0.7 0.20.5 ? .5 1 、引入第一个自变数 (1)对5个自变量计算偏回归平方和,各自变量的偏回归平方和ui为:2 u i ? riy / riii=1,2,…,5(1―14)以ui值的大小作为被引入回归方程后对方差的贡献,ui最大的值是对方差贡献 (1) 最大的自变量。该自变量应优先引入回归方程。本例 u1 为: ( ( u11) ? [r1(y0) ] 2 r110) =0..6257式中右上角括号内1和0分别表示第一次计算以及相关系数来自R(0) 阵中的元素。 以下的意义均同。以此类推又有:( 0 (0 u 21) ? [r2(y ) ] 2 r22 ) =0..4376( 0 (0 u31) ? [r3(y ) ]2 r33 ) =0..3153( 0 (0 u 41) ? [r4(y ) ] 2 r44 ) =(-0.=0.0701 ( 0 (0 u 51) ? [r5(y ) ] 2 r55 ) =0..5366由上述计算知,中以xu为最大,故先引入x1。 1i(1) (2)对x1引入回归方程是否显著进行F检验,其计算公式为: Fi=ui/[(1-∑ui)/(n-1-1)] (i=1,2,…,m) (1―15) (1) (或Fi=[( ryy -ui)/(n-1-1)])。本次引入K为1,L为0。 F1=u1/ [(1- u1(1) )/(12-1-1)]=0.6257/[(1-0.6257)/10]=16.72 F1&5,故差异显著,可引入回归方程。 (l ) (3)剔除或引入一个自变量xk后,相关系数阵R(L)=〔 rij 〕按下列公式进行 消去变换,而成R(L+1)=〔 rij(l ?1) 〕( ?rkkl ?1) ? (l ?1) ?rkj ? (l ?1) ?rik ?rij(l ?1) ? ( ? 1 rkkl ) ( ( ? rkjl ) rkkl ) ( ( ? ? rikl ) rkkl ) ( ( ( ? rij(l ) ? rikl ) rkjl ) rkkl )( j ? k) (i ? k ) (i、j ? k)0.4 0.7910(1―16)由于引入x1,故按上式K+1,L=0时把R(0)变换为R(1)。?1 ? ? ? 0.9762 ? ? 0.9312 R(1)= ? ? ? 0.2287 ? ? ? 0.9944 ? ? 0.7910 ? ? ? 0....022867 ? 0.....038215 ? 0.175079? ? 0....100081 ? 0.445702? ? 0....011169 ? 0.055040? ? 0.110674 ? 0.175079 ? 0.445702 ? 0.319 ? ? 0.2 2、引入第二个自变量 L=1 (1)计算各自变量偏回归平方和,按(1―14)式算得:( 1 (1 u1 2) ? [r1(y ) ] 2 r11 ) =0..6257 (已选) ( (1 u 22) ? [r2(1) ] 2 r22) =(-0./0..2604 y ( (1 u 32) ? [r3(1) ] 2 r33) =(-0./0..2307 y( (1 u 42) ? [r4(1) ] 2 r44) =(-0./0..2096 y( (1 u 52) ? [r5(1) ] 2 r55) =(-0...2618 y由于方程中仅含一个自变量x1。而它是前一步刚选入的,不可能立即被剔 除,故无须作检验而直接引入贡献最大的u5(2),即x5。 (2)对x5引入回归方程,进行F检验,按(1―15)式算得:( 2) ( 2) (1) F5= u 5 /[(1- u1 - u 5 )/(n-2-1)]=0.2618/[(1-0.8)/9]=20.94 ( 2) ( 2) (1) = u 5 /[( ryy - u 5 )/(n-2-1)]=0.2618/[(0.8)/9]=20.94F5&5,差异显著,可把x5引入回归方程。(3)引入x5后,按(1―16)式进行消去变换,使R(1)变换成R(2)。 5.604968 ? ? 89.533563 ? 1.069698 ? 2.471164 ? 8.681726 ? 89.32143 ? ? ? 1....000141 ? 2..000027 ? ? 0..000305 ? 3..009923 ? (2)= ? 2..000223 ? R ? 8....05091 ? 8..038798 ? ? ? ? 89.....53353 ? 4.841078 ? ? ? ? 5....038798 ? 4..1125619 ? ?( 4)对引入x1,x5进行显著性检验 先算出各偏回归平方和及剩余平方和: ( ( u1 3) ? [r1(y2) ] 2 r112) =5...3509 (已选)( 2 (2 u 23) ? [r2( y ) ] 2 r22 ) =0...000003 ( 2 (2 u 33) ? [r3(y ) ] 2 r33 ) =0...0466 ( 2 (2 u 44) ? [r4( y ) ] 2 r44 ) =0..6 ( 2 (2 u 53) ? [r5(y ) ] 2 r55 ) =(-4./89.8 (已选)剩余平方和( Q ( 2) ? ryy2) ? 0.1125( F ? u 53) /[Q ( 2) /( n ? 2 ? 1)] ? 0.2618 /(0.1125 / 9) ? 20.94∵( u1(3) ? u 53) ,∴ F1>F5>5,差异均显著,x1、x5不被剔除。 3、引入第三个自变量 L=2,除x1 ,x5外,数u3(3)最大,故引入x3。 (1)对x3引入回归方程是否显著进行F检验 F3= u 3 /[(Q(2) - u 3 )/(n-3-1)]=0.0466/[(0.6)/8]=5.68 F3&5,差异显著,可把x3引入回归方程。 (2)引入x3后,应对R(2)进行消去变换,即将R(2)变换为R(3)。变换后的R(3)如下: 17.209967 ? ?
? 0.9.50497 ? 8.325026 ?
? ? 0..000193 ? 0..000109 ? 172.940585 ? 0.001020 ? ? ?
0...144345 ?
4.696167 ? ? R(3)= ? ? 8..000109 ? 0..050866 ? 8..037366 ? ? ? ?
172.940585 ?
8.9.90709 ? 20.90913 ? ? ? ? 17.209967 ? 0.0001020 ? ? 4...9618 ? ?( 3) ( 3)4、引入第四个自变量 L=3 (1)计算各偏回归平方程和( ( u1 4) ? [r1(y3) ] 2 r113) =17.9.4 ( (3 u 24) ? [r2(3) ] 2 r22 ) =(-0./0..00005 y(已选) ( 3 (3 u 34) ? [ r3(y ) ] 2 r33 ) =4...0466(已选)( (3 u 44) ? [r4(3) ] 2 r44 ) =0...0274 y ( 3 (3 u 54) ? [r5(y ) ] 2 r55 ) =(-20.9.7 (已选)剩余平方和 Q(3)=0.06596 (2) 剔除引入方程中差异不显著的自变量,已引入的x1,x3,x5中偏回归平方 和最小的为U3(4)=0.0466, F3= U3(4) /[( Q(3) /(n-3-1)]=0./8)=5.65 F3&5,所以x3不被剔除 ,偏回归平方和更大的x1 ,x5更不会被剔除,故方程中无 剔除的自变量。 (3)引入新变量u 未引入的x2 ,x4 中 4( 4)& 24) u(,故引入x4 ,其检验结果为:( ( F4= u 24) /[( Q(3) - u 24) )/(n-4-1)=0.0274/[(0.4)/7]=4.97由于F4&5,所以x4 不显著,不能引入方程。至此,回归方程既无变量可剔除, 又无新变量可再引入。逐步回归的计算可告结束。 第二节 建立最优回归方程一、计算偏回归系数 在逐步回归分析中采用的是经过标准化的量,即由相关系数求得的解pi为标 准偏回归系数,亦称通径系数,偏回归系数bi可由公式(1―13)算得,即:bi ? Pi本例中p1=Sy Sxi? PiSS y SS xi( r1y3)3 ,p3= r3(y ) ,p5=3 r5(y ),Sy和Sxi已列在表1―1中。所以b1= p1Sy/Sx1=17.21×3.8/4.1=15.95 b3= p3Sy/Sx3=4./4.4=4.06 b5= p5Sy/Sx5=(-20.9091)×3.8/5.6=-14.19b0 ? y ? b1 x1 ? b3 x3 ? b5 x5 =63.4D15.95×17.2-4.06×10.3+14.19×62.5最优回归方程为:=634.117? y =634.117+15.95x1+4.06x3-14.19x5 二、计算复相关系数及回归方程估计标准误复相关系数:( R ? 1 ? ryy3) ? 1 ? 0.06596 ? 0.966 **由df=12-3-1=8, 查R显著值表R0.01=0.86,复相关系数极显著,表明x1 ,x3, x5与y 之间存在极为明显的线性回归关系,该方程可用于估测y。 回归方程估计标准误:S ye ? Q (3) SS y n ? 3 ?1 ?( ryy3) SS yn ? 3 ?1?0.06596 ? 158 .84 ? 1.14 12 ? 3 ? 1回归方程估测误差仅1.14%,故本例所建立的最优回归方程用于预测平均周产 蛋率的可靠性极高。 三、总体平均数μy的置信区间和总体观察值yi的预测区间 当x1,x2,…,xm固定时,p(p为引入回归方程的自变量个数)元线性回归 估计值标准误为:S yi ? S ye ? 1 p p ? ? ? C ij x i x j n 1 11 p p 1 ? ? ? ? C ij x i x j n 1 1(1―17)观察值yi的标准误为:S yi ? S ye(1―18) Sye为方程估计标准误,n为样本含量,i,j=1,2,…,p,Cij为(1―8)式系 数矩阵的逆矩阵A-1中第i行、第j列的元素(高斯乘数),xi、xj为第i或第j个自变 量的离差即。A-1中的元素Cij与R-1 中的元素的关系为:C ii ? rii( p ) / ss i(1―19) (1―20)C ij ? rij( p ) ? rij(0) / sp ij于是,总体平均数μy(1-α)置信区间的上、下限为;? U= y i ? t? S y ,L= y i ? t ? S y ? ?i ?i 观察值yi(1-α)置信区间的上、下限为;? U= y i ? t? S y ,L= i(1―21)? y i ? t? S y i(1―22)式中tα对应的自由度为(n-p-1)。 本例中,当x1=22.1,x3=13.3,x5=68.8时,μy和yi95%的置信区间可计算如下:x1 ? x1 ? x1 ? 22.1 ? 17.2 ? 4.9 x3 ? x3 ? x3 ? 13.3 ? 10.3 ? 3.0 x5 ? x5 ? x5 ? 68.8 ? 62.5 ? 6.1 由(1―19)、(1―20)可得(3 C11 ? r11 ) / ss1 ? / 184.9 ? 16.1145 (3 C 33 ? r33 ) / ss 3 ? 473.2 ? 2.2229 (3 C 55 ? r55 ) / ss 5 ? / 344.9 ? 16. C13 ? r13 ) ? r13 ) / sp13 ? 0..505 / 184.8 ? 5.893 (0 (3 C15 ? r15 ) ? r15 ) / sp15 ? 0.9944? (?) / 251.1 ? ?16.199由(1―17)、(1―18)可得3 3 1 1(0 (3 C 35 ? r35 ) ? r35 ) / sp 35 ? 0.9642? (? / 261.3 ? ?5.975 )2 2 2 ? ? Cij xi x j ? C11 x11 ? C 33 x33 ? C 55 x55 ? C13 x1 x3 ? C15 x1 x5 ? C 35 x3 x5 ? C 31 x3 x1 ? C 51 x5 x1 ? C 53 x5 x3? 16. 2 ? 2. ? 16. ? 2(5.893? 4.9 ? 3) ? 2(16.199? 4.9 ? 6.1) ? 2(5.975? 3 ? 6.1) ? 20.5043S yi ? 1.14? ?1 12? 20.5043 ? 5.1726(%)1 S yi ? 1.14? 1 ? 12 ? 20.5043 ? 5.2967(%)由最优回归方程算得依变量的估计值为:? y ? 934.117? 15.95? 22.1 ? 4.06?13.3 ? 14.19? 68.6 ? 67.176(%) 查t值表,df=12-3-1=8,t0.05=2.306,依(1―21)、(1―22)有: 总体平均数μy95%置信的上、下限为: U=67.176+2.306×5.(%) L=67.176-2.306×5.(%) 观察值yi置信限分别为: U=67.176+2.306×5.(%) L=67.176-2.306×5.(%) 计算结果表明:当舍内温度为22.1℃、露点温度为13.3℃、舒适度为68.8时, 总体平均的周产蛋率在55.25~79.10%之间的置信度为95%;个别位点鸡的周产蛋 率可在54.96~69.39%之间,其置信度为95%。 习 题 1.1 依据例2.2的资料,试列出估计瘦肉量的最优回归方程。 (答案:=-1.84x2+1..14463x4 , R2=0.8516。) 1.2 统计12年间1月份雨量(x1,mm)、3月份上旬平均温度(x2,℃)、3月 份中旬平均温度(x3,℃)、2月份雨量(x4,mm)和第一代三化螟蛾高峰期(y ,以4月30日为0)的结果如下表,试用逐步回归法预报第一代三化螟蛾高峰期的 最优回归方程,若某年x1=10,x2=8,x3=10时,试求出第一代三化螟蛾高峰期总 体平均数μy95%的置信区间。 算 得 二 级 数 据 为 : ss1= , sp12=82.2425 , sp13=22.38 , sp14=-63.5925 , sp1y=522.875,ss2=54.9625,sp23=31.85,sp2y=-56.875,ss3=54.4467, ssy=142.25 sp34=310.4667, sp3y=3.500,ss4=,sp4y=178.475, sp24=-351.0025 简单相关系数为:r12=0.14044,r13=0.0384,r14=-0.01069,r1y=-0.55502,r23=0.58222, r24=-0.62851,r2y=-0.64322,r34=-0.55855,r3y=0.03977,r4y=0.19865。 ( 答 案 : =27.587x1-1.+0. , 24.79±2.306×0. ~ 26.40 即5月24至27日。)
赞助商链接
关键词:数据分析,逐步回归,模型建立,销售量,价格 一、引言根据 2010 年统计...第四讲 回归分析3(逐步回... 47页 免费
多元逐步回归分析程序 6页 免费 ...应用数理统计多元线性回归分析(第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014 年 12 月 逐步回归法在 AMHS 物流仿真结果中的应 用摘要:本文针对...该软件对气象资料作逐步回归分析,对于 Spss 软件用于气象统 计的便利亦可见一斑...一般讲,R越接近1即表示回归方程的效果 越好。因此当计算的结果R值接近l时,有...回归分析 MATLAB 工具箱一、多元线性回归 多元线性回归: y = β 0 + β1 ...第四讲 回归分析3(逐步回... 47页 免费 逐步回归分析(教材) 39页 1下载券...逐步回归分析计算法_金融/投资_经管营销_专业资料。前面我们介绍了通过回归的基本...引入第一个变量的步骤可总结如下: (1)对 i=1,2,…,m-1,计算 (2)令 ...作业-回归分析例题-逐步回归法_其它_高等教育_教育专区...今测得一 组数据如表 1,试用逐步回归来确定一个...SPSS 中逐步回归分析的应用 SPSS(Statistical Package for the Social Science)社会科学应用软件包是世界上著名的统 计分析软件之一。 它和 SAS (Statistical ...采用逐步回归分析的论文_经济/市场_经管营销_专业资料。本科毕业论文常用到spss...影响对分析重点,得出了 IPO 抑价 与股票上市首日换手率正相关,与第一大股东....doc 商务数据分析电子商务系列 第三十三课 逐步回归分析一、 逐步回归分析在一个多元线性回归模型中,并不是所有的自变量都与因变量有显著关系,有时有些自...以第四种方法,即逐步回归分析法在筛选变量方面较为理想. 逐步回归分析法的思想: 从一个自变量开始,视自变量 Y 作用的显著程度,从大到小地依 次逐个引入回归方程...
All rights reserved Powered by
www.tceic.com
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 自变量的逐步回归法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信