53,想比较两组数据的差异,请问用什么差异具有统计学意义方法比

显著性差异分析
显著性差异分析
范文一:差异显著性分析差异显著性分析摘要 本文通过差异显著性分析解决了两专业的每门课程和数学水平是否有明显差异问题,通过Pearson相关系数解决了高等代数分别与线性代数,概率论和数理统计得分是否有相关的问题。关键词 t-检验 Pearson相关系数问题重述 下述2个表格是工科甲乙两个专业的高等数学上册、高等数学下册、线性代数、概率论等数学课程的成绩数据,请根据数据分析并回答以下问题:
(1)针对每门课程分析,两个专业的分数是否有明显差异?
(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?
(4)根据以上分析,面向工科同学,撰文阐述你对于大学数学课程学习的看法。模型假设1、甲专业中有一个数大于100分,由于是百分制,所以将此数换成0. 2、因为每一科的分数总体多数都是处在中间60分左右,不会高分的占多数也不会是低分的占多数,所以样本可以看作是来自正态或近似正态总体。模型建立1、对问题(1)用T检验来判定两个专业每一科的平均值的差异是否显著,因为T检验就是用于小样本,总体标准差σ未知的正态分布资料,是用于小样本的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。1.建立假设、确定检验水准αH0:μ = μ0 =60(无效假设,)
H1:(备择假设)双侧检验,检验水准:α=0.05
2.计算检验统计量 ,v=n-13.查相应界值表,确定P值,下结论2、问题(2)也是用T检验来判定两专业的数学水平的均值的差异是否显著,方法与问题(1)一样。只是针对对象不同3、问题(3)用Pearson相关系数来分别判断线性代数,概率论和数理统计得分是否与高等代数的优劣相关。Pearson相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本r描述的是两个变量间线性相关强弱的程度。r的绝对值越大,表明相关性越强。模型求解1、分别对高数I,高数II,线代,概率,用T检验对两个专业样本求出它们的P值,若P值小于0.10,则差异显著,因为P(高数I)=0.362586,P(高数II)=0.003922,P(线代)=0.779552,P(概率)=0.718893.所以针对高数II,两专业的差异显著。 2、先对甲专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样本一,再对专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样本二,用T检验对这两样本求出它们的P值,若若P值小于0.10,则差异显著。因为P(专业)=0.419651,所以两专业的数学水平差异不显著。3、对先求出每位学生两科高代上下册的平均值来当作是高代的分数,然后分别算出高代与线代r1=0.552091,高代与概率论和高代与数理统计的Pearson相关系数r2=0.508041,若r的绝对值越大,表明相关性越强。4、从求解3就可以看出高代的优劣是会影响到线代和概率论和数理统计的得分情况的,所以可以知道一科学得不好是会影响到其他相关学科的,毕竟对于工科学生,大学里的大部分课程都是相互有贯通的,都是有联系的,一般地,一科可能是另一科的基础,只有在学好这科的前提下才能学好另一科。模型评价这个模型可以用于比较两个专业之间各科成绩和数学水平的优劣,以及各科之间的相关性。也可以推广到到其他领域,用来比较两组数据之间的差异显著性和两种变量之间的相关性。原文地址:
范文二:差异显著性分析差异显著性分析摘要 本文通过差异显著性分析解决了两专业的每门课程和数学水平是否有明显差异问题,通过Pearson相关系数解决了高等代数分别与线性代数,概率论和数理统计得分是否有相关的问题。关键词 t-检验 Pearson相关系数问题重述 下述2个表格是工科甲乙两个专业的高等数学上册、高等数学下册、线性代数、概率论等数学课程的成绩数据,请根据数据分析并回答以下问题:
(1)针对每门课程分析,两个专业的分数是否有明显差异?
(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?
(4)根据以上分析,面向工科同学,撰文阐述你对于大学数学课程学习的看法。模型假设1、甲专业中有一个数大于100分,由于是百分制,所以将此数换成0.2、因为每一科的分数总体多数都是处在中间60分左右,不会高分的占多数也不会是低分的占多数,所以样本可以看作是来自正态或近似正态总体。模型建立1、对问题(1)用T检验来判定两个专业每一科的平均值的差异是否显著,因为T检验就是用于小样本,总体标准差σ未知的正态分布资料,是用于小样本的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。1.建立假设、确定检验水准αH0:μ = μ0 =60(无效假设,)
H1:(备择假设)双侧检验,检验水准:α=0.05
2.计算检验统计量 ,v=n-13.查相应界值表,确定P值,下结论2、问题(2)也是用T检验来判定两专业的数学水平的均值的差异是否显著,方法与问题(1)一样。只是针对对象不同3、问题(3)用Pearson相关系数来分别判断线性代数,概率论和数理统计得分是否与高等代数的优劣相关。Pearson相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本r描述的是两个变量间线性相关强弱的程度。r的绝对值越大,表明相关性越强。模型求解1、分别对高数I,高数II,线代,概率,用T检验对两个专业样本求出它们的P值,若P值小于0.10,则差异显著,因为P(高数I)=0.362586,P(高数II)=0.003922,P(线代)=0.779552,P(概率)=0.718893.所以针对高数II,两专业的差异显著。 2、先对甲专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样本一,再对专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样本二,用T检验对这两样本求出它们的P值,若若P值小于0.10,则差异显著。因为P(专业)=0.419651,所以两专业的数学水平差异不显著。3、对先求出每位学生两科高代上下册的平均值来当作是高代的分数,然后分别算出高代与线代r1=0.552091,高代与概率论和高代与数理统计的Pearson相关系数r2=0.508041,若r的绝对值越大,表明相关性越强。4、从求解3就可以看出高代的优劣是会影响到线代和概率论和数理统计的得分情况的,所以可以知道一科学得不好是会影响到其他相关学科的,毕竟对于工科学生,大学里的大部分课程都是相互有贯通的,都是有联系的,一般地,一科可能是另一科的基础,只有在学好这科的前提下才能学好另一科。模型评价这个模型可以用于比较两个专业之间各科成绩和数学水平的优劣,以及各科之间的相关性。也可以推广到到其他领域,用来比较两组数据之间的差异显著性和两种变量之间的相关性。阅读详情:
范文三:显著性差异显著性差异显著性差异(significance level),是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的,如比-些一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。
显著性差异是一种有量度的或然性评价。比如,我们说A、B两数据在0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%。两个数据所代表的样本还有5%的可能性是没有差异的。这5%的差异是由于随机误差造成的。通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了差异显著或是极显著。在作结论时,应确实描述方向性(例如显著大于或显著小于)。sig值通常用 P>0.05 表示差异性不显著;0.01如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。【 在 topzhang (topzhang) 的大作中提到: 】下面的计算过程是否正确? 谢谢1: n1个点,均值:X1, 方差:a12: n2个点,均值:X2, 方差:a2然后计算总方差:a = sqrt(偏差平方和/总自由度)=sqrt( ( (n1-1)a1^2 + (n2-1)a2^2 ) /(n1+n2-2) ).t检验
t = |X1-X2|sqrt( n1n2/(n1+n2) )/a在显著水平p=0.05情况if t> 0.05 有显著性差异阅读详情:
范文四:浅谈考试成绩的差异显著性分析【摘 要】本文尝试运用数理统计学中的显著性检验的基本思想和常用的excel软件简单介绍了考试成绩中班级之间、校际之间的平均分、优秀率、及格率的差异显著性检验,即U检验的计算方法与主要步骤;以及教改结题报告的成绩分析涉及各种检验方法——T检验、Z检验的区别及计算方法、主要步骤。简单而言,本文是用统计学中的检验方法科学地分析什么情况下两个平均分、优秀率、及格率“差别不大”,“差别明显”,“差很多”,希望能更加科学客观地分析两个均值间的差异,对有需要的老师有所帮助。【关键词】成绩差异;U检验;T检验;excel软件一、引言在每次考试成绩统计中,平均分、及格率、优秀率依然是一个班级教学的主要考核指标,但由于这样或那样的原因,可能会有些学生缺考。特别是近年我市实行了中职技校春季招生政策,某些学校分流人数也许过半。如何才能科学地公平地进行统计分析,也是许多从事成绩分析与管理的老师面临的难题。另外,在教改结题报告或阶段性小结中,总要会对教改效果进行分析,也就难免对对比班与实验班的考试成绩中平均分、及格率、优秀率等数据作显著性检验,来比较教改的效果是否明显或不明显。看了不少结题报告,其中涉及到的检验方法如U检验,Z检验,T检验等等,不一而足,让人摸不着头脑。即便是数学教师,由于在大学就读时的教学内容侧重点有所不同,或许对数理统计方面知识掌握不强,也很难明白这些检验方法孰是孰非,孰优孰劣,更别说非专业其它科目的教师。在作成绩对比分析时,通常无从下手,或是委托统计能力强的老师帮忙,或是随意给些似是而非的数据,抑或罗列考试成绩,直接对比,不作任何检验,也就缺乏科学严谨性。二、班、级考试成绩差异显著性分析有些学校以班和年级考试人数与注册人数比值作为相对系数对实考的分数进行了调整,其大致算法是:年级在册人数为N,缺考R人,某班在册人数为n,缺考r人,则相对系数为[(n-r)/n]/[(N-R)/N],用此系数乘以该班实际考试成绩,即为相对成绩,然后再以各班的相对成绩进行对比。这或许是一种方法,但这种调整,会对实考的成绩进行了放大或缩小,个人认为没有多少益处。事实上,一个班级本身或许也有人缺考,只不过没别班那么多,但平均分调整后可能偏离很多。例1:一所学校九年级4个班,每个班注册人数均为50,在一次考试中,某班平均分60,缺考20人,全级缺考100人,按上述方法折算该班平均分。解: =60*[(50-20)/50]/[(200-100)/200]=72,这是不科学的,也没有什么意义。1、样本均值与总体均值差异显著性检验(U检验)要检查班级之间成绩是否相差太大,目的并不是要排出名次,可以采用U检验(有些文章也称Z检验,在ecxel软件中,相应的变量也是Z。为避免与下文混淆,只有总体方差未知,本文方用Z检验,且二者计算不同,故此不用此名称)。U检验的条件是:已知(或可以求出)样本均值、样本容量与总体均值、总体的标准差,可能采用U检验进行两均值异显著性检验。统计学认为,不论x变量(考试分数)是连续型还是离散型,也无论x服从何种分布,一般只要样本容量(考试人数)n>20,就可认为平均值 的分布是正态的, ,则 ,服从标准正态分布,这就是进行U检验的理论依据。U检验主要步骤如下:第一步,建立虚无假设,即先认为两者没有差异,用 表示第二步,计算u统计量U检验的统计量为 ,其中,(a) = ( 为该班每一个学生的分数)是要检验班的平均分,excel软件的公式为:=AVERAGE(该班的成绩区域);(b) = ( 为年级每一个学生的分数)是年级平均分,excel软件的公式为:=AVERAGE(年级的成绩区域);(c) 为标准误, 年级标准差,计算公式是 = excel软件的公式为:=STDEV(年级的成绩区域);(d)n为该班人数,excel软件的公式为:=COUNT(该班的成绩区域)。以上的数据均由学生考试成绩表统计得到。从u统计量式子中我们看到,在两个平均分的差值进行标准化过程中,u值要受到年级标准差σ该班人数n影响。一般而言,就一次考试中n相对稳定,经开方后值更小,影响不大;而u值与σ成反比,换句话说,年级中各人成绩离散程度越大,两个平均分差值的差异就越不显著。第三步,设定显著水平ɑ,查表或计算接受域检验前必须设定显著水平ɑ,这是一个小概率数值,经常会选择ɑ=0.05,此时置信度1-ɑ=0.95,也即检验的结果有95%可靠性,有5%的不可靠,这个误差可能是由于偶然性造成的。在许多研究领域,0.05通常被认为是可接受错误的边界水平。如果有必要,也可选择ɑ=0.01,0.02等,使检验结果准确。由于标准正态分布图像是关于纵轴两边对称的,0.95对应的置信区间占据中间部分,而两侧共占0.05,一侧则占0.025,所以在计算或查表时,应以1-ɑ/2作为参数进行。如显著性水平ɑ=0.05,则查表或计算的是1-0.05/2=0.975对应的置信区间,excel软件的计算公式为:=NORMSINV(0.975),回车后得1.,一般取近似数1.96。由于图像对称性,确定的置信区间为(-1.96,1.96),以这个区间为接受域。若令ɑ=0.01,则接受域(-2.578,2.578)。第四步,观察统计量u值是否落在接受区域 ,由此对样本均值与总体均值作出显著性差异判断。如果u统计量在置信区间 (-1.96,1.96)内,接受H0,差异不显著,否则拒绝H0,差异显著;如果u统计量不在置信区间 (-2.578,2.578)内,则差异非常显著。例2.甲班某次参加考试36人,平均分66,年级平均分60,标准差为20分,检验甲班平均分与年级平均分是否有显著性差异。   解:把相关数据代入 ,所以无显著性差异。有些人认为相差5分就差很多,看来也是不科学的。2、标准分的计算由于标准分是综合个体与总体分数排位等因素计算而来,因此标准分本身是经过差异分析得到的数值。值得一提的是,在计算高考或中考标准分中,excel的NORMSINV函数作用非常大,不用查标准正态分布表,而且数值十分精确。换算公式T=100Z+500,其中Z=NORMSINV(Pi), Pi为某名次以下的人数占考生总数的百分比,相当于1-ɑ/2。例如10000人考试,则第1名的标准分为T=100Z+500= 100*NORMSINV()+500 872。3、班、级的及格率、优秀率的检验在成绩分析时,及格率、优秀率也可以像平均分一那样进行显著性差异检验,那么这两项该如何进行呢?难点在于标准差怎么求。其实,从公式看:平均分、及格率、优秀率三个数据的分母均为考试人数,三者均为平均值。平均分是每个人的分数之和/考试人数,由于每个人都会有一个分数,直接相加可得。那么及格率呢?表面看是及格率=及格人数/考试人数,在计算时,其实将每个人分数稍作处理:将达到及格的分数改为1,没达到的改为0,excel软件中可用公式=if(Ai>=60,1,0)及填充柄下拉简单得到,Ai为每个原始分数所在单元格,然后对转换后的数据求平均值(即及格率)与标准差了。然后把班、级的及格率代入u统计量式子中计算u值。优秀率也用相方法处理即可。例2.乙班某次考试成绩如下:87 64 71 81 75 72 87 46 54 61 50 42 65 50 7972 43 68 64 64 60 48 87 48 52 56 54 50 48 6292 70 82 53 82 73 75 72 68 70求此次考试的及格率及对应的标准差。解:按及格分数为1,不及格分数为0转换后为:1 1 1 1 1 1 1 0 0 1 0 0 1 0 11 0 1 1 1 0 0 1 0 0 0 0 0 0 11 1 1 0 1 1 1 1 1 1可以求出这组数据的平均值即及格率为=26/40=65%,标准差为S= =0.483。年级的优秀率与及对应的标准差也如法炮制,再进一步如平均分一样代入u统计量式子中计算就可以进行分析检验。需要指出的是,有些资料计算方法并非如此,这可能是转换后的结果只有0、1两个,不少人会认为这组数据服从两点分布或二项分布,所以按两点分布求方差S2=p(1-p),在这里p可以是及格率或优秀率,像上例S= =0.4770,出入比较大,很明显这并不是两点分布。我认为每个人及格记1分,不及格记0分,班级的“平均数”就是及格率或优秀率,这样理解更自然,按上例方法求标准差及进行检验可能更科学。4、U检验运用条件在已知样本均值、样本容量及总体的均值及总体的标准差,在每次考试中,这几个数据还是比较容易得到的,u统计量服从标准正态分布,即可以进行U检验。U检验涉及的计算较为简单,把以上四个参数代入公式即得u统计量(如果u值为负则取绝对值),然后与临界值比较,一般以1.96或2.578为临界值,不再另外查表或计算,就可以分析样本均值与总体均值是否具有显著性差异,所以U检验在诸多领域运用广泛。三、教改结题报告中的成绩分析(T检验,Z检验)一般而言,教改成绩就是实验班与对比班两个班的成绩比较,能否仅凭这两个班的平均分、优秀率、及格率的差值,立即得出教学效果是否明显呢?统计学认为,这样得出的结论是不可靠的,因为一个班的平均分具有统计意义,存在抽样误差,此数据是在一定范围内波动的,故而我们需要进行显著性差异检验。由于一个班多则也就50多人,少则也有20多人;所以每个班都可以看成一个样本,两个班就可看成从两个总体中抽取出来的双样本,一个总体是实施了教改的,一个是没有实施教改的。当然,这两个总体在这种情形下更多是虚拟的,它们具体的一些数据(平均分,方差等)我们是无从知晓的,也就没有办法直接研究,只能通过研究样本(即实验班及对比班成绩),由样本的数据对总体进行估计,并进行差异显著性检验,才能作出判断。1、Z检验与T检验的区别不少文章对Z检验还是T检验这两种方法作出了说明,两个总体均值的差异显著性检验中,在不知总体方差及均值情况下且统计量服从t分布,可以使用Z检验或T检验。如果样本容量n大于30,用Z检验,如果样本容量n小于30,则用t检验,在这里样本容量n即为该班人数。很明显,正如前文所说,一个班的人数一般都在30人之上,可以用Z检验。但假如一个班30人以下,另一班30人以上那怎么办?其实在计算机广泛应用计算的今天,不管样本容量n是多少,哪种检验都是可以使用的,且各种检验的基本原理是相同的。下面,不妨先了解这两种检验方法的统计量。首先,不论哪种检验都要用到以下数据:(a)两个班的平均分: ;(b)两个班的考试人数: ;(c)两个班的成绩的方差 ,应用excel软件的公式为=var(该班的成绩区域),数量上,方差=标准差的平方。t检验或z检验的主要步骤:第一步,建立虚无假设,即先认为两者没有差异,用 表示第二步:计算Z检验或T检验统计量z= ①,t= ②(大分母部分称为标准误)。式子中, 是两个班的平均分, , 是两个班分数的方差, 是两个班考试人数。从函数单调性而言,不论z或t,与u值类似,当两班的方差增大时,其值减小,即两班均分所代表的两总体的均值的差值差异性也到受成绩离散程度影响。另外,从式子结构看,t统计量要复杂很多,这在计算工具落后的过去,这个计算当然是很繁琐的。想当初,手中可能连计算器都没有,开个方都可能需要手算。据说数学家陈景润证明“1+2”时所用的草稿纸真的达到汗牛充栋地步,可堆满房子,如果换了今天,估计他的稿纸也许高不盈尺。所以我们可以认为,Z检验其实只是T检验的粗略计算而已,二者其实都可使用,只是t值过程稍复杂,但应更精确。   第三步 查表或计算临界值在不知总体方差情形下,两个平均值差服从t分布,查表或计算t临界值要有两个参数,显著水平ɑ,及自由度df。如果考查一个班,d ,如果进行两个班对比,自由度d 。计算临界值 ,excel软件中公式为:=TINV(ɑ,df),若令ɑ=0.05,自由度从30至120,临界值 都约为2,详见下表:自由度df 30 40 50 60 70 80 90 100 110 120临界值t0 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 1.982 1.980而两个班的人数基本上也在这个幅度内,像U检验一样,根据原始数据算出的t值与临界值 进行比较,为了简化运算, 可以取近似数2。同样,在差异显著情形下,非要区别出相差很多,以令ɑ=0.01,自由度30至120主要的临界值 如下:自由度df 30 40 50 60 70 80 90 100 110 120临界值t0 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 2.621 2.617第四步 比较t值或z值与 ,作出统计推断与u检验类似,比较计算出来的t值或z值与临界值 ,如果|t|  在报告中,不妨将各次考试成绩计算出来的t值用表格与图表形式展示出来,这样使数据条理更加清晰,也会使得内容更丰富,生动。例3.某次考试原始成绩(满分100)如下:实验班30人:90 54 56 84 78 84 78 78 82 50 82 76 80 56 8080 76 78 68 70 60 64 68 50 70 72 47 68 74 72对比班40人:70 72 72 54 66 64 90 68 50 62 60 54 50 95 5652 60 50 52 50 60 62 87 48 52 56 54 50 48 4866 62 70 70 82 60 64 64 62 58经计算得,实验班平均分 ,方差 =132.3,对比班平均分 ,方差 =135.2;分别代入Z统计量及T统计量式子中得z= = =3.255,t== =3.25,二者差别不大,均大于临界值 =2,所以可以认为教改验效果明显。2、及格率、优秀率的检验很多教改老师在成绩分析时,主要是对实验班及对比班的平均分进行显著性差异检验,而及格率或优秀率的检验则很少人涉及,这或许不够全面。与U检验一样,对分数稍作转换,然后对处理后的两组数据像平均分显著性检验方法一样进行计算。例3.如上述例子,作及格率差异显著性分析,及格的分数改为1,不及格的改为0,则两个班的分数表为:实验班30人:1 0 0 1 1 1 1 1 1 0 1 1 1 0 11 1 1 1 1 1 1 1 0 1 1 0 1 1 1对比班40人:1 1 1 0 1 1 1 1 0 1 1 0 0 1 00 1 0 0 0 1 1 1 0 0 0 0 0 0 01 1 1 1 1 1 1 1 1 0算得实验班及格率: =80%,方差 0.251;对比班及格率: =57.5%,方差 0.166,代入式子=2.01>2,同样及格率的检验差异显著性是明显的。同样方法也可以对优秀率进行检验。由于可以在excel表直接列表中用填充柄,计算极方便,此处不再赘言。3、前后两阶段成绩自身对比分析如果说,实验班与非实验班的成绩对比是横比的话,那么自身两次成绩的对比则是纵比。教改实验从开始接手到结束是一个过程,加上一个班学生的成绩也是一个动态变化,反映在教改期间的每一次在考试成绩,所以很有必要进行前后两阶段成绩自身对比分析。其检验方法是:对每一名学生两次成绩求差, ,然后以所有的差作为样本数据进行分析。统计量为 ,其中 为这组数据的标准差。例4.如例1中实验班成绩为:90 54 56 84 78 84 78 78 82 5082 76 80 56 80 80 76 78 68 7060 64 68 50 70 72 47 68 74 72而前一次考试成绩为:87 52 55 83 84 81 71 76 81 5480 76 80 54 78 77 74 72 65 7462 63 68 44 71 68 45 66 73 75对应位置的两个数据为同一名学生两次成绩,对这两次成绩平均分的进行差异显著性检验。解:两组对应位置的数据求差得:3 2 1 1 -6 3 7 2 1 -42 0 0 2 2 3 2 6 3 -4-2 1 0 6 -1 4 2 2 1 -3计算得, =1.2 =2.93 df=30-1=29,计算 =2.045, 差异性显著,所以可以作出结论:教改效果明显。同样,与平均分、及格率,优秀率一样,通过对动态的差值计算的t值也可以通过表格与图表表示出来,说明教改中实验班与对比班成绩差异是否显著,教学效果是否明显。综上所述,在教改成绩分析中,不但要检验实验班与对比班的平均分差异显著性,还可以对两班及格率、优秀率差值进行检验,甚至对同一个班前后几次成绩进行检验,这样方能更科学地分析教改成效。四、差异显著性分析的意义不管是U检验还是T检验或其它检验,其计算方法都是两个均值的差除以标准误,然后与临界值比较,U检验的临界值 ,T检验的临界值在ɑ=0.05,自由度30至100时 ,然后作出差异显著性判断。超过甚至远远超过这个临界点是我们每一位教师所追求的目标。但是现实中,大多教师是达不到这个目标的,原因有很多,因篇幅关系此处不作分析,我想既然是教学改革是实验,当然就会存在失败,这是客观现象。我们应该更在乎过程,所以在成绩分析时,也就没有必要更改原始分数,非要达到“效果显著”。以上笔者试图用统计知识,简单介绍了考试成绩中班级之间乃至校际之间的平均分、优秀率、及格率与的差异显著性检验,以及教改结题报告的成绩分析涉及各种检验方法,以期能对有需要的老师有所帮助,只是限于本人水平匮乏,文中必有许多不足之处,敬请各位给予指正为谢。参考文献:[1] 佚名《Excel常用函数大全》http://ce./hope2008/beautydesign/ ShowArticle.asp?ArticleID= 12385[2] 邢航《独立样本均数差异的显著性检验及应用》 《中国集体经济》 2008年第6期[3] 郑巧玲 何以平 《医学论文中t检验误用分析》 《中国科技期刊研究》2004年01期[4] 《平均数差异显著性检验统计检验力和效果大小的估计原理与方法》http:///p-.html阅读详情:
范文五:浅谈考试成绩的差异显著性分析浅谈考试成绩的差异显著性分析【摘
要】本文尝试运用数理统计学中的显著性检验的基本思想和常用的excel软件简单介绍了考试成绩中班级之间、校际之间的平均分、优秀率、及格率的差异显著性检验,即u检验的计算方法与主要步骤;以及教改结题报告的成绩分析涉及各种检验方法——t检验、z检验的区别及计算方法、主要步骤。简单而言,本文是用统计学中的检验方法科学地分析什么情况下两个平均分、优秀率、及格率“差别不大”,“差别明显”,“差很多”,希望能更加科学客观地分析两个均值间的差异,对有需要的老师有所帮助。【关键词】成绩差异;u检验;t检验;excel软件一、引言在每次考试成绩统计中,平均分、及格率、优秀率依然是一个班级教学的主要考核指标,但由于这样或那样的原因,可能会有些学生缺考。特别是近年我市实行了中职技校春季招生政策,某些学校分流人数也许过半。如何才能科学地公平地进行统计分析,也是许多从事成绩分析与管理的老师面临的难题。另外,在教改结题报告或阶段性小结中,总要会对教改效果进行分析,也就难免对对比班与实验班的考试成绩中平均分、及格率、优秀率等数据作显著性检验,来比较教改的效果是否明显或不明显。看了不少结题报告,其中涉及到的检验方法如u检验,z检验,t检验等等,不一而足,让人摸不着头脑。即便是数学教师,由于在大学就读时的教学内容侧重点有所不同,或许对数理统计方面知识掌握不强,也很难明白这些检验方法孰是孰非,孰优孰劣,更别说非专业其它科目的教师。在作成绩对比分析时,通常无从下手,或是委托统计能力强的老师帮忙,或是随意给些似是而非的数据,抑或罗列考试成绩,直接对比,不作任何检验,也就缺乏科学严谨性。二、班、级考试成绩差异显著性分析有些学校以班和年级考试人数与注册人数比值作为相对系数对实考的分数进行了调整,其大致算法是:年级在册人数为n,缺考r人,某班在册人数为n,缺考r人,则相对系数为[(n-r)/n]/[(n-r)/n],用此系数乘以该班实际考试成绩,即为相对成绩,然后再以各班的相对成绩进行对比。这或许是一种方法,但这种调整,会对实考的成绩进行了放大或缩小,个人认为没有多少益处。事实上,一个班级本身或许也有人缺考,只不过没别班那么多,但平均分调整后可能偏离很多。例1:一所学校九年级4个班,每个班注册人数均为50,在一次考试中,某班平均分60,缺考20人,全级缺考100人,按上述方法折算该班平均分。解: =60*[(50-20)/50]/[(200-100)/200]=72,这是不科学的,也没有什么意义。1、样本均值与总体均值差异显著性检验(u检验)要检查班级之间成绩是否相差太大,目的并不是要排出名次,可以采用u检验(有些文章也称z检验,在ecxel软件中,相应的变量也是z。为避免与下文混淆,只有总体方差未知,本文方用z检验,且二者计算不同,故此不用此名称)。u检验的条件是:已知(或可以求出)样本均值、样本容量与总体均值、总体的标准差,可能采用u检验进行两均值异显著性检验。统计学认为,不论x变量(考试分数)是连续型还是离散型,也无论x服从何种分布,一般只要样本容量(考试人数)n>20,就可认为平均值 的分布是正态的, ,则 ,服从标准正态分布,这就是进行u检验的理论依据。u检验主要步骤如下:第一步,建立虚无假设,即先认为两者没有差异,用 表示第二步,计算u统计量u检验的统计量为
,其中,(a) = ( 为该班每一个学生的分数)是要检验班的平均分,excel软件的公式为:=average(该班的成绩区域);(b) = ( 为年级每一个学生的分数)是年级平均分,excel软件的公式为:=average(年级的成绩区域);(c) 为标准误, 年级标准差,计算公式是 = excel软件的公式为:=stdev(年级的成绩区域);(d)n为该班人数,excel软件的公式为:=count(该班的成绩区域)。以上的数据均由学生考试成绩表统计得到。从u统计量式子中我们看到,在两个平均分的差值进行标准化过程中,u值要受到年级标准差σ该班人数n影响。一般而言,就一次考试中n相对稳定,经开方后值更小,影响不大;而u值与σ成反比,换句话说,年级中各人成绩离散程度越大,两个平均分差值的差异就越不显著。第三步,设定显著水平ɑ,查表或计算接受域检验前必须设定显著水平ɑ,这是一个小概率数值,经常会选择ɑ=0.05,此时置信度1-ɑ=0.95,也即检验的结果有95%可靠性,有5%的不可靠,这个误差可能是由于偶然性造成的。在许多研究领域,0.05通常被认为是可接受错误的边界水平。如果有必要,也可选择ɑ=0.01,0.02等,使检验结果准确。由于标准正态分布图像是关于纵轴两边对称的,0.95对应的置信区间占据中间部分,而两侧共占0.05,一侧则占0.025,所以在计算或查表时,应以1-ɑ/2作为参数进行。如显著性水平ɑ=0.05,则查表或计算的是1-0.05/2=0.975对应的置信区间,excel软件的计算公式为:=normsinv(0.975),回车后得1.,一般取近似数1.96。由于图像对称性,确定的置信区间为(-1.96,1.96),以这个区间为接受域。若令ɑ=0.01,则接受域(-2.578,2.578)。第四步,观察统计量u值是否落在接受区域 ,由此对样本均值与总体均值作出显著性差异判断。如果u统计量在置信区间 (-1.96,1.96)内,接受h0,差异不显著,否则拒绝h0,差异显著;如果u统计量不在置信区间 (-2.578,2.578)内,则差异非常显著。例2.甲班某次参加考试36人,平均分66,年级平均分60,标准差为20分,检验甲班平均分与年级平均分是否有显著性差异。解:把相关数据代入 ,所以无显著性差异。有些人认为相差5分就差很多,看来也是不科学的。2、标准分的计算由于标准分是综合个体与总体分数排位等因素计算而来,因此标准分本身是经过差异分析得到的数值。值得一提的是,在计算高考或中考标准分中,excel的normsinv函数作用非常大,不用查标准正态分布表,而且数值十分精确。换算公式t=100z+500,其中z=normsinv(pi), pi为某名次以下的人数占考生总数的百分比,相当于1-ɑ/2。例如10000人考试,则第1名的标准分为t=100z+500=100*normsinv()+500 872。3、班、级的及格率、优秀率的检验在成绩分析时,及格率、优秀率也可以像平均分一那样进行显著性差异检验,那么这两项该如何进行呢?难点在于标准差怎么求。其实,从公式看:平均分、及格率、优秀率三个数据的分母均为考试人数,三者均为平均值。平均分是每个人的分数之和/考试人数,由于每个人都会有一个分数,直接相加可得。那么及格率呢?表面看是及格率=及格人数/考试人数,在计算时,其实将每个人分数稍作处理:将达到及格的分数改为1,没达到的改为0,excel软件中可用公式=if(ai>=60,1,0)及填充柄下拉简单得到,ai为每个原始分数所在单元格,然后对转换后的数据求平均值(即及格率)与标准差了。然后把班、级的及格率代入u统计量式子中计算u值。优秀率也用相方法处理即可。例2.乙班某次考试成绩如下:87 64 71 81 75 72 87 46 54 61 50 42 65 50 7972 43 68 64 64 60 48 87 48 52 56 54 50 48 6292 70 82 53 82 73 75 72 68 70求此次考试的及格率及对应的标准差。解:按及格分数为1,不及格分数为0转换后为:1 1 1 1 1 1 1 0 0 1 0 0 1 0 11 0 1 1 1 0 0 1 0 0 0 0 0 0 11 1 1 0 1 1 1 1 1 1可以求出这组数据的平均值即及格率为=26/40=65%,标准差为s==0.483。年级的优秀率与及对应的标准差也如法炮制,再进一步如平均分一样代入u统计量式子中计算就可以进行分析检验。需要指出的是,有些资料计算方法并非如此,这可能是转换后的结果只有0、1两个,不少人会认为这组数据服从两点分布或二项分布,所以按两点分布求方差s2=p(1-p),在这里p可以是及格率或优秀率,像上例s= =0.4770,出入比较大,很明显这并不是两点分布。我认为每个人及格记1分,不及格记0分,班级的“平均数”就是及格率或优秀率,这样理解更自然,按上例方法求标准差及进行检验可能更科学。4、u检验运用条件在已知样本均值、样本容量及总体的均值及总体的标准差,在每次考试中,这几个数据还是比较容易得到的,u统计量服从标准正态分布,即可以进行u检验。u检验涉及的计算较为简单,把以上四个参数代入公式即得u统计量(如果u值为负则取绝对值),然后与临界值比较,一般以1.96或2.578为临界值,不再另外查表或计算,就可以分析样本均值与总体均值是否具有显著性差异,所以u检验在诸多领域运用广泛。三、教改结题报告中的成绩分析(t检验,z检验)一般而言,教改成绩就是实验班与对比班两个班的成绩比较,能否仅凭这两个班的平均分、优秀率、及格率的差值,立即得出教学效果是否明显呢?统计学认为,这样得出的结论是不可靠的,因为一个班的平均分具有统计意义,存在抽样误差,此数据是在一定范围内波动的,故而我们需要进行显著性差异检验。由于一个班多则也就50多人,少则也有20多人;所以每个班都可以看成一个样本,两个班就可看成从两个总体中抽取出来的双样本,一个总体是实施了教改的,一个是没有实施教改的。当然,这两个总体在这种情形下更多是虚拟的,它们具体的一些数据(平均分,方差等)我们是无从知晓的,也就没有办法直接研究,只能通过研究样本(即实验班及对比班成绩),由样本的数据对总体进行估计,并进行差异显著性检验,才能作出判断。1、z检验与t检验的区别不少文章对z检验还是t检验这两种方法作出了说明,两个总体均值的差异显著性检验中,在不知总体方差及均值情况下且统计量服从t分布,可以使用z检验或t检验。如果样本容量n大于30,用z检验,如果样本容量n小于30,则用t检验,在这里样本容量n即为该班人数。很明显,正如前文所说,一个班的人数一般都在30人之上,可以用z检验。但假如一个班30人以下,另一班30人以上那怎么办?其实在计算机广泛应用计算的今天,不管样本容量n是多少,哪种检验都是可以使用的,且各种检验的基本原理是相同的。下面,不妨先了解这两种检验方法的统计量。首先,不论哪种检验都要用到以下数据:(a)两个班的平均分: ;(b)两个班的考试人数: ;(c)两个班的成绩的方差 ,应用excel软件的公式为=var(该班的成绩区域),数量上,方差=标准差的平方。t检验或z检验的主要步骤:第一步,建立虚无假设,即先认为两者没有差异,用 表示第二步:计算z检验或t检验统计量z= ①,t= ②(大分母部分称为标准误)。式子中, 是两个班的平均分, , 是两个班分数的方差, 是两个班考试人数。从函数单调性而言,不论z或t,与u值类似,当两班的方差增大时,其值减小,即两班均分所代表的两总体的均值的差值差异性也到受成绩离散程度影响。另外,从式子结构看,t统计量要复杂很多,这在计算工具落后的过去,这个计算当然是很繁琐的。想当初,手中可能连计算器都没有,开个方都可能需要手算。据说数学家陈景润证明“1+2”时所用的草稿纸真的达到汗牛充栋地步,可堆满房子,如果换了今天,估计他的稿纸也许高不盈尺。所以我们可以认为,z检验其实只是t检验的粗略计算而已,二者其实都可使用,只是t值过程稍复杂,但应更精确。第三步 查表或计算临界值在不知总体方差情形下,两个平均值差服从t分布,查表或计算t临界值要有两个参数,显著水平ɑ,及自由度df。如果考查一个班,d ,如果进行两个班对比,自由度d 。计算临界值 ,excel软件中公式为:=tinv(ɑ,df),若令ɑ=0.05,自由度从30至120,临界值 都约为2,详见下表:自由度df 30 40 50 60 70 80 90 100 110 120临界值t0 2.042
1.9941.990
1.980而两个班的人数基本上也在这个幅度内,像u检验一样,根据原始数据算出的t值与临界值 进行比较,为了简化运算, 可以取近似数2。同样,在差异显著情形下,非要区别出相差很多,以令ɑ=0.01,自由度30至120主要的临界值 如下:自由度df 30 40 50 60 70 80 90 100 110 120临界值t0 2.750 2.704 2.678 2.660 2.648 2.639 2.6322.626 2.621 2.617第四步 比较t值或z值与 ,作出统计推断与u检验类似,比较计算出来的t值或z值与临界值 ,如果|t|2,同样及格率的检验差异显著性是明显的。同样方法也可以对优秀率进行检验。由于可以在excel表直接列表中用填充柄,计算极方便,此处不再赘言。3、前后两阶段成绩自身对比分析如果说,实验班与非实验班的成绩对比是横比的话,那么自身两次成绩的对比则是纵比。教改实验从开始接手到结束是一个过程,加上一个班学生的成绩也是一个动态变化,反映在教改期间的每一次在考试成绩,所以很有必要进行前后两阶段成绩自身对比分析。其检验方法是:对每一名学生两次成绩求差, ,然后以所有的差作为样本数据进行分析。统计量为 ,其中 为这组数据的标准差。例4.如例1中实验班成绩为:90 54 56 84 78 84 78 78 82 5082 76 80 56 80 80 76 78 68 7060 64 68 50 70 72 47 68 74 72而前一次考试成绩为:87 52 55 83 84 81 71 76 81 5480 76 80 54 78 77 74 72 65 7462 63 68 44 71 68 45 66 73 75对应位置的两个数据为同一名学生两次成绩,对这两次成绩平均分的进行差异显著性检验。解:两组对应位置的数据求差得:3 2 1 1 -6 3 7 2 1 -42 0 0 2 2 3 2 6 3 -4-2 1 0 6 -1 4 2 2 1 -3计算得, =1.2
=2.93 df=30-1=29,计算 =2.045, 差异性显著,所以可以作出结论:教改效果明显。同样,与平均分、及格率,优秀率一样,通过对动态的差值计算的t值也可以通过表格与图表表示出来,说明教改中实验班与对比班成绩差异是否显著,教学效果是否明显。综上所述,在教改成绩分析中,不但要检验实验班与对比班的平均分差异显著性,还可以对两班及格率、优秀率差值进行检验,甚至对同一个班前后几次成绩进行检验,这样方能更科学地分析教改成效。四、差异显著性分析的意义不管是u检验还是t检验或其它检验,其计算方法都是两个均值的差除以标准误,然后与临界值比较,u检验的临界值 ,t检验的临界值在ɑ=0.05,自由度30至100时 ,然后作出差异显著性判断。超过甚至远远超过这个临界点是我们每一位教师所追求的目标。但是现实中,大多教师是达不到这个目标的,原因有很多,因篇幅关系此处不作分析,我想既然是教学改革是实验,当然就会存在失败,这是客观现象。我们应该更在乎过程,所以在成绩分析时,也就没有必要更改原始分数,非要达到“效果显著”。以上笔者试图用统计知识,简单介绍了考试成绩中班级之间乃至校际之间的平均分、优秀率、及格率与的差异显著性检验,以及教改结题报告的成绩分析涉及各种检验方法,以期能对有需要的老师有所帮助,只是限于本人水平匮乏,文中必有许多不足之处,敬请各位给予指正为谢。参考文献:[1] 佚名《excel常用函数大全》http://ce./hope2008/beautydesign/ showarticle.asp?articleid= 12385[2] 邢航《独立样本均数差异的显著性检验及应用》 《中国集体经济》 2008年第6期[3] 郑巧玲
何以平 《医学论文中t检验误用分析》 《中国科技期刊研究》2004年01期[4] 《平均数差异显著性检验统计检验力和效果大小的估计原理与方法》http:///p-.html阅读详情:
范文六:基因表达差异谱数据的显著性分析方法吟文章编号:(1-03中图分类号:R311;TP301.6文献标识码:A·医学数学模型探讨·基因表达差异谱数据的显著性分析方法刘正龙摘要院吟王洪平*杨艳梅**罗玉军(川北医学院计算机与数学教研室南充637007)可采用比较条件下的cDNA微阵列实验的基因表达差异水平的检测,在癌症诊断中鉴别肿瘤特异性基因分型的方法,来提高实验数据的可靠两个基因的表达差异,发现与疾病相关的基因的特异性表达。在实验中对相同样品通常有两次或多次的重复,因为cDNA微阵列费用仍然比较昂贵,对实验数据的表达差异分析就是性、稳定性,但是不能重复足以满足对实验数据的分析的要求,而且还可以为要识别在不同条件下有显著表达差异的基因,因此需要采用分析这些数据的统计方法,这样有助于揭示生命体的奥秘,基因诊断与基因治疗提供重要的科学依据和为复杂疾病的发病机制研究提供重要的方法。关键词院cDNA微阵列;基因差异表达谱;倍数分析;t检验;贝叶斯分析doi院10.3969/j.issn援15.02.0022倍数分析方法(FoldChange,FC)1引言最早采用倍数的方法来分析基因表达谱水平差异性来计算两个条件下的表达谱水平的Ratio值[5,6],应用在cDNA微阵列技术的比较实验上。用倍数f的值,估计每个基因在实验条因此,件下较之对照条件下表达量的倍数差异值,f=xI/xc表示基因g在条件xI和xc中的表达水平比率,其中,xI为实验条件下的表达值,xc为对照组条件下的表达数值。在cDNA微阵列芯片实验数据中,具有相同的微阵列基因表达数据的实验杂交的两个条件的样本数据,对每个成对的实验数据计算出的f,寡核苷酸芯片的最终计算值是重复实验的平均f值,对规范表达水平的平均样本是首先计算出两个重复的微阵列实验数据,然后再计算表达率。只有当f=1,g基因的表达水平没有变化,而在f约1或f跃1意味着基因g的两个条件尤其是当f跃1,在1的条件下表达上调的基因数据,存在差异,在具体的应用实例,如果表达f约1表示在条件1下调基因数据。变化的平均水平在两个恒定值的情况下是2就超过一个基因,表达数据的这是f跃2或f约1/2,在基因表达谱差异显著。然后,因详细分析后,2倍的方法不能产生最佳的数据分析的结论,此,在不同的表达水平显著不同的2个因素。对基因表达水平用2倍的分析作为判断条件宽松,低,信噪比很小,而高的基因表达谱,条件太苛刻,通常小于2的光谱上有显著差异表达的根据数生命科学的意义。在具体应用实例中没有确切的阈值,据分析者的要求自行设置,目前尚没有对此简单的表达谱分析8]的深入研究报告的假阳性和假阴性率的倍数分析法[7,。3t检验方法(t-Test)基因多次实验在两种条件下,确定是否有显著性差异的基因表达谱,更多的应用实例中使用假设检验、t检验方法包括以以基因组功能组学研究为主要随着人类基因组测序完成,目标的后基因组时代的到来,基因功能结构信息的获取将成为基因组学研究的重点。基因差异表达分析是获取基因功能信息的重要手段。人类大约有3万个不同的基因,在每一个正常的生物体细胞中都含有相同的基因组拷贝,但在不同的组织细胞中仅有15%左右的少部分基因被选择性表达,它将最终控制生物体的形态和生理过程,是表达调控细胞生命活动过程中的核心机制[1]。了解不同细胞或同类细胞在不同发育阶段的基因表可以提供生命活动的研究和疾病发病达,不同的生理条件下,是重大的理论对不同阶段、不同代谢子过程信息的重要渠道,网通路生物生长的表达调控及其现实意义[2]。cDNA微阵列实验检测基因表达水平的比较在不同条件用于识下的基因的表达的差异,以确定基因的特异性与条件,别肿瘤特异性的基因分型。提高稳定性,实验是在两个或更多因为cDNA微阵列成本非常高,需要的重复相同的样品,所以,使用统计方法对实验数据的分析[3][5]。这些表达数据分析,是显著差异表达的基因在两种条件下的识别。一个显著的差异表达的是什么?是指在实验数据排除一个单一的基因表达水平的检要测具有统计学意义,是在这两个条件下对环境因素的检测,数理统计中通常使用对生命科学的意义必须达到一定的差异。第一类倍数分析法,在两种情况下的每一的分析方法有三类:如果大于给定的阈值,利用统计方法有明个基因的比例计算,第二类t检验和方差分析法,显的基因表达差异分析;对差异第三类表达基因的统计计算,用来解析表达的差异是否显著;数学模型确定的数学模型的参数设置,以确定是否在基因表达谱的显著差异的两个条件[4]。收稿日期:通讯作者:罗玉军(1976-)模式识别与人工智能、生物信息学。作者简介:刘正龙,男,副教授,硕士研究生。主要研究方向:*南充职业技术学院信息管理系(15ZA0)吟基金项目:四川省教育厅自然科学基金**西华师范大学数学与信息学院·161·下两个条件下各种条件和方差分析,=u在这里使用t检验法。假设:H0:ug1g2,与之对应的备选假设是H1:ug1屹ug2。t统计量的计算公式(1)tg=xg1g2(1)g1-x1g2n2ni在式(1)中軃xgi=条件下的重复实验次数。移j=1xgij/ni,sgi2=i移j=1(xgij-x軃gi)2,ni为某一如果t是超出一个给定的置信阈值水平,拒绝为零假设,可以认同的差异表达的条件下在两个t检验,两总体的平均长度之间的归一化得到的标准偏差处理g基因的表达是重要的。经验后,可以解决固定阈值的手段总有一些缺点。然后,使用高通量检测技术解决cDNA微阵列数据的t检验的基本问题,重复c次数ni较小的情况下造成实验数据仍然是昂贵的或实验过程太过冗长[9]。导致整体方差估计会偏低,且t值大多是采用小样本量造成的,所以,对不同的表达谱基因数量,数据的t检验结果无显著性差异是较高的错误发现率covery[10]克服这些弊端。Rate)形成的因素。因此,需要采取更先进的分析方法来(FDR,FalseDis原在t假设检验方法用显著水平P=0.012,其意义是在零假设正确的情况下,进行250次抽样调查发现,有3次错误地拒绝原假设。对于检测大量基因的数量使用cDNA微阵列实验数据,如果使用P=0.012,有25000个数字的基因芯片,错误认为是有表达差异显著的将会有250个基因是由于偶然性的识别。导致在t检验分析结果是不可靠的或失去意义的检验,这个数量对生物信息分析可能会产生很大的干扰程度形成的因素。以改进t检验方法来解决这些问题,就是降低由分母的方差较小而带来的错误,分母更改为数学公式(圆)采用t检验方法:dg=xg1-xg2g0(圆)sa{移n1xg=g1ia=(1/n-xg1g2ig2}(猿)假设姨軃+1+1/nn2x-x軃(圆)式2d)/(n的分布独立于水平的基因表达谱,1+n2-2)g较低级别的基因表达谱水平在(猿)中sg值变小,导致dg更高的变化。在确保dg独立的基因表达,就在分母上增加s0,s0的选择是最小化dg的变化系数。确定阈值可以通过对实验设计的一组对照样本的分析,croarrays,SAM表达谱差异显著性(SignificanceAnalysisofMi原[11])确定是dg大于阈值的基因,SAM方法选择特征基因的过程如下:首先,对数据进行N次无替换的重抽样,记第k次重抽样=1,2,…,N;然后,计算dN时的d(i),值为dE(i),i(i)的期望dE(i)=i=1最后,GSE5390的表达差异显著移dE(i)/N,通过ArrayTools软件分析基因性分析的数据结果如图1,这样,d(i)E(i)=dE(i)的点在图1中就表示成为一条对角实线。以dg虚线表示其边界)为标准进行筛选。=d(i)=d,即d(i)到dE(i)的距离(图1中用一旦为dg设定阈值,其d(i)到dE(i)距离大于dg的基因就作为显著差异表达的特征基因而被选中,评价筛选效果的指标为错误发现率Rate)FDR数/筛检出差异表达基因的个数。,其定义为FDR=筛检出差异表达基因中的假阳性基因个(FalseDiscovery(图员)·162·图1SAM差异表达基因筛选4贝叶斯分析方法(BayesianAnalysis)在实验数据分析中cDNA微阵列数据也是相对较大由于实验的噪声与波动的,很多相关的变量在大量的实验数据中也就无法被观察到,因此,微阵列表达数据可用贝叶斯分析方法进行分析。用数学描述贝叶斯分析方法为P(M渣D)=P(D渣M)P(M)/P(D)(4()4)式:在公式(4),实验集合D参数模型M=M(w)通过P(M|D)由基因通过观测数据获得真概率,也称为后验概率;P(M)被称为先验概率,真概率表示是在M的数学模型没有任何实验基因数据之前。P(M|D)是指似然度函数,代表一个实验数据集合D的贝叶斯分析方法可以通过选择参数估计来完成任务,从而来推断数学模型M的概率,通常采用的最大似然(ML)的估计和最大后验概率(MAP)估计方法[12]。基因表达数据的差异采用贝叶斯分析方法来分析,首先假定条件下和在特定环境下,符合正态分布和独立分布是在测量的基因表达水平的数据值下。这样的假设具有合理性,根据以往的实验经验,尤其是针对对数正态分布大致水平的基因表达。也可以采用一个伽玛分布,高斯混合Gamma分布[10],对于重复的实验数据。在这种情况下,单基因表达值的测量可以用正态分布N(x;滋,滓圆对应于一类二参数模型)建立的数学模型[11][13]。每个基因的表达和各种条件下,w=(滋,滓圆),似然函数可以在公式(5)中给出:P(D渣滋,滓圆)=仪iN(xi;滋,滓圆)=圆-n/2-蓘n(軃x-u)2+(n-1)s2蓡/2滓圆(5)在式C(滓()e5)中,i取遍所有的重复测量数据,C为归一化常数。似然度取决于统计量n和s2。采用先验概率分布P(滋,滓圆)也会产生几种不同的数据分析方法,先验概率分布由四个超参数向量琢=(滋0,姿0,v0,滓0圆)构成。通常使用共轭先验分布的方法。P(滋,滓圆)=C滓-1(滓圆-(v0/2+1)e-蓘姿0(滋0-u)2+v0滓0圆蓡/2滓圆(6)使用滋和滓圆相互不独立的先验分布关于)cDNA微阵列基因实验数据在公式(6)中具有意义。通过数学计算,并且可以推出的后验概率分布具有相同的功能的先验概率函数(7)式:P(滋,滓圆=N(滋;滋渣D,琢)n,滓圆/姿n)祝(滓圆;vn,滓n圆)(7)在式子(7)中:滋n=姿姿0滋0+0mvn==v姿0+nnvn滓圆0+nn=v0滓0圆+(n-1)s2+姿n综合地将先验概率分布与概率参数的后验分布的信息和0(軃x-滋0)2数据结合起来。后验分布是一种用贝叶斯方法来解析对象,包括滋和滓圆的有关数据和可能的取值,使用各种方法来估计[14]。对两个条件下每个基因的表达差异测量值都与两个模型相关,根据模型参数的不同可判断基因的表达差异是否显著[15]。贝叶斯法部分克服了由实验重复次数少造成的t检验的缺陷,若实验次数很少(2或3次),贝叶斯方法比t检验法效果好,若有5次重复实验,两者结果相似。在重复次数为2时,贝叶斯方法的假阳性率会提高。5表达谱差异进行生物信息学分析表达谱差异分析主要包括基因表达谱和蛋白质表达谱。认识疾病发病机理的有效方法是对表达谱的大规模分析,在肿瘤研究等多方面获得了相应的进展,成功的把基因表达谱分析基于实验及其过程分析相结合。实验过程是从关注的疾病开始研究,先采集大量疾病组织样本,样本量可从十多个到数百个不等,但比较分析的进行必对个体表达差异及每一种组织的类型,正常和异常疾病组织样本在大多数情况下不能简单地划分。例如,在人类糖尿病研究中发现,所有采集的样本来自胰岛素耐受的人、健康的人、糖尿病人的不同试验周期阶段,样本中还包括其他器官的取材,便于进行基因表达差异的组织分布研究,是在胰岛素治疗的前后。需要收集并储存全部的临床诊断参数和组织样本,便于对今后的基因实验数据进行分析管理。采用基因芯片(寡核苷酸基因芯片、cNDA微阵列芯片、全基因组芯片)进行基因表达谱测定来进行组织样本的处理分析和生物信息学分析,从而获得基因表达谱差异的显著性分析结果。实验的范围扩大到原测定组织以外的更多的组织样本和组织类型采用定量RT-PCR是最理想、最灵敏的确认方法,此方法就是对表达谱的分析结果需加以实验证实[16]。在实验中表明寻求差异表达基因的方法除基因芯片技术以外,也有一些新的检测方法;差异显示PCR)等也相继在数据实验中得到结合应用。、消减杂交(SuppressionPCR(DifferentialSubtractiveHybridizationDisplayPCR,DD-,SSH)6结论在现代生物信息学、分子生物学研究中表明,人的基因组约由10万左右的不同基因组成,这些基因择优性的表达确定了机体整个生命发育过程,基因表达差异的变化处在控制生物学调节机制的中心地位。在计算分子生物学使用统计方法来分析实验数据,实验数据的差异表达分析是确定两个基因差异表达在不同条件下,这样有助于揭示生命体的奥秘,还能为基因诊断与基因治疗提供重要的理论依据和指导意义。在近几年来的研究中,差异表达基因的显著性的研究不断完善与发展,已成为我们研究癌症和复杂疾病等相关基因的重要手段。参考文献1PanWLinJ,LeC.Amixturemodelapproachtodetectingdifferentiallyexpressedgeneswithmicroarraydata.FunctIntegrGenemies,):117~124.2KimSY,parisonofvariousstatisticalmethodsfori-dentifyingdifferentialgeneexpressioninreplicatednficroarraydata.StatMethodsMedRes,):3~20.3ShaikJS,YeasinM.Aunifiedframeworkforfindingdifferentiallyex-pressedgenesfrommicroarrayexperiments.BMCBioinformatics,~358.4EfronB,TibshiraniR,StreyJD,etal.EmpiricalBayesanalysisofami-croarrayexperiment.JAmStatAssoc,200l,96:.5李霞,李亦学,廖飞.生物信息学.北京:人民卫生出版社,.6曾明秀.基因表达差异的比较分析.数理医药学杂志,):210~212.7黄薇,方孝东,赵文明,等.分离差异表达基因的方法.生物工程学报,):521~524.8黎双飞,朱作言.基因表达系列分析的研究进展及应用.高技术通讯,~104.9杨畅,方福德.基因芯片数据分析.生命科学,):41~48.10蒋定锋,高峻,赵耐青.乳腺癌基因芯片数据分析.复旦学报(医学版),):169~192.11王永煜,张幼怡.基因芯片数据分析与处理.生物化学与生物物理进展,):321~323.12杨苏彬,何颖.基因芯片数据聚类分析法在疾病诊断中的应用.国际遗传学杂志,):235~234.13孙啸,王晔,张晓莉,等.基因芯片设计及数据分析软件系统.东南大学学报(自然科学版),):1~6.14荆志伟,王忠.基因芯片数据分析方法研究进展.生物技术讯,):144~148.15蒋峥,卜友泉,刘忠于.乳腺癌基因芯片实验数据分析与挖掘.医学分子生物学杂志,):220~224.16单文娟,童春发,施季森.基因芯片筛选差异表达基因方法比较.遗传,):.·163·阅读详情:
范文七:在SPSS里用Duncan法进行多组样本间差异显著性分析在SPSS里用Duncan's multiple range test进行多组样本间差异显著性分析1. 软件SPSS v17.02. 方法Duncan's multiple range test3. 适用范围比较两组以上样本均数的差别,这时不能使用t检验方法作两两间的比较(如有人对四组均数的比较, 作6次两两间的t检验),这势必增加两类错误的可能性(如原先a定为0.05,这样作多次的t检验将使最终推断时的a>0.05)。故对于两组以上的均数比较,必须使用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。4. 数据格式X是每组实验每次重复的数值,factor是实验分组15. 实现方法Analyze->Compare Means->One-Way ANOVA2点击PostHoc...选择方法,设置显著水平36. 查看结果看Post Hoc Tests部分的表格按照显著性水平P47.在表格中标明差异显著性根据这一结果即可做表格,四组分别以a,b,c,c标明其显著性差异。小写字母代表是在0.05水平下比较,差异显著;大写字母代表在0.01水平下比较,差异极显著。上图标注有误,abcd的标注由值的大小决定,a表示最大,因此从上到下应为:cbaa参考资料SPSS FOR WINDOWS简明教程5标记字母法:(1)将全部平均数从大到小依次排列。(2)在最大的平均数上标上字母a;将该平均数与以下各平均数相比,相差不显著的,都标上字母a,直至某一个与之相差显著的平均数则标以字母b(向下过程),(3)再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母b(向上过程);再以该标有b的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c。(4)如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。(5)这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,可以小写字母表示 ?
=0.05显著水平,大写字母表示 ?
=0.01显著水平。6阅读详情:
范文八:显著性分析显著性水平1.概念与意义在假设检验中,显著性水平(Significant level,用α表示)的确定是假设检验中至关重要的问题。显著性水平是在原假设成立时检验统计量的值落在某个极端区域的概率值。因此,如果取α= 0.05,如果计算出的p值小于α ,则可认为原假设是一个不可能发生的小概率事件。当然,如果真的发生了,则犯错误的可能性为5%。显然,显著性水平反映了拒绝某一原假设时所犯错误的可能性,或者说, α是指拒绝了事实上正确的原假设的概率。2.通常的取值α值一般在进行假设检验前由研究者根据实际的需要确定。常用的取值是0.05或0.01。对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能性为95%;对于后者,则研究者接受事实上正确的原假设的可能性为99%。显然,降低α值可以减少拒绝原假设的可能性。因此,在报告统计分析结果时,必须给出α值。3.进行统计推断在进行假设检验时,各种统计软件均会给出检验统计量观测值以及原假设成立时该检验统计量取值的相伴概率(即检验统计量某特定取值及更极端可能值出现的概率,用p表示)。p值是否小于事先确定的α值,是接受或拒绝原假设的依据。如果p值小于事先已确定的α值,就意味着检验统计量取值的可能性很小,进而可推断原假设成立的可能性很小,因而可以拒绝原假设。相反,如果p值大于事先已确定的α值,就不能拒绝原假设。在计算机技术十分发达,以及专业统计软件功能十分强大的今天,计算检验统计量及其相伴概率是一件十分容易的事情。然而,在20世纪90年代以前,只有服从标准正态分布的检验统计量,人们可以直接查阅事先准备好的标准正态分布函数表,从中获得特定计算结果的相伴概率。而对于的服从t-分布、F-分布、卡方分布或其它特殊的理论分布的检验统计量(大多数的假设检验是这样),人们无法直接计算相伴概率。人们通常查阅各类假设检验的临界值表进行统计推断。这些表格以自由度和很少的几个相伴概率(通常为0.1、0.05和0.01)为自变量,以检验统计量的临界值为函数排列。在进行统计推断时,人们使用上述临界值表根据事先确定的显著性水平,查阅对应于某一自由度和特定相伴概率的检验统计量的临界值,然后将所计算出的检验统计量与该临界值相比较。如果检验统计量的计算值大于临界值,即实际的相伴概率小于事先规定的显著性水平,便可拒绝原假设。否则,可接受原假设。4.举例在根据显著性水平进行统计推断时,应注意原假设的性质。以二元相关分析为例,相关分析中的原假设是“相关系数为零”(即2个随机变量间不存在显著的相关关系)。如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),就可以认为“相关系数为零”的可能性很低, 既2个随机变量之间存在显著的相关关系。在正态分布检验时,原假设是“样本数据来自服从正态分布的总体”。此时,如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),则表明数据不服从正态分布。只有p值高于α值时,数据才服从正态分布。这与相关分析的假设检验不同。5.作者在描述相关分析结果时常有的失误仅给出相关系数的值,而不给出显著性水平。这就无法判断2个随机变量间的相关性是否显著。有时作者不是根据显著性水平判断相关关系是否显著,而是根据相关系数的大小来推断(相关系数越近1,则相关关系越显著)。问题是,相关系数本身是一个基于样本数据计算出的观测值,其本身的可靠性尚需检验。此外,作者在论文中常常用“显著相关”和“极显著相关”来描述相关分析结果,即认为p值小于0.05就是显著相关关系(或显著相关),小于0.01就是极显著相关关系(或极显著相关)。在假设检验中,只有 “显著”和 “不显著”,没有“极显著”这样的断语。只要计算出的检验统计量的相伴概率(p值)低于事先确定的α值,就可以认为检验结果“显著”(相关分析的原假设是“相关系数为零”,故此处的“显著”实际意味着“相关系数不为零”,或说“2个随机变量间有显著的相关关系”);同样,只要计算出的检验统计量的相伴概率(p值)高于事先确定的α值,就可以认为检验结果“不显著”。在进行相关分析时,不能同时使用0.05和0.01这2个显著性水平来决定是否拒绝原假设,只能使用其中的1个。阅读详情:
范文九:无统计学显著性差异256P>0.05,无统计学显著性差异;在改善临床症状陕西医学杂志2003年3月第32卷第3期既往采用肝素钠,为一体内、外抗凝药,可引起血小板减少,并发出血危险性大,临床应用受到一定限制。低分子肝素通过提高抗凝血第Xa因子活力与抗凝血第()a因子活力的比值(4∶1),从而发挥很强的抗血栓形成的作用和一定的溶血栓作用。低分子肝素与普通肝素相比,其抑制FXa的作用比抑制凝血酶作用强,较少依赖AT2()[2],较少引起血小板减少,引起出血的并发症较少且轻,半衰期较长。我院4年来采用低分子肝素治疗DIC20例,采用肝素治疗DIC19例均取得良好疗效,两者比较治愈率及有效率无显著差异,但前者在凝血及纤溶指标改善方面明显优于后者,在出血及血小板减少方面明显低于后者,且低分子肝素不影响APTT。参考文献1 张之南.血液病诊断及疗效标准.天津:天津科学技术方面也无明显差异;但治疗组治疗后凝血和纤溶指标总改善率为57%(32()56),对照组为34%(18()53),两组比较P讨 论弥散性血管内凝血(DIC)是一种临床常见的综合征,其共同生化和病理生理特征是血液内凝血系统的弥漫性活化导致的凝血酶和纤溶酶活性并存,前者酶解纤维蛋白原生成可溶性纤维蛋白单体;后者引起纤维蛋白及纤溶蛋白原降解增强,产生降解产物。临床上常表现为严重的出血、器官功能障碍、微血管栓塞、微血管病性溶血性贫血及原发病的临床表现。治疗上主要是强调在治疗原发病及并发症的基础上,采取抗凝治疗、抗纤溶治疗、补充血小板及凝血因子替代治疗等措施的综合治疗。在抗凝治疗措施中,肝素治疗是其关键。出版社,2 SaguragawaI,HasegawaH,MakiM,etal.Clincaleuluationoflowmolecularweiglothcparin(FR2860)ondisseminatedintrarascularcoagulationamultclentercooperativedouble2blind(DIC)intridalcomparisonwithheparin.ThrombRes,5(收稿:)异环磷酰胺加顺铂治疗晚期非小细胞肺癌28例临床观察广东省潮州市中心医院(潮州521000) 郑志煌摘 要 目的:评价异环磷酰胺(IFO)加顺铂(DDP)治疗晚期非小细胞肺癌(NSCLC)2的近期疗效和不良反应。方法:以IFO+DDP方案化疗,IFO1.5~2.0()m,d1~d4,美安2(Mesna)0.4g,在使用IFO的0、4、8h静注。DDP20mg()~d5,3~4周为1周期,2周期md1后评价疗效,随访缓解期。结果:本组28例NSCLC,总有效率为46.4%,中位缓解期为6个月。不良反应主要是骨髓抑制。结论:IFO+DDP治疗NSCLC有较好的临床疗效,不良反反应可以耐受。主题词 肺肿瘤()药物疗法 环磷酰胺()治疗应用 顺铂()治疗应用  我院自1998年9月至2002年6月,对28例NSCLC应用IFO+DDP方案化疗取得较好疗细胞学证实的晚期非小细胞性肺癌(NSCLC)患者。初治20例,复治8例,其中男性20例,女性8例,年龄40~72岁,平均年龄63.5岁。其中鳞癌16例,腺癌12例。按1997年国际抗癌联盟(UICC)TNM分期均为()b或()期患者。所有病效,现将结果报告如下。资料与方法1 一般资料 本组28例均为病理组织学或陕西医学杂志2003年3月第32卷第3期例KPS≥60分,有客观的临床疗效评价指标,预计生存期在3个月以上。22 方 法 IFO1.5~2.0()md1~d4,Mesna0.4g,在使用IFO后0、4、8h静注。2止呕等处DDP20mg()m,d1~d5,同时辅以水化、理,3~4周为1周期,两周期后评价疗效和不良反应。3 疗效及不良反应评价标准 按照实体瘤药物治疗疗效评定标准分为:完全缓解(CR)、部分缓解(PR)、稳定(SD)、进展(PD)。按WHO抗癌药物毒性反应分度(0~())进行毒性评价。结 果1 近期疗效 28例中无CR,PR13例,SD11例,PD4例,CR+PR13例,有效率为46.4%,缓解期为2~11月,中位缓解期为6月。鳞癌有效率为43.8%(7()16),腺癌有效率为50.0%(6()12)。初治有效率为50.0%,复治的有效率为37.5%(3()8)。2 不良反应 ()~()度骨髓抑制25例,占89.3%,()~()度恶心、呕吐12例,占42.9%,1257异环磷酰胺是环磷酰胺的衍生物,为第二代磷酰胺类抗肿瘤药物,对小细胞肺癌和NSCLC均有较好的疗效。据国内研究报道,总有效率为50%,其中初治病例为52.8%,复治病例为45%,本组28例NSCLC应用IFO+DDP方案化疗,总有效率为46%,初治病例为50.0%,复治病例为37.5%,初、复治病例间有显著性差异(P参考文献1 韩福才,杨卫华,朱海波,等.异环磷酰胺加顺铂治疗晚期非小细胞肺癌.中国肺癌杂志,)∶612 蔡 莉,王 艳,陈公琰.NVB+DDP+IFO联合治疗例出现一过性肉眼血尿,()度肝功能损害4例,()度肾功能损害5例,末梢神经炎1例。讨 论非小细胞肺癌58例近期疗效观察.中国肺癌杂志,)∶59(收稿:)乌拉地尔治疗术中高血压急症62例临床观察江苏省金湖县人民医院(金湖211600) 殷志春摘 要 目的:评估乌拉地尔(压宁定)静注治疗术中高血压急症的降压效果及其安全性。方法:62例术中高血压急症予以12.5~25mg乌拉地尔静脉注射,观察用药前后血压、心率的变化。结果:血压在用药后5min即明显下降,20~30min达到高峰并保持稳定。60min时降压幅度收缩压为24.3%,舒张压为25.6%,心率无明显改变。结论:乌拉地尔治疗术中高血压急症起效快,降压效果显著、平稳,副作用小,无反射性心动过速,是控制术中高血压急症较为理想的药物之一。  主题词 高血压()治疗 @乌拉地尔 急症 手术期间  乌拉地尔(压宁定)作为一种新型的Α受体阻滞剂,具有外周和中枢的双重降压作用。我们将其用于治疗术中高血压急症,取得了比较显著的降压效果,现报告如下。资料与方法1 一般资料 62例患者中,男44例,女18例,年龄28~76岁。其中颅脑手术19例,胸部手术15例,腹部手术16例,四肢脊柱手术10例,其阅读详情:
范文十:数据差异显著性检验2012年第4期农机使用与维修51数据差异显著性检验黑龙江省农业机械工程科学研究院摘要张凤菊刘晓娟赵丽平于晓波张范良当试验数据出现两种或者多种不同的结果时,应该采用统计学的方法进行数据分析。本文介绍了什么是显著性检验,几种常用的显著性检验的方法,通过显著性检验判断试验数据之间的差异是否显著,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。关键词农机检测统计分析显著性检验0引言在试验、检测的数据处理过程中,时常会出现两差异程度。1两组样本平均数的比较当比较两种或多种处理的试验结果的平均数时,通常先假定它们是从同一总体内抽取的多个样本,它们之间没什么差异(即平均数之差等于零)。如果检验后所得的差数是由于抽样误差所引起的概率(p)少于或等于5%时,则称这差数与假设不符合,即它们之间存在的差异是显著的。1.1成组比较检验当两个样本平均数X1和X2作比较时,看X1-X2差数是否有显著的差异。随机变量X1和X2都是正态分布,则X1-X2也必然是正态分布。采用t检验法对两组样本的差异显著性进行检验。在计算出t值后,根据自由度查t表而决定差异是否显著。若计算所得t值在t表中所得概率小于P=0.05,就表示差异显著,反之则认为不显著。t检验法的计算公式如下:t=式中|X1-X2|SX1-X2种或者多种不同的试验结果。对数据进行比较分析时,不能仅凭两个结果的不同就作出结论,而是要进行统计学分析,对数据进行差异显著性检验。显著性检验就是事先对总体(随机变量)的参数或总体分布形式作出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著差异。这时我们要做两种检验,一种是检验数据是否是属于母体内抽取的样本,即检验总体参数与样本统计量之间是否存在着显著的差异;另一种是检验数据的统计量是否存在着显著的差异。差异显著性检验就是要判定造成差异的原因,即差异是由于误差或偶然因素引起的或两者确实本身存在着差异。显著性检验是针对我们对总体所作的假设做检验,其原理就是“小概率事件实际不可能性原理”来,接受或否定假设。所谓“显著”就是指两种或多种处理试验结果之间,本身确实存在差异。如果是“不,显著”就说明它们之间的差异是由抽样或偶然的因素引起的,不是真正有实际差异存在。在数理统计中一般以概率(P)5%作为显著评定即在100次试验中,由于偶然因素造成差异的标准,可能性在5次以上,其差异被认为是不显著。如果两者差异在概率为5%的范围内,出现这样概率的机会非常小而出现了,那么我们就认为此差数具有显著差异程度。有时我们认为5%太低,则可提高到1%作为显著评定标准,若两者的差异在概率为1%的范围内,那么我们就认为这个差数具有极显著的为:X1、X2—两样本算术平均数;SX1-X2—两样本平均数差数的标准差。两样本平均数差数的标准差SX1-X2的计算方法①如果两个样本的个数相同时,计算公式为:SX1-X2=X1+SX2n②如果第一个样本个数为n1,第二个样本个数为n2,则计算公式为:52X1nSX2n农机使用与维修2012年第4期计算差值的平均值为0.14,标准差为0.167,差数的标准差为0.075,计算出t=1.87。查t分布表得t0.05,故认为两组人员检测数据差异性不4=2.776,显著。2方差分析方差分析是平均数差异显著性检验的另一种方法,用来检验比较两组以上的几组平均数的差异和比较变量的差异的方法。方差分析应用F检验法,两个方差的比值就是F值。S21F=2S22S2根据两个自1与S2各有它的自由度V1与V2,S1-2=式中S2S21、2—两个样本的标准差;n1、n2—两个样本的个数。例如:有甲、乙两台圆盘耙进行耙深的稳定性检+测。甲耙为4片耙,测定20次,平均耙深为66mm,标准差为2.1乙耙为36片悬挂耙,测定20次,平均耙深为65.2mm,标准差为1.9mm。试问甲、乙两台圆盘耙的耙深稳定性之间的差异是否显著。两样本平均数差数:|X1-X2|=|66-65.2|=0.8mm两样本平均数的差数标准差:SX1-X2=1+S2n=1+1.9=0.63320由度查F检验表,从表中得到F0.05,V1,V2与F0.01,V1,V2值,如计算得F>F0.05,如计算得V1,V2则为差异显著,F>F0.01,V1,V2则为差异极显著。在计算F值时一般比较大的方差为分子,较小的方差为分母。例如:甲、乙两种犁进行耕深稳定性试验。甲犁测定20次,平均耕深20.5cm,标准差2.45乙犁测定15次,平均耕深20cm,标准差2.7cm。试问甲、乙两犁的耕深稳定性是否有显著的差异。S22.727.251F=2===1.26S22.452V2=19,F0.05,查F检验表,自由度V1=14,14,19=F0.01,2.26,故认为14,19=3.19。现计算出的F=1.2,两种犁的耕深稳定性无显著的差异。F值的显著性是表示各级间差异是否显著的总体情况,并不能说明某几组之间的差异是否显著。所以在求得F值为显著后,应进一步用t检验来检验各组间的差异是否显著。3小结在试验、检测中常会出现不同的试验数据,即使在同一总体中得到的几个试验数据,它们之间也会存在着差异。那么它们之间的差异是否显著,能否代表真实的检测结果,就有必要通过差异显著性检验进行验证。正确地运用显著性检验,可使实验或调查的结论建立在更科学、稳妥的基础上,避免简单化和绝对化。(05)(X1-X2)0.8t===1.26SX1-X20.633自由度V=(n1-1)+(n2-1)=38,从t分布表t0.1,现计算t=1.26,即查t0.05,20=2.086,20=1.725,表示两个样本的平均数差异不显著,说明这两种圆盘耙的耙深稳定性差异不显著。1.2成对比较检验成对法是指两个样本的各个变量,有合理的联系,彼此之间各有关系存在。成对比较进行差异显著性检验时,只要计算出各对的差数d,求平均差数d和差数的标准误差S,用t检验法检验,见公式:dSt=,其中S=Sd—平均差数;Sd—差数的标准差;S—标准差。例如:在实验室人员比对试验中,两组比对人员分别对IT245型旋耕机弯刀刀身硬度进行检测,每组测试5点,检验两组测试结果差异是否显著,见下表。比对人员第一组第二组差值测试值(HRC)151.851.70.1244.143.80.3349.449.30.1452.752.40.3547.147.2-0.1式中阅读详情:}

我要回帖

更多关于 差异有统计学意义 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信