o样本标准差或s总体标准差、n样本數、p总体比例或π样本比例、相关系数w、R相关系数、Ra、B回归系数、误差项左w
统计学含义:统计学是一门收集、处理、分析、解释数据并从數据中得到结论的科学
关系:样本平均值=总体、样本标准差=总体标准/sqrt()
平均数u/标准差o/比例pi |
---|
随机抽样與非概率抽样的特点及使用情况:
随机抽样遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本当用样本估计总体時,要考虑到每个单位样本被抽到的概率技术含量和成本比较高。目的:掌握和研究对象总体的数量特征得到总体参数的置信区间
非概率抽样:不是随机抽取,而是根据实验目的对数据的要求采用某种方式从总体中抽取部分单位实施调查。操作简单、时效快、成本低技术含量不高。适于探索性研究研究结果用于发现问题,为更深入的数据分析提供准备
全面調查:普查与统计报表制度
非全面调查:重点调查(重点的)与典型调查(具有代表性的)
非抽样误差(可以避免):抽样框误差、回答誤差、无回答误差、检察员误差、测量误差
直方图和条形图的区别:
面积表示频数高度表示每一组频数,宽度表示组距 | 长度表示各类频數的多少宽度固定 |
---|---|
数据透视表(分类汇总、总和、平均值)
直方图(描述一组大批量数据分布)与条形图()区别
茎叶图(描述小批量数据分布)
散点图(描述两者是否存在关系)
线图(描述变化趋勢)时间一般绘在横轴数据绘在纵轴
累计频数分布图(适合于顺序图)
环形图(适于研究两个及其以上样本或总体的结构性问题)
饼图(描述结构性问题)
**帕累托图(**大小排序后的条形图+占有百分比)
气泡图(显示三个变量之间的相关关系)
雷达图(多个变量在不同样本間的相似度)
左偏右倾:平均数<中位数<众数
作用:反应多组数据离散程度
分类数据:异众比率(1-众数/所有数)
数值型数据:方差、标准差(开平方):样本/n-1,总体/n
相对离散程度:离散系数=标准差/平均数 v=s/x
分布特征从哪几方面测度
(s为标准差n为样本数,x为样本岼均值)
偏态系数=0为对称分布;> 0为右偏分布;< 0为左偏分布;x>1或<-1被称为高度偏态分布;0.5~1或-1~-0.5之间,被认为是中等偏态分布;越接近0偏斜程度就越低
峰态系数**=0扁平峰度适中;<0为扁平分布;峰态系数>0**为尖峰分布
基本事件:一個不可能再分的随机事件(例如:掷一枚骰子出现的点数)
样本空间一个试验中所有基本事件的集合,用W表示(在掷枚骰子的试验中W={1,2,3,4,5,6})
古典定义:事件结果有限,每次出现的可能性相同
主观概率:对一些无法重复的试验确定其结果的概率只能根据以往的经验人为确定(峩认为2016年的中国玉米价格将下跌)
抽样分布:总体X值已知时,对任意自然数n都能导出统计量T=T(n)的分布表达式
含义:取有限个值或所有取值嘟可以逐个列举出来1/2/3)
描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布
采用不重复抽样,各次试验并不獨立成功的概率也互不相等
(可以取一个或多个区间中任何值0<x<10)
比正态分布要平坦,随着自由度增加主键趋近于正态分布
2的一个任意总体中抽取容量为n的样本,当n充分大时样本均值的抽样分咘近似服从均值为μ、方差为σ2/n的正态分布
统计方法=描述分析+推断统计(=参数估计+假设检验)
估计量(样本均值、样本比例、方差等)用於估计总体参数的统计量
估计值:估计参数时计算出来的统计量的具体值
点估计用样本统计计量的某个取值直接作为总体参数的估计值
区間估计u在点估计的基础上,给出总体参数估计的一个区间范围该区间由样本统计量加减估计误差而得到。
置信区间:由样本所构造的总體参数的估计区间
置信水平:在该区间所占次数与总体次数的比值
总体均值、总体比例、总体方差
1.先对总体的参数(戓分布形式)提出某种假设然后利用样本信息判断假设是否成立的统计方法
1.有参数检验和非参数检验
3.逻辑上运用反证法,统计上依据小概率原理
n小概率是在一次试验中一个几乎不可能发生的事件发生的概率
n在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
原假設H0:u最初被假设是成立的之后根据样本数据确定是否有足够的证据拒绝它
备择假设H1通常用于表达研究者自己倾向于支持的看法,然后就昰想办法收*-集证据拒绝原假设以支持备择假设 (原假设的对立)
双侧检验备择假设没有特定的方向性,并含有符号“?”的假设检验
单侧检验備择假设具有特定的方向性并含有符号“>”或“<”的假设检验
三中检验方式:方差、比例、均值
目的:该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等
误差:随机误差(方差分析下某一水平下样本数据之間的误差)、系统误差
F检验线性关系的显著性、T检验各回归系数的显著性、卡方可以用于测定两个分类变量之间的相关程度,拟合优度检驗和独立性检验
判定系数R?=SSR/SST (估计的线性方程与各观测点的拟合程度0<R?<1,越接近1拟合程度越强)
多重判定系数Ra?:估计因变量的的改变中,自變量的改变的比例 Ra?<R?
估计标准误差Se=sqrt(MSE):度量各实际观测点在直线周围散布状况的一个统计量
含义:是根据样本数据计算的度量两个变量之间的线性关系强度的统计量
假设:两个变量都是随机的
绝对值不大于1;对称性
含義;当回归模型中两个或者两个以上自变量彼此相关
回归系数正负号与预想不同
茬X?在Excel表格中怎么计算表格中输入一个编复号后另制一排根据对照表自动2113显示该编号5261对应的内容,可使4102用VLOOKUP函数实现1653
【函数说明,其中$D$3:$E$6昰需要查找的表格对照区域绝对引用2表示返回D列后一列的内容。VLOOKUP(A2,$D$3:$E$6,2,0)表示A2编号从D列查找对应的编号,相同则返回E列的内容最后0表示精确查找,再借助IFERROR函数如果查找结果有误,则返回空值】
2、回车完成公式编辑输入然后下拉填充下方单元格公式即可。
3、返回X?在Excel表格中怎么计算表格在编号所在列输入任意编号,发现另一列自动显示该编号对应的内容操作完成。
返回在B:B数组袭中F2元素的相应位bai置
本回答被提问者和网友采纳
下载百度知道APP,抢鲜体验
使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。