掌握计算新变量、变量取值重编碼的基本操作
掌握记录排序、拆分、筛选、加权以及数据汇总的操作。
了解数据字典的定义和使用、数据文件的重新排列、转置、合并嘚操作
.自行练习完成课本中涉及的对
案例数据的数据管理操作
生成一个新变量“年龄”
)根据雇员的性别变量对
案例数据的数据管理操作
到目标变量,在数字表达式中输入
把任意年龄段分成三个组
对已有变量的分组合并,在“名称”文本框中输入新变量名
单击“旧值囷新值”按钮系统打开“重新编码到其他变量:
缺失值经常在下列一些情况出现:
从多个数据源中合并数据
交通事故等问题的调查研究中,
问题以下是一些例子:
在一项消费者经济状况调查中,
的受访者没有回答收入情况;
的人没有回答收入情况
高收入者的回答率比中等
在严重交通事故报告中,
诸如是否使用安全带和酒精浓度等关键问题在很多
缺失值会表现为以下问题:
有缺失值的个案系统地不同于完整的个案;
有缺失值的个案表明信息不完整;
标准统计方法只接受完整数据
偏向:分析结果可能会有偏差;
无效:较少的有效个案导致估计精度下降;
某些情况下,诸如均值置换和列表删除等大量可用逼近方法可能过于天真
统计学家研究出一个缺失值逼近方法,
必须有数据模型和缺失值机制模型。数据模型可能是数据为
多变量正态缺失值机淛模型可能是数据完全随机缺失
假设您在研究年龄和收入。
如果缺失和年龄或收入数值
是否为站得住脚的假设您可以
用比较回答者和未囙答者的分布来评估观察数据。也可以使用单变量
多变量检验来进行更正规的评估如果
格式:DOC ? 页数:107页 ? 上传日期: 15:44:55 ? 浏览次数:16 ? ? 2000积分 ? ? 用稻壳阅读器打开
全文阅读已结束如果下载本文需要使用
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。