手机浏览器扫描二维码访问
二、数据的初步整理
banner"
>
任何数据资料在进行分析前都需要进行无效数据的筛选和剔除。
判断无效数据的标准有以下几点。
第一,录入错误。
数据录入过程中的错误不可避免,有些错误通过检查是可以得到发现并更正的,如图12-2与图12-3中列出的第6条数据的性别,在数据中录入的值是3,明显是录入错误,这种情况下可以根据编号找回原始问卷进行修改。
第二,数据漏答、错答比较多。
一般情况下,错漏答问题数超过全部问题数的5%可以认为被调查者并没有认真完成调查,该条数据无效,需要剔除。
第三,回答呈现出某种机械的规律性。
如果被调查者的选择集中于某个选项或者规律性地在几个选项之间循环,如“111111”
“555555”
或者“1234554321”
“1234512345”
等,都表明被调查者并没有真正地回答问题,数据无效,需要剔除。
第四,测谎题超标。
如果调查问卷含有测谎题,被调查者在测谎题上面的回答显示其说谎,则说明被调查者并没有真实地回答问题,数据无效,需要剔除。
第五,异常数据。
异常数据有两类,一类是明显的逻辑错误题,比如被调查者在回答是否是独生子女时选择“是”
,在回答父母是否偏心时也选择“是”
,则说明至少一个问题上的回答是虚假的,反映被调查者的配合度比较低,可以考虑剔除数据。
另一类是指在总体数据中,个别数据的数值极端大或者极端小。
比如心理学实验中被试的反应时如果低于100毫秒,说明被试没有看到刺激就按键反应,属于无效数据。
另外也可根据三个标准差的原则剔除极端数据,即删除平均数加减三个标准差以外的数据。
例如,在分析两个班级的语文成绩是否有差异时,可能会存在一些极端成绩,并不能代表班级的一般水平,就需要按三个标准差的原则剔除极高分与极低分。
具体做法为:假设A班平均分为80分,标准差为6分,则A班98分以上和62分以下的成绩属于三个标准差以外的极端数据,需要删除。
根据以上标准经过无效数据删除后的数据才是最后用于统计分析的有效数据。
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。
朵朵新书重生之娇娘军嫂已发布,欢迎亲们来阅读 大土炕,大黑墙,一个房间空荡荡。 一身衣,不够长,洗的发白旧衣裳。 一朝醒来年轻十岁,还搭上一个长相妖孽的便宜军人丈夫一枚。 可是今天早上还棒打了他老娘,这个怎么破 某妖孽男冷冷的看着她说吧,你又闯什么祸了 s普通书友群285699337无需粉丝值,书友群611482740需要达到粉丝值3000谢谢支持...
理科学神陈牧,目标最高学府的好学生,却被系统选中,必须成为英雄联盟的大魔王!...
茶茶历劫失败,穿到江家村的傻子江茶的身上,爷奶偏心,叔婶虚伪,堂弟妹恶劣。好在还有一对护短,待她如珠如宝的父母。家贫如洗?不怕,不怕!想要富,先种树。包山林,种茶树,江家成了村里第一个万元户。大字不识?无妨,无妨!想聪明,先读书。进学校,考状元,茶茶成了村里第一名大学生。农村来的,被人看不起?省万元户,了解一下。没有特长,被人看笑话?预知祸福,了解一下。众人嘲讽书呆子,没人追?茶茶一把拉过某科研大佬我未婚夫,认识一下!...
ps女主不是圣母,手段略狠,没有男主,建议勿入。种田科举基建剿匪魂穿架空古代,被当做男娃儿养,这个她不愁,唯一愁的是六个姐夫的人选。ampampbrampampgt 在李家柒眼里六个姐姐都很好,这姐夫自己可...
上辈子作死的反派江小小重生回到了下乡当知青之前,这一次小可怜翻身智斗白莲花继母和继姐,好不容易带个金手指空间。凭什么空间还可以共享?她避之不及的上辈子高岭之草居然是空间的另一半主人问题是有人种田...
路澄穿书了! 多重穿书,多重身份,极尽酸爽。...