根据检查规则,满足数据分析的要求~
数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
(0)
在一定程度上讲,一个国家统计数据的质量,在很大程度上能够反映出一个国家的发展水平。
OECD国家,基本上是世界上最发达的国家(当然,有几个还是有点牵强),这些国家的数据,干净清晰,规范性和可比性强,分析起来非常舒服,这也是很多的跨国研究都使用OECD国家数据的原因。
(1)数据质量目前探查数据的问题包括5个方面:正确性、准确性、一致性、时效性和冗余。
正确性是指数据正确反映了其实体的真实属性,数据正确性问题的引起包括采集系统缺陷造成的数据错误,人工输入时的失误,采集工具出现系统性问题(如失效、断电等)等等,
准确性是指数据本身的误差较小,如我们测量月亮到地球的距离,可以采用激光测距法,也可以根据月亮大小来目测,其准确性的差别一目了然。
一致性就是指多条数据之间不存在相互矛盾,如果我们看到北京市人口有2千多万,海淀区人口有3千多万,即使我们并不知道哪个数据是对的,但我们可以判定必然有一个是错的,因为北京市包括海淀区。
时效性是指数据存在一定的时间属性,以前正确的数据,不见得当前就是正确的,最典型的就是手机号码,因为用户是可能换手机的。
冗余就是指数据中包含多于一条描述同一个实体的数据,主要发生在多数据源集成后的数据。
目前数据质量的解决方案一般包括数据剖析、数据规则提取和编写、数据监控、数据增强和数据历史管理等。数据剖析就是通过工具对数据进行深入理解,挖掘其中的数据规则;数据规则可以通过剖析得到,也可以由用户手工编写;数据监控就是通过执行数据规则,提取出不符合数据质量标准的数据;数据增强是对现有数据缺失的内容进行修补,使之成为可靠数据;数据历史管理则管理数据在其生命周期各个时间点的取值,帮助用户在某个具体的时间截面上使用数据。
http://blog.csdn.net/liujinz72213/article/details/7555153
(2) What are the four broad categories of data quality checks Provide an implementation technique for each.
数据质量检查的四大类是什么?为每类提供一种实现技术。
答:数据质量检查是ETL工作中非常重要的一步,主要关注一下四个方面。
1.正确性检查(Corret)
检查数据值及其描述是否真实的反映了客观事务。例如地址的描述是否完全。
2.明确性检查(Unambiguous)
检查数据值及其描述是否只有一个意思或者只有一个解释。例如地名相同的两个县需要加区分方法。
3.一致性检查(Consistent)
检查数据值及其描述是否统一的采用固定的约定符号来表示。例如币别中人民币用'CNY'。
4.完全性检查(Complete)
完全性有两个需要检查的地方,一个是检查字段的数据值及其描述是否完全。例如检查是否有空值。另一个是检查记录的合计值是否完全,有没有遗忘某些条件。
(3 ) ERP 数据质量检查规则
一、ERP静态数据检查:
1、编码检查。经常会发现比如1000、1001、1002...1999这样流水下去的编码下,不知道什么时候冒出来一个10001这样一个编码的基础数据,在整个基础数据中,显得“鹤立鸡群”,比较刺眼,也容易在录入中犯错误。
2、同一个数据多个编码,数据少,很容易检查出来,数据多了,容易漏掉,因此建议大家在录入(导入)基础数据时,不妨多几个人进行检查。
3、存货的计量单位,犯错误的几率也比较大,因为比较隐蔽哦。
4、还有一个经常犯错误的地方,在BOM(物料清单),请仔细检查相关的部门、仓库、以及对应的母子件数据。
5、仓库(存货)的计价方法,千万不要等到月末结帐的时候,才发现仓库(存货)的计价方法不正确。
二、初始化数据:
1、注意检查存货初始数据与总账科目的初始数据是否一致。
2、库存的初始数据中对应的仓库是否正确和出入库类别
3、暂估初始化数据是否已录入,并全部录入完毕
4、如有成本模块,则成本初始化数据,一般需要与总账在产品的金额一致。
三、日常数据
不要以为光数量正确,就万事大吉了,还要检查各项数据的正确性。各种单据(包括出入库单、生产订单)的常见错误有:
1、注意单据日期是否正确
2、注意出入库部门、仓库是否正确
3、注意出入库类别是否正确
4、注意如果使用的是多计量,计量单位选择的是否正确
5、注意出入库物料(存货档案)选择的是否正确。
(4) 怎样写统计数据质量检查工作汇报?
一个范文作为参考。
《开展统计数据质量检查纠改自查报告》
为了认真贯彻落实国统字[2006]84号文件和县统计局关于开展农村统计调查数据质量检查工作的通知精神,我镇于2006年6月6日召开镇、村两级统计工作会议,传达《通知》精神,安排部署统计数据质量检查工作,认真按照文件的要求逐项落实自查自纠、边查边改措施。现将我镇开展统计数据质量检查纠改的工作情况作如下报告:
一、通过对我镇镇、村两级2004年1月至2006年6月的统计表和各项调查工作进行自查,我镇在统计工作中没有发生下列违法行为:
1、没有虚报、瞒报、伪造、篡改统计资料的行为;
2、没有拒报、屡次迟报统计资料的行为;
3、没有未经批准,擅自制印统计调查表的行为;
4、没有单位领导干扰统计数据,从而造成统计数据失真的行为;
5、没有利用统计调查损害社会公共利益或者进行欺诈活动的行为;
6、重点对各项统计调查和统计资料进行自查、复查。
二、我镇在抓好统计基础工作中做了以下几个方面的工作:
1、建立了镇统计站、统计站由党政办公室、统计办公室、计生办公室、经管办公室组成。人员有党政办主任、政府统计员、计生统计员、经管统计员,办公室设在党政办。
2、政府、计生、经管、教办、公安及9个村均落实了专兼职统计员。
3、镇、村统计工作均按照统计制度的规定设置原始记录,建立健全统计档案。
4、统计工作制度在自查自纠工作中进一步完善。
5、政府专职统计员按文件要求持证上岗。
三、存在问题
1、少数兼职统计人员业务素质较差还不适应新时期统计工作的要求;
2、村级由于三年一届的换届选举,直接影响统计人员的工作情绪,造成部分统计表册不健全。
3、村向各部门上报的表册数据有不统一的情况。
4、企业上报统计报表屡次迟报统计资料和数据失真的情况。
针对上述情况,经政府及执法领导组研究决定,制定以下纠改措施:
1、每月统计站对村级统计员进行一至二次业务培训,不断提高村级统计人员的业务素质和业务水平;
2、进一步做好村级统计员的思想工作,尽量稳定统计人员队伍;
3、建议上级统计执法部门对相关企业加大执法力度;
4、统一思想,提高对统计工作的认识,完善统计工作制度,强化责任感,严禁统计资料遗失,杜绝数出多门。确保统计数据及时、准确、统一、完善。真正做到向各级领导体统制定政策真实可用的统计资料。
(5)数据质量年{工商、企业养老保险管理服务中心等等机构}
提早关注数据质量,则在以后的工作中可以减少很多麻烦,节省大量时间,为宏观决策提供重要依据。当然,这是一个迭代过程,也与业务规则有关