基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据质量管理是信息系统建设的首要问题.本文首先回顾了数据质量的定义和质量提高策略的分类,然后对数据质量研究涉及的两个主要方面,即数据质量评估和数据质量提高技术的各种方法进行了比较和分析,并对有代表性的数据质量提高工具进行了介绍.最后提出了一个评估驱动的数据质量提高框架,并对数据质量研究方向进行了展望.
推荐文章
中文数据清洗研究综述
中文数据清洗
数据质量管理
数据集成
数据质量维度与框架研究综述
数据
数据质量
数据质量维度
数据质量框架
生成对抗网络及其在新能源数据质量中的应用研究综述
新能源
数据质量
生成对抗网络(GAN)
基于大数据的数据质量评估方法研究
大数据
数据质量
质量评估
综合评价
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据质量研究综述
来源期刊 计算机科学 学科 工学
关键词 数据质量 数据清洗 机器学习 数据审计
年,卷(期) 2008,(2) 所属期刊栏目
研究方向 页码范围 1-5,12
页数 6页 分类号 TP3
字数 8110字 语种 中文
DOI 10.3969/j.issn.1002-137X.2008.02.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐立臻 东南大学计算机科学与工程系 52 1042 17.0 31.0
2 董逸生 东南大学计算机科学与工程系 118 3003 29.0 49.0
3 韩京宇 中科院软件所基础软件国家工程中心 1 191 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (26)
参考文献  (11)
节点文献
引证文献  (191)
同被引文献  (233)
二级引证文献  (473)
1959(1)
  • 参考文献(1)
  • 二级参考文献(0)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(3)
  • 参考文献(1)
  • 二级参考文献(2)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(4)
  • 参考文献(2)
  • 二级参考文献(2)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(3)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2008(5)
  • 引证文献(5)
  • 二级引证文献(0)
2009(15)
  • 引证文献(14)
  • 二级引证文献(1)
2010(24)
  • 引证文献(17)
  • 二级引证文献(7)
2011(21)
  • 引证文献(12)
  • 二级引证文献(9)
2012(30)
  • 引证文献(11)
  • 二级引证文献(19)
2013(58)
  • 引证文献(23)
  • 二级引证文献(35)
2014(57)
  • 引证文献(19)
  • 二级引证文献(38)
2015(64)
  • 引证文献(23)
  • 二级引证文献(41)
2016(84)
  • 引证文献(15)
  • 二级引证文献(69)
2017(99)
  • 引证文献(18)
  • 二级引证文献(81)
2018(98)
  • 引证文献(20)
  • 二级引证文献(78)
2019(78)
  • 引证文献(11)
  • 二级引证文献(67)
2020(31)
  • 引证文献(3)
  • 二级引证文献(28)
研究主题发展历程
节点文献
数据质量
数据清洗
机器学习
数据审计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
总被引数(次)
150664
论文1v1指导