[战略,国家,数据]大数据的国家战略(3)

发布时间:2021-06-06

目前无论从哪个角度看,大数据仍处在初始阶段。尽管企业和媒体对大数据时代的到来表现出空前热情,但政策制定者、社会法律学者和科技人士应当对此保持清醒并对已经面临的和将会出现的问题有所准备。

出台推动大数据产业链的导向性政策

在我们刚刚步入大数据社会时,不妨做一些前瞻性思考。比如,应当从物理层面审视和规划数据如何收集、存储、处理、传输和共享;从数字产品生产层面考虑研发什么样的分析

工具、使用什么样的软件平台和基于什么样的环境(如开放代码);从使用层面考虑引进

培养什么样的人才和训练什么技能,以及在更广义的范畴考虑如何形成大数据思维和文化,大数据将会对未来企业与人、政府与人的关系有何影响,等等。

大数据社会要求人们学会用一种全新的方式打量这个世界,工具、技术、技能和人才缺一不可。要及早部署和投资在以下方面:

数据分析工具和软件平台:人工智能(AI)技术,自然语言处理、模式识别、机器学习、预测分析、数据熔炼、信号处理和元数据管理,等等;大数据要求同时在数十数百甚至数

千台服务器中进行大规模并行运算,目前使用的大多数关系数据库管理系统、桌面数据库和可视化软件包已很难满足需求,因此仍须关注MPP数据库、分布式文件及分布式数据库

的发展。

数据分析人才和算法模型:培养训练会使用大数据分析语言工具的人才只是整个需求的表层。再深入一层,要让大数据发挥作用,跨行业顾问、分析师和有行业经验的编程人员缺一不可。融合技术和艺术,能将“抽象”概念形象化的语言、工具及人才尚不多见。没有数学模型很难想象数据如何“大”起来,数据只有通过算法模型才能被电脑解读,但数学模型在政治、社会和金融等领域只能逼近现实而无法再现现实。所以如何建立能精准模拟世间万物的数学模型,是集理论研究与应用开发为一体的重要地带。

把数据质量的管控权交给使用端

当人类让数字讲话、把决策权更多移交给“大数据”时,第一个重要问题就是数据的质量。“垃圾进、垃圾出”这句话早在50年前就被用来描述自动化处理数据时的质量问题,此话今天依然有效。研究表明,知识工作者平均花近一半的时间在寻找数据、验明数据、修正数据、剔除不靠谱的数据。数据质量问题可能发生在收集、存储、处理、传输和分享整个过程中的任何一个环节,但第一个关口仍是数据录入端(记录或采集口)。大多数情况下,数据输入端很少知道数据使用端为什么需要这种数据,用这些数据做什么。当使用端发现问题时,除非是系统性问题,大多被随手解决,少有追根溯源式纠正问题。

那么数据的质量如何保证,谁应对质量负责呢?解决数据质量的问题,更多是在管理而不在技术。行之有效的方法是把数据质量的管控权更多地转给使用端(业务条块),建立数据“原料方”和“生产方”之间直接的客服关系,形成制度和方法从数据源头和元数据层面控制质量。

精彩图片

热门精选

大家正在看