首页>人物·生活>聚·焦点聚·焦点
邬贺铨:现阶段我国大数据共享面临的问题
作者:中国工程院院士、原副院长 邬贺铨
大数据的共享与开放
国务院《促进大数据发展行动纲要》提到,推动政府信息系统和公共数据的互联共享,避免重复建设和数据打架,增强政府的公信力,促进社会信用体系建设。
大数据共享包括政府部门之间的数据共享、跨行政区域政府间的信息共享、政府与企业间数据的合作和共享、企事业单位之间的数据共享等。
政府层面,需要设立大数据协同管理机构,促进政府部门间的数据共享,但是必须要健全大数据相关制度框架和制度体系。另外,需要进一步建立基础数据库,一方面要集中存储被共享的数据,同时进行清晰校验和整合,提供可以共享的目录,以便用户可以接入和收取这些数据。当然,还要规定访问的权限和进行灾备等。
中国政府数据开放平台分布较不均衡,其中沿海经济发达地区占总数的70%,西部中部比较少。虽然中国政府开放了教育、医疗、文体、环境等方面的数据,但是开放数据的总量偏低、结构化程度低、数据质量不高、民众参与反馈不准。
数据共享和开放现在面临三大挑战:第一,不愿意共享开放,政府部门各自为政、把数据开放当成自己的权利。第二,法律法规制度不够具体,不清楚哪些数据可以跨部门共享和向公众开放。第三,缺乏公共平台,共享渠道不畅。
大数据的流通与交易
数据有提供方和使用方,很多时候,数据需要通过中介方进行交易。政府开放的数据是脱敏以后的原始数据,数据挖掘公司将政府数据加工后出售给数据使用方、行业户。一般来讲,数据生产者很少直接面向最终用户,大多通过中介渠道实现自身数据的变现。
大数据交易的关键是对数据质量的要求,包括数据的准确性、真实性、完整性、一致性等。关于交易数据合法性、及时性、可用性、安全性等问题,都是现阶段我国数据交易所面临的问题。
政府的数据不存在提供给中介方交易的问题,当然,中介方可以收集政府的数据进行加工。运营商收集的用户数据原则上所有权是用户,BAT收集的数据原则上所有权是用户,但是运营商和BAT拥有对数据脱敏及挖掘分析后加工数据的所有权。有数据的公司通过数据挖掘向政府和企业提供咨询报告,这类公司虽然没有数据所有权,但是有数据挖掘能力;而那些没有数据,但是有数据挖掘能力的公司,可以受委托完成数据挖掘。是否允许前者在?;ひ胶凸野踩那榭鱿绿峁┦?是否允许后者受委托进行数据挖掘后利用数据为非委托方服务,这些问题现在还没有明确规定。
此外,没有数据也没有挖掘能力的公司,可以作为中介平台,但是是否可以允许其截留数据呢?中介方收集了政府开放的数据据为己有并且出售是不是合法?因此,关于在数据源的稳定性、更新频率和数据扩散等方面,也需要相关规定给出明确的界限。
精加工的数据、可视化的数据怎么定价,怎么衡量数据挖掘的工作量,一次性买断的数据和可以重复多次出售的数据怎么定价,数据的价值与时效性有什么关系,是不是需要有对数据评估的第三方机构,都是现阶段国内数据流通和交易存在的问题。
政府和企业组织没有充分认识到用外部数据可以对自身工作和业务起到巨大的提升作用,所以,一般来讲都很少利用外部数据。很多数据拥有者对数据蕴含的价值缺乏足够的洞察,不放心让自己的数据进入流通环节,担心企业机密泄露。所以,流通也不够,交易也不够,利用更不够。
大数据利用和?;?/strong>
目前,欧盟制定了严格的数据?;しò?中国虽然有宏观上的数据保护要求,但是没有全面的数据?;しü妗?/p>
多元数据是跟个人隐私、专业、公共生活有关的任何信息,包括姓名、照片、电子邮件地址、工作表现、经济状况、健康状况、个人偏好、兴趣、IP地址等。针对个人信息的收集、记录、组织、建构、存储、修改、咨询、使用、传播和其他应用,包括排列组合,都可以通过人工处理或自动化处理。
个人具有管理自己数据的权益,具有自己的数据被泄露能够获得及时通知的权利以及被遗忘权。对个人数据处理,要合法公正透明,必须有规有法。只有为了公共利益或历史研究,个人数据才能长时间存储,其他目的个人数据不能长时间存储。同时,还要保证收集的个人数据有技术措施保证,不能被非法授权、非法处理、遗失丢失和损毁。
并不是说个人数据不能处理,符合规定的可以处理,例如本人同意可以作为一个或多个特定目的的数据。个人数据处理是为了?;ぷ约??;ひ桓鲎匀蝗说那猩砝?为了公共利益,为了追求合法利益的必要,允许商业利用。商业部门、企业处理个人数据,首先是为了合法利益,当然不能侵犯提供个人信息数据的消费者的利益,尤其是儿童。现在几乎所有APP都收集个人信息,如果是为了合法利益的,是被允许的。有个社会调研,关于是否愿意为了将来应用资费上的优惠牺牲隐私,全球有27%的人表示可以牺牲隐私,中国有38%的人表示可以牺牲隐私,更多中国人认为隐私不重要,反而优惠更重要。
数据的传输存储和开发要有要求。所有的软件,包括移动应用的APP,在开发阶段和运行数据处理阶段要保护个人数据的隐私。数据控制也含APP,要有充分的技术和措施,确保数据和移动应用的完整性,必须应对数据处理面临的风险。
我国有一些关于数据开发应用的文件,工信部出台的“大数据产业发展规划”,2016年出台的“网络安全法”,都提到对个人信息和重要数据的境内存储,需要?;ば畔踩透鋈艘健5?跟欧盟的法规比,我们的规范都很宏观,真正违反了会怎么样,并没有规定。
数据的价值在于融合与挖掘,政府数据对公众的最大利益在于共享与开放。数据流通与交易有利于促进数据的融合挖掘。数据的使用必须面对保护的责任与义务,尤其是对个人隐私数据的?;?。数据的共享开放、流通交易和?;び氚踩?对数据技术提出研究挑战,数据的共享、开放、流通、交流、使用和?;ざ苑傻闹贫ㄓ胫葱刑岢隽撕芨咭?同时还需要平衡数据的?;び胧莸目⒗?。
编辑:位林惠
关键词:大数据 共享 数据库
 
   
 

 中国制造助力孟加拉国首条河底隧道项目
中国制造助力孟加拉国首条河底隧道项目 澳大利亚猪肉产业协会官员看好进博会机遇
澳大利亚猪肉产业协会官员看好进博会机遇 联合国官员说叙利亚约1170万人需要人道主义援助
联合国官员说叙利亚约1170万人需要人道主义援助 伊朗外长扎里夫宣布辞职
伊朗外长扎里夫宣布辞职 中国南极中山站迎来建站30周年
中国南极中山站迎来建站30周年 联合国特使赴也门斡旋荷台达撤军事宜
联合国特使赴也门斡旋荷台达撤军事宜 以色列前能源部长因从事间谍活动被判11年监禁
以色列前能源部长因从事间谍活动被判11年监禁 故宫博物院建院94年来首开夜场举办“灯会”
故宫博物院建院94年来首开夜场举办“灯会”
 法蒂玛·马合木提
法蒂玛·马合木提 王召明
王召明 王霞
王霞 辜胜阻
辜胜阻 聂震宁
聂震宁 钱学明
钱学明 孟青录
孟青录 郭晋云
郭晋云 许进
许进 李健
李健 覺醒法師
覺醒法師 吕凤鼎
吕凤鼎 贺铿
贺铿 金曼
金曼 黄维义
黄维义 关牧村
关牧村 陈华
陈华 陈景秋
陈景秋 秦百兰
秦百兰 张自立
张自立 郭松海
郭松海 李兰
李兰 房兴耀
房兴耀 池慧
池慧 柳斌杰
柳斌杰 曹义孙
曹义孙 毛新宇
毛新宇 詹国枢
詹国枢 朱永新
朱永新 张晓梅
张晓梅 焦加良
焦加良 张连起
张连起 龙墨
龙墨 王名
王名 何水法
何水法 李延生
李延生 巩汉林
巩汉林 李胜素
李胜素 施杰
施杰 王亚非
王亚非 艾克拜尔·米吉提
艾克拜尔·米吉提 姚爱兴
姚爱兴 贾宝兰
贾宝兰 谢卫
谢卫 汤素兰
汤素兰 黄信阳
黄信阳 张其成
张其成 潘鲁生
潘鲁生 冯丹藜
冯丹藜 艾克拜尔·米吉提
艾克拜尔·米吉提 袁熙坤
袁熙坤 毛新宇
毛新宇 学诚法师
学诚法师 宗立成
宗立成 梁凤仪
梁凤仪 施 杰
施 杰 张晓梅
张晓梅


