您当前所在位置:首页 > 资讯
中国政府数据开放的6个经典问题和6大痛点
更新时间:2017-08-23 15:53:57点击次数:1579次

中国政府数据开放的6个经典问题和6大痛点

政府数据开放——现状和问题

6个经典问题

愿不愿开放、能不能开放属于政策层面的问题;能力够不够、体制机制如何保障,组织文化是否支撑属于管理层面问题;数据好不好、数据质量控制、平台体验属于技术层面的问题。这些都是中国开放数据的“一些经典问题”。在第17届国际数字政府研究会议之“开放数据在中国”讨论会上,复旦大学国际关系与公共事务学院副教授、数字与移动治理实验室主任郑磊作了主题为“中国开放政府数据的现状和问题”的分享。

开放数据强调利用和再利用

郑磊提出,所谓开放数据,具体而言就是要把开放进行到数据层,而不仅仅是经过加工分析后的信息层。

他指出,“开放”包含技术性开放和法律性开放,前者是指数据可以被机读,可以被导入、下载和读取,再被充分的利用和再利用,后者是指数据能够不受限制地被明确允许商业、非商业的利用、再利用。“在技术和法律层面我们都满足这个条件,才是开放。”他说。


当下人们对开放数据与信息公开的混淆,郑磊指出,首先,开放数据需要开放到数据层,而不仅限于信息层;其次,开放数据不仅为了保证公民的知情权,还希望数据可被利用和再利用,从而创造社会和经济价值。

目前,多地相继建立开放数据平台,它们究竟做得如何?在梳理全球约10种评估指标体系后,郑磊团队建立了一个中国开放数据的评估指标,希望借此评估这些开放数据平台。

郑磊介绍,这种从政府端进行的评估包括三部分:在基础层,包括经济、社会、组织、管理、人员能力等方面的准备;在平台层,包括平台做得如何、用户体验如何,获取数据是否容易等;在基础层、平台层之上的数据层,是真正开放出来的“干货”,包括开放数据的数量、格式、标准等。

郑磊补充道,国外的评估指标会评估供给端和需求端,但现在中国供给端才刚刚起步,需求端还没有得到真正有价值的数据进行利用和产生结果,对需求端的评估也不容易开展,因此目前的这个评估框架还“不一定最完美”,但能适用于当下的情况,它会随着实践的变化而变化。

真正动态数据比例较少

中国开放数据做得如何?郑磊团队选取了部分省市地区做了评估,也正对更多城市的开放数据平台展开评估。

他们发现,各地的开放数总量和可机读数据量相去甚远,很多城市虽然开放数据总量较高,但可机读数据量却只占很小比例。

而在数据更新方面,平台平均数据被标注为动态数据较少,实际更新频率更低,所以实际上真正的动态数据比例较少。

郑磊总结,目前中国开放数据的总体情况是:开放数据总量低、可机读率低、少动态数据、未严格符合开放授权。

他介绍,目前开放数据的协议并没有明确的保证,有的平台只说现阶段免费,以后是否免费并未明确。

数据是权力和利益

为什么中国开放数据现状的不理想,郑磊认为有六大原因:

——第一,愿不愿意开放?数据是权力和利益,各部门可能因此而不愿意开放。还有部门则认为没有必要开放,觉得自己是专家,“数据分析自己最强大,你们能玩出什么东西,你们不懂”。

——第二,能不能开放?政府在开放数据的过程中会遇到的一个难题是,数据是否涉及国家秘密、商业秘密、个人隐私?这些原则都有,但没有明确界定。

——第三,能力够不够?着手开放数据工作后,能不能真正做出来?能否有体制、机制、人员能力、资金的保证?“这些部门愿不愿意把数据开放出来,用什么机制保证?包括激励机制、更新机制、人员能力建设等,都非常难”。

——第四,多一事不如少一事。郑磊指出,这是风险规避性的政府组织文化问题,“能不做就不做,让别人先去做,别人做得差不多自己再拷贝,而不是积主动探索和创新”。

——第五,数据在哪里?郑磊认为,这是个政府内部数据的碎片化问题。很多时候,人力、财力都投入了,但数据因政府内部的碎片化而分散,散落在各个部门,政府既不知道自己有什么数据,也经常找不到这个数据,也没有数据清单,这就很难开放。

——第六,数据好不好?有数据了,但是政府还不能确定数据的好坏。如果数据不好,那也不敢开放,开放后产生了负面的结果,政府是否需要承担责任?这个是很现实的问题。郑磊指出,政府当初采集这些数据是为了满足内部需求,并非为了开放而采集,现在要开放出来还要花很多精力,更重要的是还不一定能保证数据质量。

郑磊总结,上述六大原因之中,愿不愿开放、能不能开放属于政策层面的问题;能力够不够、体制机制如何保障、组织文化是否支撑属于管理层面问题;数据好不好、数据质量控制、平台体验属于技术层面的问题。这些都是中国开放数据的“一些经典问题”。

6大“痛”点

“目前我国信息数据资源80%以上掌握在各级政府部门手里,‘深藏闺中’是极大浪费。”李克强总理以这句形象的比喻,点出了政府数据开放的紧迫性。

什么样的数据可以开放、应该开放?又以什么形式开放?谁来开放?我国政府数据开放面临的“痛点”是必须回答的问题。

01政府数据开放“赶晚集”

全球开放数据运动始于美国。2009年1月,美国总统奥巴马签署了《开放透明政府备忘录》,要求建立更加开放透明、参与、合作的政府,体现了美国政府对开放数据的重视。同年,数据门户网站Data.gov上线。

2011年9月20日,巴西、墨西哥、美国等八个国家联合签署《开放数据声明》,成立开放政府合作伙伴(OGP,Open Government Partnership)。截至2014年2月10日,全球已有63个国家加入开放政府(数据)合作伙伴。

2015年9月,国务院印发《促进大数据发展行动纲要》,提出要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。相比之下,中国的政府数据开放步伐缓慢得多。

02公开的数据机器读不懂

观数智库创始人、大数据专家涂子沛在《大数据》一书中指出,开放数据指的是将原始数据及相关元数据以可以下载的电子格式让第三方自由使用。开放数据不仅意味着公开数据,更要让数据可以重复使用、自由加工。

根据英国开放知识基金会(Open Knowledge Foundation)的定义,开放需具备3项基本元素:非歧视性、机器可读性和开放授权性。所谓“机器可读性”,是指开放的数据应该能让机器读懂,如对于表格数据应该采用.csv。

机器可读,数据才能通过算法进行分析,才能实现数据的价值。因此,如果某地政府开放的数据是PDF格式,那就属于“装姿势”了。

把数据开放等同于信息公开

三公”详细地列出了公车、公款吃喝、因公出国支出的数据,经济和社会发展统计公报囊括了GDP增速、居民人均可支配收入等大大小小的数据。因此,很多人误认为这些就是数据开放。

但是,事实并非如此。

涂子沛在《数据之巅》中写道,数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。


因此,上述的“三公”公开数据、经济和社会发展统计公报,属于在原始数据基础上进行加工、分析、归纳后得出的结果,并不属于数据公开的范畴。

复旦大学数字与移动治理实验室主任郑磊指出,传统的政府信息公开,公开的是经过加工和分析的信息,甚至只是一些文件。他认为,放数据要求开放到底层的、原始的数据。

数据烟囱阻碍开放

当前,我国政府部门组织架构上的条块分割和各自为政,使数据分散在各部门,形成了一个个数据烟囱或数据孤岛,阻碍了数据的开放和利用。

一方面,政府部门往往把数据资源看成是本部门的权力资源,“你的就是你的,我的就是我的”,部门间的数据共享都难实现,更谈不上对社会的开放;另一方面,各部门的数据获取途径、筛选标准不同,一些数据还是纸质记录,数据质量参差不齐,加剧了开放的难度。

就以常见的纸质档案为例,由于不同地域的档案信息不开放、未联通,当一位公民需要办理异地档案存续时,他可能遭遇办事难,接受函、调档函、盖章签字,手续繁杂。

这些档案的规模十分庞大,一边是档案调进调出费时费力,一面是纸质档案占地儿,频繁查阅转移易丢失、损毁。可见,为了优化办事流程,提高效率,将档案数据化并实现异地开放共享、消除数据烟囱迫在眉睫。

数据产权迫在眉睫

公民的社保缴费记录,患者的就诊记录,企业的工商登记信息……这些数据的产权是个人或企业,还是属于政府部门?如何做出清晰界定,将直接决定谁享有数据的权益。

研究者认为,当前关于数据的产权归属问题还远未达成共识,特别是在去除个人身份属性的数据交易中,到底是数据主体(产生数据的个人)还是记录数据的企业拥有数据的所有权,各方莫衷一是。

2010年,发改委批复公安部所属的全国公民身份证号码查询服务中心对外提供公民信息比对服务,提供“一致”或“不一致”信息,可收取公民身份认证服务费,收费标准为:比对内容五项以下(含五项),每次5元;比对内容五项以上,每次10元。

公民信息作为政府数据的一部分,这种收费受到质疑。

中国社会科学院法学研究所副研究员支振锋撰文指出,这个拥有13亿人口身份数据的“全国公民身份信息系统”是真正的“全民所有”,谁能够开发和利用这些信息获利是个问题。此外,数据库开发、建设的几千万投资来自公共财政,数据收集、整理、报送属于政府履行公权,数据库的经营服务性收费也是问题。

数据隐私保护待解结

大数据时代,传统的隐私保护路径已经失效,如何兼顾隐私保护,是政府数据开放时不可回避的问题。

在隐私保护方面,曾有人提出了全生命周期的概念。持有这种观念的英美国家认为,应该在政府数据开始产生的每个流程,都加入隐私分析和设计,而不是在最后环节才考虑。

此外,美国规定,各部门应对照现有法律规定和部门高级隐私专员一起,决定数据的公开是否恰当,并需向法律部门咨询协商最后确定;英国则在推进数据开放的主要部门任命专门的隐私保护专家。

我国尚未出台全国性的数据隐私保护法规,而在全国首部地方大数据法规《贵州省大数据发展应用促进条例》则规定:“数据共享开放,应当维护国家安全和社会公共利益,保守国家、商业秘密,保护个人隐私,保护数据权益人的合法权益。”






如果您觉得文章还不错请帮忙分享:
通知公告
资讯
站内搜索