为了在创新和透明度方面保持领先地位,让市民轻松获取驱动城市发展的数据,纽约市政府正在运用“大数据”技术,建设“纽约市开放数据”(NYC Open Data)。纽约市的实践很有可能成为全球城市参考和模仿的样本。杭州市政府和职能部门都有大量数据和和信息发布平台,但处于不精确、不完整和分散化分布的状态,“碎片化”问题较为明显,阻碍了公众对公共信息的获取,影响政府的服务质量。应积极借鉴纽约市的经验,及早行动,建设政府开放信息平台。
1.遵循知识开放性的科学规范
1942年,莫顿系统阐述了科学活动的规范,即普遍主义、公有性、无私利性。2004年,经济合作与发展组织(OECD)为“所有由公共机关出资收集的数据都必需要公开发布”做出了制度性安排。“开放数据”(Open Data)现已成为一种运动,倡议者认为,政府采集的数据受到公共财政资助,是一种公共资源,对其任何限制,都有违公众的利益,理应向公众不加限制地免费开放,数据的再次使用也不该需要其它的许可。
2.设定开放数据系统的基本架构
纽约市开放数据的基本结构是十个类别,每个类别下各有多个数据库,共39个(见表1);每个数据库由8类数据组成,分别是:列表数据、图表、地图、重要事件、过滤视图、外部链接、档案文献、表单。
表1:NYCOpenData基本架构
类别 Category |
主要数据库
Featured datasets |
商业 |
电子商店 |
街边露天咖啡馆 |
就业 |
企业经营许可证 |
市政府 |
土地使用税 |
不动产业主 |
政府机构的许可证 |
市长施政报告 |
教育 |
数学考试成绩 |
SAT 成绩 |
学区 |
环境 |
对违规事件的通告 |
燃油锅炉建筑物与油耗量 |
凉爽屋顶建筑物 |
社区园艺花园 |
健康 |
餐厅检查结果公告 |
健康和医院集团 |
养老院 |
初级保健信息工程识别名录 |
住房
|
建筑物足迹 |
建筑物许可证 |
建筑投诉 |
物业综合信息系统 |
公共安全 |
警区分界 |
飓风疏散(避难) |
飓风疏散区域 |
社区应急反应队伍 |
娱乐 |
博物馆与画廊
剧院 |
海滩目录 |
足球场与橄榄球场地图 |
社会服务 |
Wifi 无线接入点 |
2010 年至今 311 服务请求 |
课后项目 |
住房管理局设施和服务中心 |
交通运输 |
地铁入口 |
授权经营的出租车 |
出租车驾驶员 |
斯泰顿岛渡轮时刻表 |
3.将政府数据集成上线开放纳入立法
2009年12月8日,白宫颁布《开放政府指令》,要求按照以下步骤创造更加开放的政府:在线公布政府信息;提升政府信息质量;创造开放政府的文化并使其制度化;创建支持开放政府的政策框架。2012年2月29日,纽约市议会通过“发布开放数据”法案,规定城市管理的数据必须在2013年3月7日前集中到单一的门户网站(https://nycopendata.socrata.com)供公众访问,2018年12月31日,所有法定的公共数据上线供访问,并持续保持数据的升级和更新,使用这些数据不需要经过任何注册、审批程序,数据的使用也不受限制。这是美国历史上首次将政府数据大规模开放纳入立法。2012年3月7日,纽约市长布隆伯格在签署法案时指出:这是全国最雄心勃勃和最全面的开放数据立法。到2013年11月,88个政府机构已经在线发布1162套数据,还有427套数据将于2018年12月31日前全部发布。
4.用缜密的计划和标准实施专项研发
“发布开放数据”法案指定“纽约信息技术与通信部”(DoITT)负责系统的专项研发。DoITT是从事IT行业的基础设施管理、应用程序开发管理、政府内外部事务管理的政府机构,技术能力极佳,拥有120个机构、800万注册会员、30万雇员、23万个参与机构、5000万的访问量。DoITT于2012年9月4日发布“纽约市开放数据技术标准手册”,详细规定了开放数据的“定义”“指南”“政策”“标准”和“服务条款”。在此基础上,DoITT于2013年9月22日公布“纽约市开放数据计划”(NYC Open Data Plan),对系统建设作出全面部署。
5.以大数据技术建构开放数据系统
“纽约市开放数据”完全建立在大数据的逻辑和技术之上。
数据收集极为广泛。作为美国最具开放性和互动性的大数据系统,其强大的“数据仓”“云计算”和“应用编程接口”,使得所有机构和个人都能在网页上直接提取各种格式的数据。市民可自由上传数据,为方便数据上传,NYC Open Data将Facebook、Twitter、Tumblr等社交网站直接嵌入其中。同时,加强数据在311系统、非政府网站和移动设备之间的传递,并链接了纽约州、芝加哥等5个地方的数据。目前,NYC Open Data的参与机构已经超过了1000家,涉及750种数据类型。
数据处理遵循大数据逻辑。NYC Open Data的原始数据主要为非文字的数据素材,大数据认为,原始数据虽然杂乱,但透过好的工具、地图、和可视化系统,能让其发挥更大的效用。NYC Open Data对收集的数据经“联机分析处理”(OLAP)和“联机事务处理”(OLTP)后,由代理机构和DoITT实现数据提取、转换和加载(ETL),转换成“企业服务总线信息队列”和“平面文件队列”后载入“公开数据综合服务器”,整合“地理转换服务器”和“监测\通知服务器”收集的信息后,推向网站,网站同时接收“代理编程接口”和“合格代理数据库”的数据。
强调数据可视化和工具化应用。NYC Open Data尽可能将数据可视化,并推向公众网络终端,向市民提供“保姆式”服务,公众可以利用手机轻易找到所需信息,为此正在开发各种应用工具。NYC Open Data鼓励机构和市民展开数据可视化和工具化使用的竞赛,通过全球最大的轻博客网站(Tumblr),网民可上传可视化信息和应用程序。