城市大数据与城市智能化发展

2019-07-08 14:09

1. 引言

随着中国工业化和城镇化的快速推进,城市人口、 工业以及交通运输过度集中,导致了包括人口膨胀、交 通拥堵、环境恶化、住房紧张、就业困难和安全隐患等 问题在内的多种不同形式的“城市病”,以及由这些“城 市病”引发的社会、经济、健康和居住等问题。这些问 题严重影响了中国城市生态系统的健康和可持续发展 [1]。事实上,“城市病”出现的原因在于城市基础设施 所构成的物理系统和城市居民所构成的社会环境变得日 趋复杂,并且人们没有充分认识到其复杂性,缺少对城

市生态系统的高效管理。从根本上讲,城市已经从过去 的二元空间升级为现在的三元空间。这里所说的第一元 空间指“物理空间”,即城市所处的物理环境和城市所含 的物质系统;第二元空间指“人类社会空间”,即城市 人的行为与社会交往;第三元空间指“赛博空间”(Cyber Space),即计算机、互联网及其“数据信息”[2]。 为此,急需新理念和新方法对城市生活的结构、经济发 展以及其中出现的问题进行深入和系统地分析,从而确 立新技术革命条件下城市发展的新方向。

“智能城市”和“大数据”的出现为解决“城市病” 提供了新的可能。“智能城市”为传统的城市生态系统

加上了一个神经层,而城市大数据从不同维度描述了城 市的物理环境(如建筑、汽车和道路等)和居民社会生活 的方方面面,即以虚拟形式反映真实的第一元空间和第 二元空间,由此构成了城市的第三元空间——城市大数 据。中国工程院的李国杰院士认为,大数据是典型的“蜜 蜂模型”,即:蜜蜂的贡献不是它们生产的蜂蜜,而是 其传粉过程带来的农业产出的增加[3]。城市大数据如 同城市中的自然资源和人力资源,已成为“智能城市” 发展的重要战略资源与战略方向。城市在信息化和智能 化的过程中形成了大量的信息库和数据中心,将这些数 据相互连接,便形成了城市大数据。通过物联网、云计 算和人工智能技术对城市大数据进行深度的汇聚、挖掘 和分析,有助于人们正确地认识和把握城市系统各层次 的发展规律,辅助政府和社会的城市决策与规划,实现 城市智能化管理的目标。同时,城市大数据也促使城市 各行业的运作模式发生深刻的变革,加速传统产业的转 型升级和新兴产业的培育发展。总之,城市大数据正在 加速城市智能化发展,具体表现为:以互联网、物联网、 电信网、广电网和无线宽带网等网络组合为基础,以信 息技术高度集成和大数据综合应用为主要特征,以智能 技术、智能产业、智能服务、智能管理和智能生活等为 重要内容,构建一种致力于自我修正并及时解决城市经 济、社会和生态等关键问题的城市发展新形态[2]。

2. 城市大数据的概念

2.1. 城市大数据的概念与特点 城市大数据是指城市的政府、公共机构、企业和个

人利用新一代信息技术手段获取和汇聚的各类城市设施 设备、个人和集体等主客体所产生的动态和静态数据。 数据可被共享、融合、分析和挖掘,以使人们深入了解 城市的运行状态,在城市管理方面做出更加明智的决 策,优化城市资源配置,降低城市系统运行成本,推动

“智能城市”安全、高效、绿色、和谐、智能地发展。除 了大数据的一般特征(如海量性、高速性、多样性、真实 性和重要性)之外,城市大数据还有其特殊性,包括:

(1) 层次性:例如,电子病历按照医院或区域分类, 而医学图象按照设备或医院分类。又如,健康数据可以 分为个人、医院病人、社区或卫生防疫部门的健康数据。 城市大数据的层次性深刻反映了城市物理系统和社会系 统的组织层次性。

(2) 完整性:城市经过长期的运行与发展,各系统 的数据覆盖越来越广泛。例如,近年来中国城市环保数

据的覆盖度正在迅速提高。由于这种数据完整性的迅速 改善,城市大数据日益精确,具备了揭示城市的整体发 展规律的能力。

(3) 关联性:城市各类数据之间具有很强的关联性。 例如,城市的物流信息既包含在物流企业的数据中,也 包含在制造业、商业和运输业,甚至是金融业的数据中。 这些关联性不仅可以用于相互印证,也可用于城市运行 中的协同推理与规则挖掘。

由于城市大数据的普遍性与特殊性,在其应用中需 要新的处理技术,即基于目标驱动方法的特定数据提取 [4],这主要集中在从数据获取到数据处理,再到模型建 立的整个数据流程的自动化[5,6]。首先,获取与存储原 始数据,包括按照目标需求对从所需数据源中获取的数 据进行模式抽取和集成,对采集的数据进行清洗和预处 理(如数据填补、数据优化、数据合并、数据标准化、数 据一致性检查以及多种数据属性的初步组织等),建立待 处理数据集;其次,处理和分析数据集(包括线性分析、 非线性分析、因子分析、序列分析、线性回归、变量曲 线分析和双变量统计),通过利用支持向量机、朴素贝叶 斯、随机森林和逻辑回归进行数据分类和数据与类别间 的关系分析;然后,通过人工神经网络、遗传算法和跨 媒体算法揭示分类数据间的内在联系,发现深层次的模 式、规则及知识;最后,以交互式和可视化的方式解释 变量间的关系,以更深入地理解结果。