李 振 鲍宗豪
“云治理”的核心概念:作为“服务资源”的“大数据”
“大数据时代”的核心词汇和存在依据,无疑是由“数据”转化为“大数据”而来的。虽然对大数据时代的理解不能局限于“概念和技术”,而应该引申至文化、哲学、社会学、政治学、管理学等诸领域,但是无论如何引申和扩展,其本身所具有的“云技术”特征,依然是最稳固、最鲜明的核心根据。
按照一般计算机信息的界定,“数据”(Data)是载荷或记录信息的按一定规则排列组合的物理符号,可以是数字、文字、图像,也可以是计算机代码。信息接收始于对数据的接收,对信息的获取只能通过对“数据背景”11 的解读进行判断。“数据背景”是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。这意味着,信息的存在形式与实质就是数据,数据转化为信息可以用公式“数据+背景=信息”来表示。在汉语世界中,“数据”原指用于统计、计算的数值、数字,而且是具有一定“逻辑指向”的“数字”,属于一个“专业性”比较强的词汇,以至于“基于数据”本身就带有强烈的科学性、客观性色彩。
如果追根溯源,可以发现,“数据”(data)在拉丁文里是“已知”的意思,也可以理解为“事实”,是一种可以用“数字”表示的、更为精确的“事实”。也就是说,在任何口头事实、书面事实的构建中,“数据事实”几乎成为所有“事实存在”的根本依据。“数据”代表着对某件事物的客观描述,数据可以记录、分析和重组事物。在这个意义上,“数据”超越了“数字”的一般性,内涵了更为具体、更具逻辑性的特殊意义。显然,“我们经常把‘数字化’和‘数据化’这两个概念搞混,但是对这两个概念的区分实际上非常重”。12 在计算机出现后,“数据”则指“一切以电子形式存储的记录”,而“数字化”指的是把模拟数据转换成“0和1”表示的二进制码,这样电脑就可以处理这些数据了。1995年,美国麻省理工学院媒体实验室的尼古拉斯·尼葛洛庞帝出版了他的标志性著作《数字化生存》(Being Digital)13,他的主题就是“从原子到比特”,而不是针对处理信息数量的逻辑判断。显然,这里的“数据”已经不再纯粹的属于论证“1与2”之间的数字逻辑关系,而是致力于一种更为庞大的“数字资源”的整理、分析和应用。
以此为基础,我们来看待“大数据”是否意味着一种“大现实”?
“大数据”(Big Data)概念最早源于20世纪80年代,是一个与计算信息直接相关的专业术语,它直接超越了“数据”的一般性特征,而是指那些数据规模已经超出了“传统数据”的衡量尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。14 显然,“大数据背景”所指向的范围和内容更为复杂多变,不仅包括各种规律性的数据符合,还包括各种长时段、非规则性、流动性和开放性的数据,其数据所指向的意义并非是显而易见的,而是必须通过特定的“复杂运算”之后才可能有所显现。15
2011年5月,麦肯锡全球研究所(MGI)发表研究报告《大数据:下一个创新、竞争和生产率的前沿》(Big Data: The Next Frontier For Innovation: Competition and Productivity),使得数据之“大”成为一个崭新的“时代生产”判断符号。2012年1月,在瑞士达沃斯经济论坛上发布的一份名为《大数据,大影响》(Big Data, Big Impact)的报告认为,大数据就像“黄金”一样。2012年3月,华盛顿宣布“大数据研究和发展倡议”(Big Data Research and Development Initiative),倡导“脑计划”发展战略,加强从大数据提取、分析主要信息的能力。此后,英国、日本、德国、加拿大等国纷纷效仿,推出与大数据应用相关的战略研究,一场关于“大数据”的战略争夺自此拉开战幕。
但是,“大数据”成为一种日常流行性的学术概念,则是在2013年。2013年被称为“大数据元年”,英国牛津大学维克托教授的《大数据时代:生活、工作和思维的大变革》,《外交》发表两位作者的《大数据的崛起》,新加坡《联合早报》亦发表《大数据政治》的文章,美国Market Watch网站、美国科技网站“商业内幕”等刊文专论大数据时代的来临及其发展趋势,等等。这些专论都指向一个核心的事实判断和价值判断,即“大数据”的来临非同小可,认为“大数据”将改变商业运作、政府管理、生活方式、信息的积累,促使整个社会发生伟大的变革。政论家认为,“大数据的民意和政治”将开启网络民主的新时代,指出执政者应该适应大数据时代的要求,积极应对“快速自由”的民意要求,善于应对各种“民意事件”;媒体专家认为,大数据时代使得任何有关“民生问题”的信息传播,都有可能引发公共危机事件;信息技术专家认为,新的“移动革命”将产生“移动形态的大数据”,最终产生“移动性质的信息爆炸”;社会学家认为,信息增长量将进一步增强,不断制造出信息的碎片、歧义化,形成“信息分层”的新现实;哲学家认为,大数据开启了一个新的流动性“时间坐标”,开启了一个“信息时间”无所不在、到处侵扰的新型的现代性存在形态。
表面上,“大数据”仅仅是对社会存在的“数据状态”的一种描述而已,本身谈不上什么新的更深刻的含义。“大数据”概念得以成立,还必须与“云计算”相联系。传统的数据处理根据已经不能适应大数据的收集、整理、储存、检索、共享、分析等多重功能。倘若不加整理,所谓的大数据的网络空间就成为“塞满垃圾信息的旷野”。16 显然,“大数据”存在的根据是技术信息的飞速膨胀。但是,这里的技术信息并非纯粹的技术性范畴,而已经与全球化的生活、生产紧密地融为一体。从经济到文化、从意识形态到社会治理、从政治到国际关系等,“大数据”之所以能够在其中发挥着越来越重要的作用,其关键的根据就在于大数据背后所隐含着的“云计算”。对海量的、多样化的“大数据”现象进行“云计算”,可以快速获得各取所需的有价值信息。在这个意义上,拥有“大数据”是一种“资料前提”,更是一种“资源前提”。
显然,“云治理”(Cloud Governance)的概念能够成立的逻辑前提,是网络化资源、服务的不断增加本身所具有的强大力量。其中,“计算机化”(computerization)17 则是促使“云治理”走向社会、走近民间的一个关键性的技术应用和操作概念。“计算机化”、“数字化”是网络化的技术前提与基本保证。当然,计算和存储的设备越廉价,人们对于各类数据的应用范围就会越广泛,应用频率就会越强,大数据之“大”的可能性就会增强。这是一个更多地依赖于技术创新、技术普及的范畴。
这意味着,“大数据”的真实价值,即所谓“大”的价值本身隐藏于各种各样好像彼此无关、毫无规则的数据之下,发掘数据价值(即数据发掘,Data Mining)、征服“数据海洋”的“关键性动力”,就在于“云”的逻辑计算能力。随着数据总量呈几何级数增长,处理数据的技术将跨越式提升,“算法”会更加高明、高效,不仅软硬件升级,人类对数据的认识也不断深化。数据量扩展并不等于一个公司或机构具备拥有和利用大数据的前景,能够进行数据的深度发掘与关联性建构才能称得起拥有大数据。在20世纪末讨论互联网时代的社会现象时,我们最大的关注点,是对世界各种各样的信息化、网络化现象判断与反思。而今天,我们再讨论相同的问题时,社交网络、电子商务与移动通信把人类社会带入了一个以PB(即1024TB,1TB 18 =1024GB)为单位的“结构化与非结构化”19 的各类“数据事实”的新时代。
由此可见,从单独应用的计算机到互联网,从纯粹数字交换的互联网到更富有精神性交往的社交媒体,从聚合各种数字化资源的智能手机到物联网相继出现,通信技术与互联网技术已经实现了高度结合,各种以“数字形式”存储的“数据库”以几何级数增长,其数量之大,已经无法进行准确测量,只能进行估算。一般认为,人类当下一年生产的“数据量”至少是上年的150%。这意味着,从“数字”到“数据”,再到“大数据”,本身已经不再专属于“技术发展”的范畴,而是指示社会发展(尤其是经济运行)形式、模式发生变化的重要象征和线索。通过“大数据”我们可以看到一种崭新的个体化存在、群体运动和社会运行诸多崭新的特征。
相关专题 |
· 《学术前沿》 |