科学社会主义基础研究

二、人类社会正在进入以“大数据”为标志的新时代

字体:16+-

古往今来,数据在国家治理过程中都尤为重要。人口、资源、土地、财产等统计数据均为治国理政的重要依据。中国古代兵书《孙子兵法》就说过:“算则胜,不算则不胜;多算胜,少算则不胜。”这里的“算”,就是如何利用数字来估算各种复杂的因素。人类进入21世纪,新一轮科技革命和产业变革正在孕育兴起,全球科技创新呈现出新的发展态势和特征。新一代信息技术在高速发展,风能和太阳能等清洁能源的利用日益广泛,生物技术、新能源技术、新材料技术等交叉融合正在引发新一轮科技革命和产业变革。新一轮科技革命,是以大数据、云计算、物联网、3D打印机等信息、智能技术为标志的,人类从此将进入大数据时代,也有人将此称为智能时代。在这一时代,“依靠数据决策”“依靠数据管理”“依靠数据创新”将成为“新常态”。

2014年11月,首届世界互联网大会在中国召开,习近平总书记在致辞中说:“当今时代,以信息技术为核心的新一轮科技革命正在孕育兴起,互联网日益成为创新驱动发展的先导力量,深刻改变着人们的生产生活,有力推动着社会发展。互联网真正让世界变成了地球村,让国际社会越来越成为你中有我、我中有你的命运共同体。同时,互联网发展对国家主权、安全、发展利益提出了新的挑战,迫切需要国际社会认真应对、谋求共治、实现共赢。”[11]习近平总书记的这段讲话昭示我们,在新一轮科技革命中,互联网影响深远,势不可当。互联网引起数据革命,数据革命给人类社会带来的变革,将更为彻底,更为激烈,速度更快,机遇更多,风险也更大。过去我们常用的“信息大爆炸”这个概念已经难以形容世界上数据的增长速度。如何认识大数据、适应大数据、运用大数据、引领大数据,将成为人类命运共同体共同思考的问题。

“大数据”的概念最早源于20世纪80年代,但真正火爆是在2011年5月麦肯锡全球研究所发表的专门研究报告《大数据:创新、竞争和生产力的下一个前沿》(Big Data:The Next Frontier for Innovation,Competition,and Productivity)之后。这份报告对“大数据”作了清晰阐释,指出:“大数据是指大小超出了传统数据库软件的抓取、存储、管理和分析能力的数据群。”该报告指出,数据已经渗透到每一个行业领域,逐步成为重要的生产要素;而人们对于海量数据的运用将预示着新一波生产率增长。2012年1月,在瑞士举办的达沃斯世界经济论坛发表了一份名为《大数据,大影响》(Big Data,Big Impact)的报告,再次引起全球关注与热议。

一般来说,大数据是伴随着计算机、互联网、社交媒体、智能手机等的出现,以几何级数增长的“电子形式存储”的数据,具有量大、类型烦琐、价值密度低、速度快、时效高等特征。当人类创造越来越多的大数据,并且数据成为重要的社会资源和生产资料,在商业、经济及其他领域中,决策日益基于数据和分析而做出,那么我们已经进入了“大数据”时代。

大数据具有以下五个特性:

一是数据海量性(Volume):大数据的首要特征是“大”,据IDC(Internet Data Center),即互联网数据中心最近的报告预测称,2008年全球数据量为0.5ZB,2010年为1.2ZB,人类正式进入ZB时代。[12]到2020年以前,全球数据仍将保持每年40%以上的高速增长,大约每两年翻一倍,预计2020年将突破35ZB。[13]目前,大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。简而言之,存储1PB数据将需要两万台配备50GB硬盘的个人电脑,如果存储1ZB数据需要209亿台电脑。

二是数据多样性(Variety):全世界几十亿人共同组成了一个庞大的数据生产工厂,提供不同类型的、几乎无法计算的数据资产。上网时我们使用的浏览器、软件、窗口和后门工具,随时记录各种个人信息数据;生活中我们使用的智能手机、GPS导航器、智能手表及其他数码产品,时刻都在产生数据;部分传感器安装在火车、汽车和飞机上,甚至安装在家用冰箱、空调、电表上,也在不断产生数据;个人消费不论是手机支付、网银支付也都在不断产生数据。原来的数据都可以用二维表结构存储在数据库中,现在的图片、声音、视频等非结构化数据所占的比重越来越大。总之,数据越来越多样化,对数据处理能力的要求也越来越高。

三是高速性(Velocity):据预测,到2020年全球将拥有220亿部互联网连接设备,这些设备通过基于实现软件性能优化的高速电脑处理器和服务器,促使实事数据流的快速传递。据统计,全球每秒钟发送290万封电子邮件,每天某著名社交网络上发布超过5000万条消息,某著名视频网络上传视频2.88万小时。目前大数据仍在以每18个月全球信息总量翻一番的速度膨胀。随着新的传输技术的开发和利用,信息传输速度将更快。

四是价值密度低(Value):海量数据的存在及快速增长,重复信息、垃圾信息的泛滥,导致有用信息比例的下降,从而使我们获取有用信息的难度加大。以监控视频为例,连续的、长时间的监控信息,可能有用的数据仅有一两秒。

五是易变性(Volatility):大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。“今天的大数据并非是明天的大数据”。相较传统的业务数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。因此,数据价值的“提纯”和潜在价值的挖掘将显得更有价值。

时至今日,“大数据”可能带来的巨大价值正渐渐被人们认可。随着信息技术的创新与发展,数据的全面感知、采集和预处理、存储及管理、分析及挖掘、展现和应用,带来了无数年的商机,也为人们提供了一种全新的认识世界和改造世界的方法。美国哈佛大学定量社会研究所主任加里·金在接受《纽约时报》记者时说:“这是一场革命,我们现在做的只是冰山一角,但是由于庞大的数据新来源而带来的定量化方法,将横扫学界、商界和政界,所有领域都将被触及。”[14]目前,仅就人们对大数据的初步认识看,大数据影响国家核心竞争力,谁掌握了数字数据传播和控制的主动权和主导权,谁就能赢得未来;谁抢占了大数据带来的先机,谁就有可能占领信息技术研发和应用的制高点,谁就能引领未来。未来相当长一段时间内,信息技术将成为先导技术,率先渗透经济社会发展的各领域,促进以物质生产、物质服务为主的经济发展模式向以信息生产、信息服务为主的经济发展模式转变,世界从此将进入以信息产业为主导的新经济发展时期。

正是因为大数据具有巨大的应用价值和潜在价值,所以世界各国都开始注重大数据。美国是当今世界上信息化程度最高的国家之一,也是全球最早关注大数据的国家。2010年3月,美国政府就要求各部门实施自己的大数据战略,实现从数据到知识、从知识到决策、从决策到行动的快速转换。2010年12月,美国总统科技顾问委员会发布题为《数字未来设计:联合资助网络和信息技术的研究与发展》的报告,突出强调了数据爆炸式增长所带来的管控和利用困境,并建议美国政府应优先发展大数据技术。2012年3月,美国联邦政府发出了《大数据研究和发展倡议》,宣布投入巨资启动大数据的研发任务,并把大数据提到了和历史上的互联网、超级计算机一样的高度,成为国家战略。这一战略的目标是提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平,解决大数据带来的机遇和挑战。[15]联合国也在2012年发布了大数据政务白皮书,指出大数据对于联合国和各国政府来说是一个历史性的机遇,人们如今可以使用极为丰富的数据资源,来对社会经济进行前所未有的实时分析,帮助政府更好地响应社会和经济运行。