“大数据与国家治理现代化——第六届国家治理体系与能力建设高峰论坛”将于5月11日在华中科技大学国际学术交流中心八号楼召开,特此推送欧阳康教授《大数据与人文社会科学研究的变革与创新》一文,原文发表于《光明日报》( 2016年11月10日 16版),欢迎诸位学习交流!欧阳康教授在文中指出,大数据正在成为当前中国社会快速信息化的最重要表征之一。我们应当深刻认识大数据及其对人文社会科学研究所提供的机会与挑战,自觉促进人文社会科学研究的变革与创新。以下为原文:
大数据与人文社会科学研究的变革与创新
【专家论坛】
习近平总书记在谈到如何繁荣发展中国特色哲学社会科学时,要求我们善于“运用互联网和大数据技术,加强哲学社会科学图书文献、网络、数据库等基础设施和信息化建设”,这为信息化时代的人文社会科学研究的方式变革与理论创新指出了正确的方向。大数据正在成为当前中国社会快速信息化的最重要表征之一。我们应当深刻认识大数据及其对人文社会科学研究所提供的机会与挑战,自觉促进人文社会科学研究的变革与创新。
充分认识大数据及其多维意义
何为大数据?我国《促进大数据发展行动纲要》指出:“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。”维克托·迈尔-舍恩伯格和肯尼斯·克耶编写的《大数据时代》中提出“大数据”的4V特点:Volume(体量浩大)、Velocity(生成快速)、Variety(模态繁多)、Value(价值巨大而密度较低)。
在我们看来,大数据的产生是人类探寻世界发展规律和规划自我发展道路上的一种积极产物。大数据及其意义似可从以下几个层面来加以解读:
在直接的意义上,大数据是相对于“小数据”或者传统数据而言的,指人类首次有可能从自然、社会和人的活动中获得数量巨大、类型多样、存取高速、富于价值意义的数据并将其集合起来,形成巨大的数据库,把世界和事物的存在方式转变为周全详尽的海量数据存在方式,借助于它们来实现对外部世界和自我进行更为全面、细致、深入和准确地把握。
在较广的意义上,大数据意味着与大数据采集、存贮、处理、传输和应用相关的整个信息技术、设施体系和运行方式等,构建起一个个数据化的世界。人们有可能在不直接接触现实世界的前提下通过接触数据世界而实现对现实世界的认识与把握;通过感知和运行数据世界来重构和影响现实世界,形成真实世界与虚拟世界的互动,展示出自然、社会和人类的数字化进程,表明现代信息科技和网络世界发展到了全新阶段和更高水平。
在更广的意义上,大数据意味着高度信息化时代的人们自觉或者不自觉地从事着数据化的生产、生活、交往、思考与实践,构建起一整套紧密依托于现代信息网络和数据化系统的生产方式、生活方式、交往方式、思维方式和治理方式等,大数据不仅改变着人类的社会生活,也在全面引领着人类生存方式的革命性变革与时代性提升。
在最广的意义上,大数据意味着一种依托于大科技、大信息和大数据而构建的全新的自然图景、社会图景和人类图景,以大数据的方式来看待自然、社会和人类自身,正在转变为一种自然观、社会观、人类观、价值观和方法论,标志着人类认识世界和认识自我、改造世界和改造自我进入到更加全面清晰准确的水平和更加自觉有效的阶段。
探索大数据提供的特殊机遇与挑战
从总体上看,与人文社会现象的多样性和复杂性相对应,人文社会科学也是一个庞大的学科群,内部存在着迥然相异的学科,不同的学科与大数据的关系和关联度也有很大不同。例如,从总体上看,传统的社会科学学科,诸如经济学、管理学、社会学、政治学、法学、教育学等学科对数据的依赖性较强,大数据所展示的意义会更充分,而文学、历史、艺术、哲学等更加关注人们的精神生活、价值理念、心灵世界等,对外在数据的依赖性较低,大数据所展示的意义相对较弱,在大数据时代所受到的影响也相对较小。即就大数据本身而言,也应当看到,大数据并不是一切,并没有根本取代小数据和传统数据;大数据技术尚在发展之中,并不能简单取代传统数据技术;大数据研究也存在很多问题,我们没有必要也不应该简单地用大数据研究来遮蔽传统的人文社会科学研究。
但无法回避的是,方兴未艾的大数据已经给人文社会科学研究提出了很多问题和挑战,也提供了许多创新的机会。
首先,从“假设出发”还是从“数据出发”开始我们的研究?“大胆假设,小心求证”,一直是我们从事人文社会科学研究的基本模式。大数据时代,海量数据甚至“全数据”的存在成为我们很多学科和领域研究的前提,它们表征着许多难以辨析的事实,要求我们做出必要的解读和说明。
其次,以“个别样本”还是以“海量数据”为对象来开展研究?由于采集数据困难,过去人文社会科学的很多研究不得不依赖于抽样调查,采集到的永远是个别样本信息,为此而不得不加大抽样的比例,但最大比例的样本也不可能穷尽对象,因此所有的结论都带有推论的性质。大数据时代,人们有可能通过就一定事物采集全样本,提供全数据,为人文社会科学研究提供更加坚实可靠的对象性基础和前提。
再次,是“感性接触”还是“行为统计”更为可靠?人文社会科学的很多研究以研究者与被研究者的直接接触作为真实可靠的基础,例如直接对话、直面访谈、电话采访等,这有其感性直观和可靠的一面。但人们的思想内在于心灵,充满着理性与非理性的博弈,具有独立性、分散性、个体性和变动性特点,其表达往往受到交往者之间的互动感觉和场景的直接影响,尤其是涉及一些敏感话题会产生某种特殊遮蔽甚至智慧博弈,感性接触并不一定都真实可靠。大数据通过行为统计,对于数据细粒度的分割,全方位长时间累积搜集,尤其是在对人们在大量的“鼠标选择”“网络投票”中展示出的价值取向、美丑好恶、评价标准等,展示出个体真实的心灵世界,勾勒出社会总体心理状态,描绘时代精神的大体走向,有可能为人文学科的理性研究提供更加真实可靠的对象和基础。
又次,以“实体规律”还是以“统计规律”为研究目的?过去,人文社会科学研究主要依托对社会现象的局部观察和实体性探索,大数据将社会变量变成可统计、可度量、可计算的对象,通过追踪社会中作为最小组成单位的“人”以及对全局性社会形态的包容性跟踪累积,在一个相对低廉的研究成本中展现社会和社会组织的高精度社会实景,实现以整体和全体数据为基础的研究,更好地探析社会发展的本质特征、内在规律、演化趋势和未来走向。例如,关于国家治理体系现代化的研究,可以尝试借助于大数据来建立评估体系并进行国际比较,从而得出科学结论。
人文社会科学研究应自觉融入大数据时代
大数据时代已经来临。美国政府于1993年启动信息高速公路建设,2012年3月又宣布投入2万亿美元用于“大数据研究和发展计划”,着力于保持在大数据战略方面的世界优先地位。我国国务院在2015年8月发布了《促进大数据发展行动纲要》,将大数据纳入国家战略。目前的问题是,人文社会科学工作者如何自觉地进入大数据时代,推进人文社会科学研究的变革与创新。
要自觉学习和有效运用复杂性思维。大数据的世界是个极为复杂的世界,需要复杂性的思维方式。近代经典科学倾向于简单性,产生出线性因果的观察视角和还原论的研究思路。然而在现实世界中却存在着许多与不确定性、突变性、非平衡性、非线性、模糊性等密切相关的复杂现象,由此而产生出耗散结构理论等现代复杂性科学。人文世界是个更加复杂的情感世界和价值世界,存在着极为复杂的人际互动和情感交织,充满着不确定性甚至风险,需要学习借鉴复杂性科学的思路和方法。
要自觉学习和运用大数据技术。对大数据技术的应用大概可以分为三种层次和水平:能够熟练运用现代信息技术和数据装备处理人文社会科学的复杂信息;能够科学合理解读现代人文社会科学信息所蕴含的意义;能够运用大数据技术引领人文社会科学研究和人文社会现实的良性健康发展,引领社会文明的数字化发展方向。通过大数据技术的应用把人文社会科学研究的相对客观部分提升为可以与自然科学和工程技术相媲美的“硬科学”,这将极大提升中国人文社会科学对当代世界的解释力和影响力。
要自觉更新和发展自我。我们要勇于掌握技术又善于超越技术,尽最大努力去学习掌握和运用大科学技术,走在时代的潮头,同时又要防止为技术所裹挟,避免成为简单的技术主义者,努力保持人文社会科学工作者的思想高度、理论品格和价值定位,勇于反思和批判。大数据时代离不开任何专业却也不会拘泥于任何专业,要自觉地站在当代学科既深度分化又高度综合的背景下开展研究,既立足专业又超越专业。大数据时代最大的特点就是人、对象世界、数据世界与数据技术的多维互动,这也需要我们勇于实现自我超越。只有自觉地置身于自然—社会—人—数据的复杂巨系统中,人才能真正成为世界的主人,成为大数据的主人,成为人文社会科学研究的主人。