
二、发展谱系:互联网、大数据与人工智能的关系
互联网、大数据与人工智能的理论构建均以20世纪中叶前后为起点。一般认为,互联网的技术基础在于美国的阿帕网(ARPANET),其旨在形成信息联结的终端设备。目前,互联网技术在诸多领域被灵活运用,日渐嵌入公众的生活和工作。由于数据资源的悠久历史,加之数据在诸多领域的基础性作用,大数据技术的理论架构难以同互联网一样清晰地追本溯源,但其范式与20世纪50年代地理定量革命中提出的将大量数据集合凭借计算机进行连接有共通之处。1 此外,空间分析和社会物理学凭借其数据采集、模型识别、数据分析功能或许能被视为大数据技术源头之一。2 而人工(机器)智能的思想渊源可追溯至13世纪哲学家、逻辑学家鲁尔3,其试图制造会思维的人工生物。20世纪50年代,麦卡锡(J.Macarthy)召集明斯基(M.Minsky)、菲洛(H.Fellow)、兰切斯特(N.Lochester)、申农(C.Z.Shannon)等人商讨和达成的会议成果,标志着人工智能这一学科的兴起。4
以公众感知为切口,互联网率先进入公众的生活领域、工作领域,大数据随之而至,而人工智能当前还有强弱之分,有着模糊的科幻色彩。这种感知差异与互联网、大数据和人工智能之间存在的紧密、深刻联系不可分割。
理论起源与学科诞生固然有着开山之效,但并不意味着该技术就能被广泛地实践与应用,软硬实力的发展态势是技术落地的基础条件。互联网、大数据、人工智能为公众感知的先后顺序隐蕴着各自的实现条件。
大数据常被误解为仅指代庞大的数据量。但它本质是一种全样本分析方法,涵盖了数据挖掘、数据建模与数据分析,克服了因客观基础不足而采用抽样分析的偏差。此外,它与抽样分析的区别还在于模型与数据的先后。在抽样分析中,思维路径通常为“问题产生—理论嵌套—模型构建—数据采集—综合分析”,而在大数据中,思维路径为“全样本的数据—模型构建—分析与预测”,模型因数据的流变与增长而变动。简言之,抽样分析主要以问题为逻辑起点,而大数据技术以数据为逻辑起点。因此,大数据的应用导致数据由传统分析方法中的处理对象转型为一种具有潜在挖掘价值的资源。而互联网的广泛应用对大数据有着基础的助推作用。
首先,互联网对人类生活、工作的全方位渗透使其成为数据产生的空间。数据源于人类活动,远古时期便有结绳记事之举。进入21世纪以来,凭借自身便利性、快捷性和广泛性等特点,互联网诱导人类活动逐步由物质世界转入网络世界,目前交易、社交、阅读等各类行为创设于网络世界的比例日益提高,互联网成为数据生长的土壤。
其次,互联网的潜在高回报和广阔市场助推的硬件、软件革新为大数据中的数据贮藏提供了基础。数据产生方式影响着贮藏模式,数据在现实空间的产生形成了沿袭千年的现实空间贮藏,如图书馆、博物馆、纪念中心等。互联网在工业应用伊始就展现了其巨大盈利与发展空间,逐利资本与各方博弈引发软件与硬件的迭代,在为数据产生提供土壤的同时,也为数据贮藏提供条件,从占地颇广而检索困难的实体贮藏到集合建库而快速锁定的虚拟云盘,从块头笨大而贮藏空间小的软盘到小巧便携而空间不断扩展的优盘,无不体现着在软、硬件双重助推下数据贮藏方式的便利与快捷。此外,沿袭久远的实体贮藏模式在和平年代时仍有虫食、霉侵、氧化、烧毁等可能,容易导致数据在历史传承与现实使用中的消散,而数据的丢失将使得耗费心血与物力的产生过程成为无用之功。而在软、硬件的支持下,只要做好事前工作,就能有效防范数据的丢失。
最后,在互联网发展的带动下,数据在虚拟空间的产生与贮藏使得低成本与高效率地提取与分析数据成为可能。数据提取是运用数据的第一步。数据贮藏在实体中会导致运用时的二次转化,将推高分析成本、降低分析效率。而贮藏在虚拟空间的数据,只需分析员动动手指就能提取与检索。各种数据分析软件的传播、教学与运用,也构建在现代互联网技术之上,如SPSS、R语言、Python等。此外,高效廉价的检索与分析使数据可视化成为可能。
总之,大数据的基础是数据,目的是运用数据进行分析。互联网语境下,数据产生与贮藏的新模式使得分析高效且成本低廉,有利于大数据技术的发展与运用。大数据技术的广泛运用促进了人工智能的发展。人工智能的核心不在于外貌与人类相似,而在于能够自动推理。推理过程可分为输入与输出,输入过程是输出过程的基础,输入的质量与效率决定了输出的质量。因此,从国际象棋中的“深南”到围棋中的“阿尔法狗”,人工智能的运用逐步取得辉煌的背后是其输入数据效率与质量的提高。以“阿尔法狗”为例,其力克围棋世界冠军柯洁的背后是在短时间之内对人类历代棋谱全方位、多层次学习的能力。大数据技术下数据获取度的开放与数据分析能力的提高,为人工智能的发展提供了技术保障。
1 See TrevorJ.Barnes,Big Data,Little History, Dialogues in H u m an Geography ,Vol.3, No.3,2013.
2 See Trevor J.Barnes and Matthew W.Wilson, Big Data, Social Physics, and Spatial Analy-sis:The Early Years,Big D ata&Society ,Vol.1,No.1,2014.
3 参见熊明辉:《法律人工智能的前世今生》,载《中国社会科学报》2018年10月10日第5版。
4 参见魏宏森、林尧瑞:《人工智能的历史和现状》,载《自然辩证法通讯》1981年第4期。