大数据与社会实在的三维构建(4)

作者:段伟文 更新时间:2016-11-17 12:14 点击:
【论文发表关健词】大数据,社会实在,表征性,语义性,能动性
【职称论文摘要】
基于数字种性系统和算法分拣程序的社会实在的构建正在赋予人类一种全新的数字身份,它使得量化社会的信息颗粒度在继特定人群(阶层、性别、年代)到个体之后进一步细分为个体(individual)在算法上可区分的特征。

  基于“数字种性系统”和“算法分拣程序”的社会实在的构建正在赋予人类一种全新的数字身份,它使得量化社会的信息颗粒度在继特定人群(阶层、性别、年代)到个体之后进一步细分为个体(individual)在算法上可区分的特征。当代哲学家德勒兹将这种细分称作“分格”(dividuals),并将托夫勒在《第三次浪潮》中提出的人类由基于商品生产的纪律社会所转向的基于信息和金融化商品的经济社会称为“管控社会”。他指出,在以往的社会中,管控发生在职场、学校和家庭等具体场所,人们的行为通过受到关注而被规训,但存在可以不受管控的空间;而在管控社会中,管控则来自由代码组成的数字语言,它们决定了人们能否获得信息,这种管控不是将人们放到具体的场景中,而是使人置于一种无处不在的、持续运转的网络之中,如同巨型筛子上错落有致地排列筛孔一般。〔9 〕
这些洞察预言了大数据时代人类算法身份的出现,即可以通过一套专门针对每个人的算法对其数据痕迹进行精细的分析。而其出现的必要性在于,不论是从商业还是管理目标出发,不对每个人及其行为方式加以精细区分,市场细分和有针对性管理就不可能展开,也无法对人进行信用评分或对某些有危害社会倾向的人加以监控。显然,管控社会与所谓信息监控社会研究中边沁式的“圆形监狱”隐喻的管控结构并不相同。与以严苛和专制的规则规训囚犯的圆形监狱不同,在管控社会中,实际上是通过消费等“满足”人的意愿和欲望的活动来规训人的自由度。
作为一种表征性社会实在的构建,大数据时代的数据身份实际上是个人与社会互动的产物,虽然人们会意识到“数字种性系统”或“算法分拣程序”是企业或管理部门识别个人的手段或“俘获工具”,但也认识到其另一面则是人们彰显个性和实现自由的工具。因此,在数据化的表征性社会实在的构建中,人们不得不面对的吊诡是:数据已经成为人们身份不可分割的一部分,但却并不拥有它。因此,人类社会在一定程度上可以说正在经历一场“数据谋杀”或数据涅槃。
三、 大数据方式牵引社会实在语义性构建
通过对基于大数据社会实在构建的进一步反思可以看到,大数据并不能带来完美的表征性构建。在实践层面,只有通过语义性的社会实在构建,表征性的社会实在才能被赋予有价值的意义,而且基于大数据语义性的社会实在构建与表征性的社会实在构建是密切相关和互为条件的。
大数据现实挖掘和各种智能分析固然给数据化社会实在的表征性构建带来了全新的可能性,但应该认识到表征性的社会实在并非数据化社会实在构建的全部内容,尤其不能将大数据等同于存在本身或对存在的完美表征。一方面,大数据一般指基于各种测量数据或采集数据的完整的数据集,它必然受到现有理论和数据测量与采集等相关技术的制约,无法替代存在本身。另一方面,虽然大数据可视为对自然存在或社会存在的多样性和多维度的表征,甚至可以在一定程度上视其为完备的和全方位的,但这些表征既不可能穷尽对存在的探索,也不可能仅仅靠数据说话实现认识上的范式转换。
实际上,社会实在的表征性构建与语义性构建互为条件、无法分割——所有的数据必须先赋予其意义然后才能用于表征实在,而数据也只有达到一定的精确性和多样性才可能从中获得有价值的发现。以自然科学中开普勒的发现为例,虽然开普勒三定律所运用的第谷的天文观测记录可以视为大数据集,但不能认为第谷的观测记录是对宇宙存在本身的完美表征。开普勒的成功首先在于他选择了以太阳作为参照系,通过这一新的视角赋予了世界以全新的意义——这无疑是一种语义性的转向。以此为前提,开普勒透过第谷完整而精确的观测数据,获得了行星沿着椭圆轨道运行这一新的实在图景,也赋予了日心说更为确切的新意义。在自然实在的构建中,表征性构建与语义性构建的主要差别在于,前者强调实在构建的基础是唯一正确的理论,后者则认为应该将可能存在不同范式的理论基础视为模型,实在的意义是由模型所赋予的。

  在社会实在的构建中,语义性构建一般是表征性构建的前提,或者说表征性实在只有被解读为语义性实在才可能获得有价值的意义。正因为如此,信息哲学家佛洛里迪强调指出,大数据的真正问题并不在于数据之“大”,而在于如何从海量的数据中挖掘出其背后具有规律性的“小模式”。 〔10 〕这些所谓的“小模式”实际上就是数据中所包含的秘密,即各种语义性的实在,如某人信用评分的高低、对某个商品可能感兴趣的顾客、潜在的恐怖分子、社交媒体上的情绪传播模式等。为了揭示这些秘密,可以先提出有意义的问题,再以此作为语义线索,通过基于大数据的社会实在表征去寻找答案,获得确切的语义性实在;也可以不断变换社会实在的数据化表征形式,通过可视化等手段提出一些有意义的猜测,再进一步细化有价值的语义性实在。在通过现实挖掘发现这些语义性实在的过程中,虽然利用了大数据,但显然超越了数据原有的表征意义,而关注如何赋予数据以新的意义,实际上是在原有数据的基础上开展语义性重建。同时,这些语义性重建又是进一步表征性构建的基础。 从知识发现的角度来看,基于大数据的表征性实在可以视为一种介于真实世界现象与基于数据知识发现之间的媒介性的存在,语义性构建是在表征性构建基础之上的二次发现。 〔11 〕通过大数据现实挖掘及智能分析所揭示出的语义性实在是传统认识方式所无法获得的,特别是那些从全新视角出发关于社会事实的有意义的陈述,不仅涉及新的不为人知的各种关系的相关性,还会呈现很多人们永远无法想象的内容。例如,通过对社交媒体的数据挖掘发现,如果配偶双方与共同好友的联系紧密,他们在两个月内分手的概率就会大于50%,像这些研究显然只有通过大数据才能完成。 

  近年来,谷歌运用其数字图书馆对量化历史变迁领域进行了探索,试图以一种看待历史变迁的新视角和语言、文化和历史的计量方法推进“文化组学”(culturomics)研究。其研究原理是哈佛大学德国文学系主任齐夫(G. K. Zipf)在1937年发现的齐夫定律(Zipf’s law):在大型文本(如乔伊斯的小说《尤利西斯》)中,每个词出现的总频次与其在所有的词频率表中的排序逆相关。此后,齐夫和其他科学家发现财富与收入的分布、城市的规模、姓氏出现的频次、战争伤亡人数、热词的流行、人的受欢迎程度等也存在着 “大者更大” 之类的幂律。〔12 〕33-35根据这一原理,谷歌研究人员设计了一种“n元词组查看器”,通过可视化的曲线呈现某个词或某几个相关词汇在谷歌数据图书馆的海量语料库中的词频随时间的变化,以此展示一些重要的历史人物的名望起落、社会观念变迁、历史事件的集体记忆等其他研究方法难以呈现的历史文化脉络。 (责任编辑:论文发表网)转贴于八度论文发表网: http://www.8dulw.com(论文网__代写代发论文_论文发表_毕业论文_免费论文范文网_论文格式_广东论文网_广州论文网)

发表评论
本站模板均经测试成功,请放心下载,遇到任何问题或者需要购买付费论文请联系本站。
表情:
验证码:点击我更换图片