第二节 大数据技术与知识管理
大数据技术的主要目的是将原始数据和数据中的信息转化为可理解的知识,并利用相关知识解决问题和优化决策,这一过程涉及从大数据到大信息进而产生大决策的知识产生过程(Bar-Yam,2016;Chen et al.,2012)。从数据到知识的过程被称为数据—信息—知识—智慧阶层模型(Data-Information-Knowledge-Wisdom Hierarchy,DIKW),又称“知识层次”“信息层次”和“知识金字塔”,是信息和知识文献中最基本的、被广泛认可的、“理所当然”的模型之一。数据、信息和知识的定义在信息管理、信息系统和知识管理的文献中经常被直接或者间接引用。而层次结构则被用来描述和说明数据、信息、知识、智慧之间从较低层次的结构向较高层次的结构发展的过程。
在知识阶层模型中,一个隐含的假设是数据可以用来创建信息,信息可以用来创造知识,知识可以用来创造智慧(Ackoff,1989)。具体而言,数据是表示目标、事件及其环境属性的符号。单个数据是没有用处的。数据和信息之间的区别是功能性的,而不是结构性的。信息来自数据推断,往往包含在文字描述中,回答以“谁”“什么”“何时”“多少”等词开头的相关性问题。信息系统生成、存储、检索和处理数据。知识是对过程机制的理解,它使信息转化为行为指导成为可能。知识可以通过教导、从经验中提取或者迁移等学习方式中获取(Simon,1960)。智慧是提高效率的能力。智慧增加价值,这需要我们称之为信念判断的心智功能,而信念往往是独特的和个人的(Rowley,2007)。根据这一模型,大数据技术通过商业情报分析将大量数据和信息转化为知识,分享并指导数据或者人类决策系统的运行。基于上述观点,Wu等(2016)指出,不同的学科领域的数据会产生不同的知识阶层模型,如表2-2所示。这八类知识阶层模型最终能够被归纳为支持传统决策的商业情报系统和取代传统决策的人工智能系统,这两类系统共同构成了大数据分析技术的知识阶层。
表2-2 大数据系统的知识阶层
大数据技术的一个显著特征是其依赖于云计算等分布式计算技术。分布式计算技术包括云计算、雾计算、边缘计算等,通常包括多个计算实体,并以消息传递沟通各个实体。以云计算为例,通过将数据中心化集成,计算系统能够利用不同算法整合处理数据,并得到组织各自所需要的结果。云计算提供的服务可以是任何类型的,如存储、数据库、软件、应用程序、网络、服务器等,因此覆盖数据集处理和数据分析处理。同理,大数据云的工作原理是将大数据集分解成可管理的“块”,并将这些块分布到不同的计算机系统中以可接受的效率进行处理。这种离散处理的过程就是云计算。在云计算中,数据信息存储在由服务提供商维护和控制的物理服务器上。用户可以通过互联网访问这些资源。根据产品及服务类型的不同,云服务可以被分为三类:基础设施云(IaaS)、平台云(PaaS)和软件云(SaaS)。云计算为数据存储、服务器、应用程序等大数据模块提供了灵活的分工模式,具有很高的可延展性、可及性、可靠性和鲁棒性,能够增强组织业务价值和组织敏捷性,并允许更低的转移成本和更高效率的组织结构。
大数据技术的外部化伴随其商业模式的外部化。大数据相关的先进信息技术降低了企业从外部市场获取资源和知识的转移成本(Young-Ybarra & Wiersema,1999),并促使企业开始利用扁平化的平台结构创造新的竞争优势。平台是一种为垄断、提取、分析和利用大数据而产生的组织形式(Ciborra,1996;Srnicek,2017),它通过将外部资源捆绑以创造集体价值,提高平台生态整体竞争力,因此平台生态的扩展遵循外部化的逻辑(Li et al.,2019)。
大数据技术这一外部化也被称为网络外部化或者网络效应,指网络中的其他用户使用相同或兼容产品或服务时产生的积极或消极效应(Katz & Shapiro,1985),因此也被称为需求侧的规模效应。一方面,将大数据技术纳入战略管理和日常运营的组织在组织利润、业务增长和竞争优势增长上的表现要优于不依靠大数据的组织(Cheng,Zhong & Cao,2020;Mikalef,Boura,Lekakos & Krogstie,2019)。平台生态内组织通过利用广泛存在于生态环境中的大数据范式推动使能创新,促进产品服务创新和机会识别(Davenport & Kudyba,2016;McAfee,Brynjolfsson,Davenport,Patil & Barton,2012;陈国青、曾大军、卫强、张明月、郭迅华,2020),优化供应链流程(Schoenherr & Speier-Pero,2015;Wang et al.,2016),优化企业营销策略(Erevelles et al.,2016),改善人力资源管理(Angrave,Charlwood,Kirkpatrick,Lawrence & Stuart,2016),增强组织决策能力(Janssen,van der Voort & Wahyudi,2017;陈国青等,2020)和更明智的战略制定(Mazzei & Noble,2017)等,最终提高生产效率和运营效率(Chen et al.,2012;Davenport,2006;McAfee & Brynjolfsson,2012)。
另一方面,大数据范式在平台内的泛化推动数字平台生态优势的构建,这进一步推动了平台组织的外部化过程。一项基于家庭游戏机行业的研究指出,网络效应取决于网络规模和网络强度的函数(Shankar & Bayus,2003)。通过参与与外部生态的信息交换,生态参与者能够获取更多用户数据及信息,增加自身网络效应,强化企业竞争优势和价值创造;而更强的企业竞争优势则能够进一步吸引潜在的用户,同时强化所处生态的竞争优势(Rietveld,Schilling & Bellavitis,2019)。三者的动态发展最终构成相互影响的正反馈循环(Li et al.,2019),并导致拥有最多数据资产和技术资产的平台生态垄断市场(Eisenmann,Parker & Van Alstyne,2011)。