第四节 认知大数据范式下的管理决策理论
一 数据摄取阶段
管理人员摒弃已有经验和直觉,尽可能保持客观中立的原则来确定数据目标,技术人员则根据数据目标确定摄取哪些类型、哪些来源的数据和摄取数据的技术,并从相应的传感器、智能设备等数据域中收集数字足迹。由于认知导向的系统结构、系统参数和应用边界定义存在一定的局限性,数据完整性往往存在误差,而数据摄取的关键在于确保数据的完整性,即能够根据数据目标真实地反映客观世界,这就要求管理人员和技术人员能够理解并掌握数据空间中的已有数据、缺失数据和未知数据的充斥程度。基于此,本章从大数据有效性维度将数据分为活跃数据、休眠数据和缄默数据三种类型,以便实现数据空间有效理解和进一步扩展。活跃数据是指大数据集合中与其他数据发生价值关联,可供管理人员和技术人员随时访问和使用的数据。例如快递公司利用活跃数据(地理定位数据以及车辆各部位的传感器数据)来跟踪车辆位置,并达到优化行车路线的目的。休眠数据是大数据集合中已经被识别并存储在各种相应的系统中,囿于没有与其他数据发生价值关联,或者价值关联尚未被挖掘或呈现而未被访问和使用的数据,但是决策者可以根据已有理论和经验对这部分数据的属性做出合理假设,进而假设和界定其对系统模型的影响。例如,移动公司通过电话来访、短信来访等形式获取顾客满意度数据,在此过程中会遇到诸如客户拒接电话、拒回短信等情况,使移动公司无法获取到每位客户的数据,但是这部分数据的不完整度是被移动公司所掌握的。缄默数据是系统中尚未被挖掘和表达的数据,且无法被管理人员和技术人员以任何方式定性或定量进行合理假设的数据。例如,社交网络包含多个数据空间配置,任何社交媒体平台都无法覆盖所有个体,而个体在不同的社交媒体平台行为存在差异,此时若对某个个体进行社交网络分析,数据空间会充斥较多的缄默数据。特别地,数据空间中存在的三种类型的数据不是静态固定的,而是根据数据目标的界定以及大数据分析技术的发展进行动态的转化,且呈单向和双向两种形式转化。随后,管理人员和技术人员根据数据目标、数字足迹和上述划分的三种数据类型形成可理解的数据情报,使管理人员和技术人员对系统结构、系统参数和应用边界有一个统一的认知和把握。
二 数据准备阶段
管理人员和技术人员直接或间接从有效的独立数据源摄取的数据往往需要经过合并、集成等环节,无差错的数据合并、集成后的错误通常是无法避免的(Dean & Sharfman,1996;Yaqoob et al.,2016),获取的数据情报也仍包含着错误,而大数据的应用要求是根据数据目标客观反映研究对象的特征和变化,进而建构事物客观发展规律的数据模型和得出正确的数据结论。因此,管理人员需秉持着经验性和非评判性处理标准,在技术人员的协助下对数据进行质量检查、同构转换、建立索引以及加密存储等工作(Gandomi & Haider,2015;Blazquez & Domenech,2018),去伪存真,加以修正,进而完成信息提取。经验性和非评判性处理标准指的是按照观察的事实进行处理,不需要立即判断或标记(Good et al.,2016),只涉及对当下的感知但并不自发地评估、分析或反思。质量检查,即防止意外值、缺失值对数据分析起干扰甚至破坏作用,保证数据的一致性;同构转换即根据分析软件配置,选取标准通用的数据形式,将多源异构的数据进行同构转换;建立索引即通过建立数据索引机制,实现数据的重用和可追溯性;加密存储即根据国家法律法规对数据进行加密处理及存储,实现数据安全。由于系统结构、系统参数和应用边界定义的局限性,管理人员和技术人员清醒地认识到数据摄取的有效性和可信度,并通过大数据技术探索和外部环境调整等策略发现数据摄取的新来源、关联休眠数据的尚未发掘的价值、挖掘和表达系统中缄默数据,进而拓展活跃数据、休眠数据、缄默数据独立的数据空间半径和改变数据空间中三种类型数据的权重来提高数据情报的有效性。
三 数据分析阶段
根据认知发展理论,在分析推理过程中,人类的强项是在受到外界刺激时瞬间将新感知到的信息纳入已有的知识结构中,同时,对于感知到的与现有知识结构不一致的信息,也能够迅速找到相似的知识结构予以标记,或者创造一个新的知识结构。机器在分析过程中的强项是具有远远超过人类的工作记忆能力、强大的计算能力以及信息处理能力,并且不带有任何主观认知偏向性(Piaget,1972)。但也有学者提出异议,认为政治内嵌与资本介入、社会结构性偏见的循环以及量化计算对有机世界的遮蔽使基于机器的大数据分析仍存在主观偏向(Bengio,2013)。事实上,机器从未独立创造认知偏向性,偏向性习得于数据挖掘中的数据集不均衡、特征选取的偏颇以及人工打标带入的主观性等环节。也就是说,数据摄取和数据分析阶段已经存在认知偏向现象,而这种“隐匿性”往往未被管理人员和技术人员所察觉。因此,管理人员和技术人员应协同分析,充分发挥人类强项和机器强项,使数据分析结果呈现客观性和合理性。一方面,管理人员作为需求主体,根据研究目标选择合适的组织理论建构分析模型,并利用对外部环境的态势感知将个人经验、直觉和知识融入到数据分析过程中,为技术人员提供理论化和情境化的信息。另一方面,技术人员将管理人员提供的信息纳入和整合到自己已有的认知结构中,改变原有的认知结构或创造新的认知结构,运用算法将新的认知结构数据化来丰富数据空间,并通过编码构建和完善数据分析模型,如此不断建构、修正、扩展现有的经验空间和数据空间,使其摩擦、同化、顺应和平衡,得出客观结果。此外,技术人员利用可视化技术输出数据分析结果,尽最大限度地消除数据空间和管理者认知空间的边界(邱国栋和王易,2018),呈现出数据中隐含的信息和规律,并建立符合管理人员认知规律的心理映像。基于可视化结果,管理人员利用创造力和思维表征启发性地关注分析结果中富有潜力的空间领域(Holzinger et al.,2019),提高数据分析的附加值。
四 数据决策阶段
大数据技术纳入决策的参考范围深刻影响了组织的决策制定和决策执行。相较于智能决策(即基于数据分析模型产生的结果预测和评估不同方案的结果进而做出决策),知情决策(即基于数据分析所产生的信息使决策者在知情状态下决策)的可操作性和可解释性更容易被组织所接受(Tabesh,Mousavidin & Hasani,2019;Lee,Kao & Yang,2014)。事实上,Simon早在20世纪60年代在其决策理论中就提出计算机作为一种新的决策技术和工具能够为组织管理决策带来全新的变化,这种变化不仅仅在于数据与经验的区分,还在于决策过程的参与(Simon,1960),而决策过程进而又影响决策的有效性,即决策产生预期结果的程度(Eisenhardt & Zbaracki,1992)。Dean和Sharfman(1996)选择程序理性和政治行为两个构念开发了战略决策有效性的模型。程序理性是指决策过程多大程度上包含与决策有关的信息收集,以及多大程度上依赖于对这些信息的分析。政治行为是指旨在保护自己个人或者群体利益的行为。Dean和Sharfman(1996)认为有效的决策必须基于组织整体的目标,但决策过程中的政治行为更多地涉及个人或群体的利益,一旦这些利益与组织整体利益相冲突,政治行为就会使决策目标偏离。综合Simon、Eisenhardt、Zbaracki、Dean和Sharfman的观点,认知大数据的数据决策应是基于决策过程的数据知情决策。程序理性则表现为决策过程中依赖于数据和经验的程度。政治行为则表现为组织决策过程中涉及自身利益的不同部门和管理人员行为,例如,数据部门通过大数据分析获取了产品测试权力,使业务部门管理人员无法直接决定多款产品的生产和营销资源分配,长远来看,影响了部门内部收入分配及权力分配,因而遭受业务部门等利益相关部门和人员的抵制(刘意等,2020)。不可否认的是,数据分析结果不仅可以显著地降低决策复杂度,减少决策过程中的不确定性,还能洞悉大数据背后的信息、知识与智慧(Chang,Kauffman & Kwon,2014),从而在微观、中观、宏观层面为决策者提供支持(邱国栋、王易,2018)。因此,管理人员和技术人员的有效沟通、组织正确的数据文化等价值命题引导显得极其重要。价值命题引导下的认知大数据决策过程中,管理人员面对非线性、变结构、变参数等开放性复杂决策问题,根据经验、直觉所积累的知识存储,客观把握数据决策程度和调整数据分析结果,同时,尽可能地减少政治行为对决策过程的消极影响。当然,随着人工智能等新兴技术的发展,无人工参与的机器决策也不断应用在组织决策中。例如,阿里金融以大数据为基础,引入大数据分析和数据挖掘技术寻找企业经营状况和资金流向等关键数据,通过阿里云征信系统将分析结果转化为提供授信审批的凭证,从而实现“三分钟申请、一秒钟房贷、无人工审核”的阿里金融信贷模式。因此,除了积极将基于决策过程(程序理性和政治行为)的数据知情决策应用在组织实践中,我们也要不断探索数据智能决策模式。