扩展学习|商业智能和大数据分析的研究前景(比对分析)

文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018.

        信息和通信技术的快速发展导致了数字化数据的快速增长,也引起了人们对管理、社会科学和人文领域大数据分析和商业智能研究机会的极大关注。商业智能的大数据和分析趋势为支持数据驱动的决策过程提供了巨大的资源和强大的方法,这是“商业智能”的核心

一、大数据与商务智能的对比

        “大数据”(BD)和“商业智能”(BI)都是近年来学术研究中快速增长的关键词。虽然“大数据”最近很流行,但“商业智能”的提出要早得多。Luhn(1958)开始使用“商业智能”一词来描述传播信息和支持决策过程的自动系统。这一概念后来被纳入决策支助和信息系统领域。例如,Vitt等人(2002)将商业智能定义为一个多方面的概念,包括三个不同的观点:更快地做出更好的决策,将数据转换为信息,并使用合理的方法来管理(第13页)。他们将BI周期定义为包括四个阶段:分析、洞察、行动和性能度量。头巾等进一步扩展了BI,涵盖了数据仓库、数据采集、数据挖掘、业务分析和可视化

        一般来说,BD强调数据方面,包括数据收集、存储和分析,而BI更侧重于数据分析、可视化和用于业务决策的应用。

二、在过去十年中,与“大数据”和“商业智能”相关的学术成果是如何发展和演变的?

        第一个分析是出版趋势。图1显示了“大数据”和“商业智能”的时间趋势。截至2011年,“大数据”学术产出不足38篇。2012年,这一数字增加到92个,此后迅速增加。仅2016年一年,BD出版物数量就达到了3287种。

        与“大数据”相比,BI出版物的数量多年来保持相对稳定。“商业智能”的趋势早在2012年之前就开始了,2008年增加到48家,远高于BD,但到2016年仅增加到183家。这可能是因为作为一种技术,BD的研究范围比专注于业务应用的BI要广泛得多

        图2显示了BD&BI出版物的时间趋势。这些出版物的数量在2015年显著增加到32篇,并继续增长,但仍无法与BD论文相比。发表数量少的原因可能是,尽管BI和BD的应用通常是重叠的,但大多数论文可能会选择将其主要方向显示为技术或管理。另一种可能性是,大数据在很大程度上是一个流行词,在商业领域也被广泛使用,而商业智能则更多地局限于某些领域

        表1给出了数据集中文档类型的统计信息。

三、在这些学术成果中,研究主题是如何变化和演变的?

        表2总结了“大数据”和“商业智能”出版物的高频关键词。关键词按出现频率降序排列。在10637篇“大数据”相关文章中,排名前5位的相关关键词是“模型”、“算法”、“系统”、“MapReduce”和“云计算”。在1168篇“商业智能”类出版物中,排名前五的关键词是“管理”、“数据仓库”、“大数据”、“数据挖掘”和“系统”。虽然“数据挖掘”、“社交媒体”和“管理”等几个关键词有重叠,但我们看到这两组研究之间存在显著差异。

        与BD相关的关键词更侧重于算法和计算,而与BI相关的关键词更侧重于管理和决策支持系统。

        证据与我们的观点一致,即业务开发更偏向于技术,而商业智能更偏向于应用。

        图3显示了10637篇BD出版物中关键词的可视化云。

        重要的关键字用较大的字体突出显示,而关键字的颜色由关键字所属的集群决定。关键词之间的线表示关键词之间最强的共被引联系。“大数据”是云的中心,因为它是搜索关键。与表2一致,“模型”、“算法”、“系统”、“云计算”、“管理”、“网络”和“信息”都是突出的关键词。在标签云中,用不同颜色标记的5个主要簇属于5个不同的主要区域。红色集群由医疗保健领域的出版物组成,绿色集群属于计算机科学领域。“商业智能”位于顶部,属于黄色集群。黄色集群主要属于管理领域。“商业智能”与“管理”、“数据分析”和“预测分析”直接相关,而“知识管理”在同一集群中更大

        图4按时间顺序显示了高频关键词的演变。从acceptmanuscript 10时间轴来看,2016年和2017年“云计算”、“数据仓库”和“知识管理”被更加强调。与2014年的“数据挖掘”、“文本挖掘”、“数据科学”等关键词相比,2016年之后的研究重点发生了转移。

四、哪个学科推动相关研究?

        我们使用研究期刊发表的特刊作为证据。表4总结了8个BD和BI特刊的学术领域。3本期刊属于计算机科学领域,其他期刊与信息科学和管理相关。这意味着,计算机科学一直是推动BD和BI研究的核心学科,而信息科学和管理也是重要学科。

        表5按降序列出了BD和BI发文量排名前10位的期刊。我们可以发现这两组期刊有重叠,但它们的排名却大不相同。与BI论文主要发表在计算机科学类期刊、信息系统类期刊和管理类期刊相比,BD论文发表在更加多元化的期刊上,强调跨学科应用。有三种期刊是专门针对BD的,并声称是多学科的。综上所述,发表商业智能研究的期刊更多地涉及管理领域,而发表商业智能研究的期刊范围更广。

五、谁是这些产出的主要贡献者?

        表6列出了学术网络中被引频次和中心性最高的出版物。

六、未来研究

        鉴于在前面的分析中指出的概况,我们能够确定未来研究的几个关键方向。图7显示了将研究主题划分为四个维度的一般框架:技术、应用、管理和影响。在每个维度中,需要进一步探索许多可能的主题。例如,技术维度包括与数据收集、存储、分析和集成基础设施相关的问题。例如,情感分析需要正确地收集和分析文本数据。正确解析所收集文本数据的技术以及对积极或消极情绪的界定也是研究的重点。

        应用程序问题是与将特定技术应用于特定领域相关的问题。例如,商业应用程序以盈利为导向,而医疗应用程序可能更注重准确性或计算效率。涉及不同应用程序领域的风险可能也很重要。例如,由于对客户细分不准确而产生的营销计划可能会导致金钱损失,但错误的患者诊断处方可能导致生命损失,这是完全不可接受的。因此,研究人员在进行BD/BI研究时需要考虑到应用领域特有的问题。

        管理问题包括影响采用业务流程/商业智能技术的因素、采用技术时的成本效益评估、业务流程/商业智能涉及的安全和隐私问题,以及采用业务流程/商业智能的组织准备情况(如人力资源)。有许多与采用信息技术有关的理论。它们有助于调查为什么采用或不采用BD/BI。从管理角度来看,安全和隐私问题也是一个大问题。

BD/BI的影响是另一个尚未深入研究的方面。以往的研究大多集中在业务流程/商业智能的积极一面,以促进技术的发展,但尚未证明业务流程/商业智能的价值创造或避免负面影响。大多数现有病例报告都是基于轶事证据。我们需要更多的大规模研究来验证BD/BI的价值,包括战略价值和管理价值。我们还需要研究BD/BI对个人生活、组织运作和社会活动的影响(积极和消极的)。例如,从移动应用程序(如谷歌地图)收集的用户的位置或交通数据如何在最小程度侵犯个人隐私的情况下增强社区的安全(或警察殴打)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/361241.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

养老院|基于Springboot的养老院管理系统设计与实现(源码+数据库+文档)

养老院管理系统目录 目录 基于Springboot的养老院管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、老人信息管理 2、家属信息管理 3、公告类型管理 4、公告信息管理 四、数据库设计 1、实体ER图 五、核心代码 六、论文参考 七、最新计算机毕设选…

西瓜书读书笔记整理(十二) —— 第十二章 计算学习理论(下)

第十二章 计算学习理论(下) 12.4 VC 维(Vapnik-Chervonenkis dimension)12.4.1 什么是 VC 维12.4.2 增长函数(growth function)、对分(dichotomy)和打散(shattering&…

【Linux系统】文件系统和软硬链接

前言 之前的博客介绍过了打开的文件是如何被操作系统管理起来的,但是绝大多数文件是没有被打开的,静静地躺在磁盘上。 这些文件也应该要被操作系统管理起来,以方便系统快速地在磁盘上查找它们,进而加载到内存。 这套管理方式就…

vue使用json格式化

安装 npm i bin-code-editor -S // Vue2 npm install vue-json-viewer --save 在main.js引用 //引入bin-code-editor相关插件和样式 import CodeEditor from bin-code-editor; import bin-code-editor/lib/styles/index.css; import JsonViewer from vue-json-viewer //vue使用…

golang开源的可嵌入应用程序高性能的MQTT服务

golang开源的可嵌入应用程序高性能的MQTT服务 什么是MQTT? MQTT(Message Queuing Telemetry Transport)是一种轻量级的、开放的消息传输协议,设计用于在低带宽、高延迟或不可靠的网络环境中进行通信。MQTT最初由IBM开发&#xf…

python webdriver 测试框架数据驱动json文件驱动的方式

简介: 数据驱动excel驱动方式,就是数据配置在excel里面,主程序调用的时候每次用从excel里取出的数据作为参数,进行操作, 需要掌握的地方是对excel的操作,要灵活的找到目标数据 测试数据.xlsx: 路径-D:\test\0627 E…

产品原型图设计规范大全

目前,市场上许多产品经理或设计师都在使用一些优秀的原型设计规范,这些规范几乎涵盖了原型设计的许多方面。一套好的、完整的原型设计规范可以统一产品设计风格,检验产品的可用性,有效提高产品经理绘制原型图的效率,更…

力扣238. 除自身以外数组的乘积(前后缀和)

Problem: 238. 除自身以外数组的乘积 文章目录 题目描述思路复杂度Code 题目描述 思路 思路1: 1.先求取数组的包括当前下标值得前后缀乘积(利用两个数组记录下来分别为leftProduct和rightProduct) 2.当求取一个下标为i的数组中的元素&#x…

构建基于Flask的跑腿外卖小程序

跑腿外卖小程序作为现代生活中的重要组成部分,其技术实现涉及诸多方面,其中Web开发框架是至关重要的一环。在这篇文章中,我们将使用Python的Flask框架构建一个简单的跑腿外卖小程序的原型,展示其基本功能和实现原理。 首先&…

linux --中断管理 -- irq的自动探测机制

irq自动探测机制 如果一个设备的驱动程序无法确定它说管理的设备的软件中断号irq,此时设备驱动程序可以使用irq的自动探测机制来获取其正在使用的irq。 使用自动探测机制的条件 内核与驱动,必须共同努力才能完成只限于非共享中断的情况 探测前&#…

如何查看某一页面在在谷歌有哪些关键词

随着跨境贸易的不断发展,谷歌SEO也被越来越多的人群所了解,所接受。我们在日常操作SEO的时候,往往都会远见这样的事情,那就是自己网站的某一个页面原本只是简单的承载着某一个关键词,但是随着时间的推移,这…

Shell脚本之 -------------免交互操作

一、Here Document 1.Here Document概述 Here Document 使用I/O重定向的方式将命令列表提供给交互式程序 Here Document 是标准输 入的一种替代品,可以帮助脚本开发人员不必使用临时文件来构建输入信息,而是直接就地 生产出一个文件并用作命令的标准…

Linux——动静态库

在进行开发过程中,我们不可避免地会使用到人家的库,那么库到底是什 么?而库又分为动态库和静态库,那么这两个又是什么?这篇博客由我来 简单介绍动静态库。文章目录 1. 库2. 静态库a. 静态库的制作b. 使用静态库 3. 动态…

打击者H5小游戏

欢迎来到程序小院 打击者 玩法&#xff1a;点击飞机上下左右移动躲过子弹射击&#xff0c;打掉上方敌人飞机&#xff0c; 遇到药包会增加能量&#xff0c;弹药包会升级武器&#xff0c;快去射击吧^^。开始游戏https://www.ormcc.com/play/gameStart/262 html <div id"…

基于矢量控制的交流电机驱动simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 交流电机基础 4.2 矢量控制原理 4.3 矢量控制的实现 5.完整工程文件 1.课题概述 基于矢量控制的交流电机驱动simulink建模与仿真。系统仿真输出电压&#xff0c;电流&#xff0c;电机转速以及扭矩…

语言革命:NLP与GPT-3.5如何改变我们的世界

文章目录 &#x1f4d1;前言一、技术进步与应用场景1.1 技术进步1.2 应用场景 二、挑战与前景三、伦理和社会影响四、实践经验五、总结与展望 &#x1f4d1;前言 自然语言处理&#xff08;Natural Language Processing&#xff0c;NLP&#xff09;是人工智能领域的一个重要分支…

快速入门存内计算—助力人工智能加速深度学习模型的训练和推理

存内计算&#xff1a;提高计算性能和能效的新技术 传统的计算机架构是将数据存储在存储器中&#xff0c;然后将数据传输到计算单元进行处理。这种架构存在一个性能瓶颈&#xff0c;即数据传输延迟。存内计算通过将计算单元集成到存储器中&#xff0c;消除了数据传输延迟&#…

中国的茶文化:现代生活中的茶文化

中国的茶文化&#xff1a;现代生活中的茶文化 引言 在现代社会的快节奏生活中&#xff0c;茶文化并未随时间流逝而褪色&#xff0c;反而以其独特的方式融入了全球各地人们的日常生活。它超越了饮品本身的范畴&#xff0c;成为一种连接历史、人文与现代生活方式的艺术形式。本文…

Git 介绍 与 配置

Git 介绍 Git是一个分布式版本控制系统&#xff0c;用于跟踪文件的更改和协作开发。它可以管理项目的版本历史记录&#xff0c;并允许多个开发者在同一时间进行并行开发。 解决上图产生的问题就出现了git 分布式版本控制系统 看下图 Git 配置 Git的基本配置包括用户名和电子邮…

Linux split命令 切割文件

目录 一. 主要配置项二. 按照行数切割文件三. 按照指定大小切割文件 一. 主要配置项 ⏹将文件按照行数或者大小切割为若干份小文件&#xff0c;主要作用就是用来切割文件 -l&#xff1a;表示将文件按照行分割-d&#xff1a;表示使用数字作为分割后的文件名后缀, 而不是默认的…
最新文章