您的当前位置:首页近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析

近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析

2023-04-27 来源:小侦探旅游网
2013 ̄3 。。蚰d Te 篙 臻m。nt Res。眦h doi:10.3969/j.issrr 1000-7695.2013.03.042 近五年国际国内云计算研究进展对比 ——基于文献的计量分析和可视化分析 黎敏,钟辉新 (电子科技大学中山学院广东中山528402) 摘要:采用EndNote,ROSTDM、SATI和Ucinet多种分析工具对2007—2011年CNKI期刊数据库收录的核心期 刊中有关云计算的中文文献和SCI收录的英文文献进行统计和可视化分析,以发现国际国内云计算研究的学科 分布、作者合作程度和研究的热点共同点和不同点。 关键词:云计算;可视化分析;文献计量 中图分类号:G252.4;(;253.1 文献标识码:A 文章编号:1000—7695(2013)03—0187—05 Cloud Computing Research Comparisons at Home and Abroad in the Past Five Years Based on Bibliometries and Visualization Analysis LI Min,ZHONG Huixin (Zhongshan College of UEST,Zhongshan 528402,China) Abstract:The paper conducts a statistical and visual analysis of those articles published on cloud computing during 2007 —201 1,which are recorded in core journals of the database of CNKI and SCI,by applying tools of Ucinet,EndNote, ROSTDM nad SATI to find similarities and diferences of subjects distirbution,author cooperation and hot domains at home and abroad. Key words:cloud ccomputing;visualization analysis;bibliometries 1 前言 文献进行回顾与总结,能够发现其发展动态与前沿, 有利于我国云计算研究的借鉴与创新。为此,笔者 云计算(cloud computing)作为一种新型的基于 对2007年以来国际国内云计算相关文献的外部特征 Internet的服务供应方式,已经对于I1r的服务理念产 和内容进行综合分析,以此反映云计算研究的现状 生深远的影响。根据Gartner每年的十大战略技术调 和最新进展,并希望对国内相关研究有所帮助。 查,云计算继2009年位居第二、2010年位居第一之 后,再次成为2011年最受期待的热门技术 J。云计 2数据获取与基本描述 算的概念是在2006年8月9日由Google首席执行官 2.1数据获取 埃里克・施密特(Eric Schmidt)在搜索引擎大会 本文国际英文文献所使用的数据来源于美国科 (SES San Jose 2006)首次提出的概念,2007年1O 学情报研究所(Institute for Scien—tiifc Information, 月,Goosle与IBM开始在美国大学校园推广云计算 ISI)出版的Web of Science数据库,该数据库中收 的计划,取得巨大成功,引起广泛的关注。此后, 录了来自250多个学科领域10,000多种核心期刊 世界IrI’巨头都竞相进入云计算领域,各个公司依据 的文献,这些期刊是经过严格评估和长期跟踪其影 自己传统的技术领域和市场提出了自己的云计算构 响和质量后进行选择的,因此基于对web of Science 架;世界各国纷纷制定自己云计算计划,抢占战略 数据库中近十年的有关云计算文献的分析,能够较 制高点;同时云计算也成为学术界的热点,不同领 为全面、科学地反映国外云计算研究的进展情况。 域的专家学者以不同的专业视觉对其研究。研究进 数据的检索策略是主题=“cloud computing”;数据 展如何,经笔者检索CNKI全文期刊网络出版总库, 库=SCI—EXPANDED,入库时间=不限。由此共获 发现目前还无学者对国际国内的整体性研究进行系 得Article、Proceedings P印er、Review、editorial mate. 统的对比描述与述评。通过国际国内云计算的研究 rial、Letter、Meeting Abstract等多种类型文献482篇 收稿日期:2012—05—07。修回日期:2012—07—10 1 88 黎 敏等:近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析 表2国际英文文献的学科分布 序号 学科类别 载文量(篇)百分比(%) (检索日期为2011年12月18日),鉴于本研究的目 的主要是关注云计算研究进展与发展趋势,因而只 选择前四种文献类型470篇。而国内中文文献来源 与中国学术期刊网络出版总库,它是世界上最大的 连续动态更新的中国学术期刊全文数据库,截至 2011年6月,收录国内学术期刊7700多种,包括创 刊至今出版的学术期刊4600余种,全文文献总量 3200多万篇,核心期刊收录率96%l2 ,其收录的文 献能比较全面反映国内学术研究情况。数据的检索 策略是主题=“云计算”,入库时间=2007--2012, 期刊来源=核心期刊,(检索日期为2011年12月28 日),共获得文章665篇,经过笔者阅读摘要信息, 去除各类不相关的文献53篇,因此最后选取的文献 只有612篇。 2.2文献年度分布分析 通过文献年代分布统计分析,有助于我们了解、 把握国内外云计算研究的发展速度,表1是国际国 内研究云计算文献的年度分布情况,从表中可以看 出,国内外对云计算研究几乎是同步,从2007和 2008年是起步阶段,学术界接触到云计算的概念, 做一些探索性的研究,2009—201 1年文献的增速很 快,这云计算的概念获得了大家的认同,不同领域 的学者竞相涌入研究。 表1 国际国内研究云计算文献的年度分布 2.3 文献学科分布分析 通过分析某一主题的学科分布情况,可以了解 该主题的应用,对进一步深化其在各领域的应用或 开拓新的应用领域具有重要意义。通过统计470篇 英文文章发现含有2篇以上的学科36个,通过统计 613中文文献发现含有2篇以上学科也是36个,这 说明云计算作为新技术和理念获得国内外各个学科 领域的专家的关注,已经广泛应用到其他学科领域, 其中居于前十位的国际文献和国内文献的学科分布 见表2和表3。通过对比分析,国际国内研究云计算 共同热门学科有计算机科学、电信学、自动化和图 书馆信息学,其中计算机科学占第一位,值得注意 的是国内图书情报档案馆届对云计算的关注度特别 高,发文献量特别高。国际上研究云计算独特热门 学科有生物学、遗传学、数学、运筹学,经查阅文 献,发现这些学科上发表的文章主:要研究云计算的 各种算法,而国内独特研究热门学科有经济管理学, 经查阅文献,发现这些学科上发表的文章主要研究 云计算对我国经济、企业的影响和应对策略。 序号 学科类别 载文量(篇)百分比(%) 3 文献合著作者的可视化分析 通过云计算研究论文作者的分布进行统计,可 以了解该领域作者发文的大体情况,确定该领域的 核心作者与研究群体特点,进而实现对该领域的跟 踪研究。从表4看出,本次研究的470篇英文文献 共有500作者(包括合著者),其中发表论文3篇以 上的作者有46人,占作者总数的9.2%,共发表论 文168篇,占总论文量35.7%,其中BUYYA,R发 表了l4篇文章,发文量量居首位。大多数研究者单 独或合作发表了1篇相关论文,共有319人,占作 者总数的63.8%人,可见目前国际上研究云计算的 仍处在百家争鸣的阶段。 表4国际英文文献著者分布 黎续上表 敏等:近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析 189 通过文献高频作者网络图中的作者群体点中心 度分析、中间中心度分析,可知目前国外研究云计 算的作者点中心度最高的是Buyya,R,其点中心度 是16,表明他与16个作者有合作发表过文章,其次 Tordsson,J和Elmroth,E,他们的点中心度分别是 l3和10,这说明以上三位作者对整个网络有较大的 影响力。而中间中心度排在前五名的分别是Konstan— 从表5看出,本次研究的612篇国内中文文献共 eli,K(10.333)、Li,J(10.000)、Hernandez,F 有1001作者(包括第合著者),其中发表论文3篇以 t上的作者有61人,占作者总人数6.1%,共发表论文 225篇,占总论文量37.6%,其中张云勇发表了13篇 文章,发文量量居首位。绝大多数研究者单独或合作 发表了1篇相关论文,共有831人,占作者总数的 83%,因此,国内目前研究云计算也是处在百家争鸣 的阶段,而且研究者比国际上分布更为分散。 表5国内文献著者分布 为了研究作者群体关系,笔者对国际国内外文 献作者进行网络整体分析,通过武汉大学虚拟团队 提供的ROST软件中的社会网络和语义网络分析功 能,构建的高频作者特征词一共词矩阵(频次大于 1),然后将此表导人目前比较流行的社会网络软件 UCINET,然后借助UCINET画图功能和强大网络分 析功能直观显示出作者共现的直观图形和分析(见 图2和图3)。 图2 国际文献高频作者网络图 (9.833)、Buyya,R(9.000)、Puliafito,A (8.000),这说明这些作者对云计算研究资源进行有 一定的控制,起到一定的桥梁中介作用。从图2可 以看出国际上研究云计算的作者已形成了四个较大 子群,但是目前仍没有形成派系。目前国内研究云 计算的作者点中心度最高的是张云勇,其点中心度 是27,表明他与27个作者有合作发表过文章,其次 是张霖和陶飞,他们的点中心度是13,这说明以上 三位作者对整个网络有较大的影响力。而中间中心 度最高的是向文和陶飞,中间中心度都是1,而其他 的作者都是0,说明目前国内还没那位作者能云计算 研究资源进行较高的控制。从图3可以看出国内研 究云计算的作者已形成了三个较大子群,也没有形 成派系,由此可见,国内作者的合作不如国际作者 之间的合作,尤其缺乏起桥梁中介的作者。 图3 国内文献高频作者网络图 4云计算研究主题可视化分析 关键词是对文章核心内容的浓缩和提炼,能有 效地将文章的研究目的、对象、方法和结果等组织 起来。如果某一时期某个关键词在其所在领域的文 献中反复出现,可反映出该关键词所表征的研究主 题是该时期、该领域的研究热点。关键词的变化可 以反映该领域研究主题的变化,对关键词的词频进 行分析在一定程度上可以揭示文章的研究内容 。 为此笔者在表6列出了国内外频次大于5的关键词, 以期能够显示国内外云计算研究热点。 190 黎敏等:近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析 表6国际国内文献高频关键词 为了更清楚研究关键词之间的关系,本文选用 CiteSpaceII作为国际文献关键词分析的工具。 CiteSpaceII能够自动生成关键词的共现网络,计算每 一关键词的中心性,并对部分高频关键词进行聚类。 高中心性关键词即为连接不同研究领域的关键点,为 使用户更容易辨认这些关键点,CiteSpace II在视图 中将高中心性的关键词用紫色光圈突出显示。本文 将SCI下载的纯文本格式的数据倒CiteSpacelI,Node Types选择关键词(Kewords),Tmescaling的值为1, 选择2007—2011年分成5个时段进行处理,其他设 置按系统默认,运行CiteSpacelI,得到近五年来国际 云计算研究热点视图,见图4。整个图分成两部分, 右边部分是以云计算为中心大网络图,左边部分则 是与互联网和气候为代表小网络图,这种分布图让 人感到意外,因此,笔者查阅了具体文献,结果发 现了有两篇文章同时标引了上百个关键,其中包含 了“云计算”和“气候”,这就是主要的原因。整 个网络图“云计算”中心性最高,其次是“虚拟 化”,再其次是“管理”和“气候”。 图4近五年来国际云计算研究热点视图 对中文文献的关键词分析本文采用文献题录信 息统计分析工具SATI(Statistical Analysis Toolkit for Informetrics)建立关键矩阵,再利用UCINET进行分 析。具体的步骤如下,首先从CNKI下载EndNote格 式的题录信息,第二步利用SATI转化为XML数据, 第三步对关键进行分词处理,第四步选择Matri中 Co—Occurrence Matirx(V ̄ued)分析功能建立100× 100关键词矩阵,第五步是将关键矩阵导人社会网络 软件UCINET中,建立高频关键词整体网络图(见 图6)。图中每一个节点代表一个关键词,节点的大 小表示关键词出现频次的高低,节点之间的连线表 示关键词之间的共现关系。从图6可以发现,整个 网络图是以云计算为中心,向四周辐射,研究文献 围绕云计算来开展,中心性最高的云计算,其次是 虚拟化,再次是数字图书馆。 图5近五年国内云计算研究热点视图 黎敏等:近五年国际国内云计算研究进展对比——基于文献的计量分析和可视化分析 191 从表6,图4和图5可以看出,国际国内文献共 同研究的热点是虚拟化技术(虚拟化、虚拟机、虚 拟技术),云服务(云服务、信息服务、IaaS、SaaS、 PaaS、软件即服务),云计算的计算模式(网格计 算、高性能计算、并行计算、网格),资源共享(关 键词包括云存储、数据中心、信息资源、资源共享、 资源分布)、云安全(云安全、信息安全、隐私), 云计算构架模式(MapReduce、Hadoop)。国际文献 研究独特的热门主题有管理、工作流程、气候、生 的研究仍处在百家争鸣的阶段,国际上形成四个较 大的研究团体,国内形成了三个比较大的研究团体, 都没有形成比较大的研究派系,国内的合作程度低 于国际的合作程度,尤其缺乏起中介桥梁作用的。 (3)通过关键词可视化分析,发现国际国内文献共 同研究的热点是虚拟化技术、云服务、云计算的计 算模式、资源共享、云安全、云计算构架模式等。 国际文献研究独特的热门主题有管理、工作流程、 气候、生物信息学等,而国内文献研究独特热门主 物信息学等,而国内文献研究独特热门主题主要包 题主要包括数字图书馆、物联网、云制造、智能电 括数字图书馆、物联网、云制造、智能电网、电子 网、电子商务等。 商务等。 参考文献: [1 l GARTNER.Identiifes the Top 10 Strategic Technologies for 201 1 [EB/OL].Gartner Reports of Oct 2010.[2011—12—26]ht. tp://www.gartner.corn/it/page.jsp?id=1454221 5 结束语 本文选取了CNKI核心期刊上以云计算为主题的 中文文献和SCI收录的云计算的英文文献作为研究 对象,采用EndNote,ROSTDM、SATI和Ucinet多种 分析工具相互配合,对国际国内云计算研究文献进 行全面系统的分析,用可视化的方式展示了云计算 领域的研究学术代表人物,合著者关系,云计算研 究热点。我们可以得出如下的结论:(1)通过相关 的统计数据分析,发现国际国内云计算的研究起步 相同,目前正处在高速增长阶段,涉及学科非常广 (2)通过作者的可视化分析,发现国际国内云计算 [2]数据库介绍信息[EB/OL].[2011—12—26]http:// acad.cnki.net/Kns55/brief/result.aspx?dbPrefix=CJFQ [3]邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化 分析——基于l3种高影响力外文源刊的计量研究[J].中国图 书馆学报,2011,37(192):5l一6o 作者简介:黎敏(1979一),男,广东兴宁人,科员,研究方向为政 务信息化;钟辉新(1979一),男,广东梅州人,馆员,研究方向为 信息分析与情报研究。 (上接第186页) [7]张素芳,刘建准,徐刘靖.企业信息系统需求分析中的用户参与 有效性研究[J].情报杂志,2008,12:115—116 [8]JULIAN T,CRAIG S.The value of user participation in e—commerce systems development[J].Inform Science Journal,2004,7:31—45 tionship in ifnomatrion engineering[J].Ifnormation Systems Re— search,1994,5(4):350—377 [16]BAKRI H,HARTWICK J.User paritcipaiton,conflict,and conflict resolution:the mediation roles of inlfuence[J].Ifnormation Systems Research,1994,5(4):422—438 [9]王剑敏,廖正鹏,徐青.ERP项目中高层支持对用户参与影响的 实证研究[J].重庆大学学报:社会科学版,2007,4(13): 44—49 [17]LEWIS J.Fundamentals of project Management[M].Amaeom Books,1995 [18]NIDUMOLU S.Stndardiazation,requirements uncertainty and soft— [10]WINSTON T L,BENJAMIN B M.The relationship between user par- ticipation and system Success:a simultneous contiangency approach ware pmject perfomarnce[J].Ifnormation Systems Research, 1996,31:135—150 [J].Information&Management,2000(37):283—295 [11]VANCE jv,张翼翔.沟通助推集成项目成功[J].软件,2009 (8):27—28 [19]RAI A,A1一HINDI H.The e ̄cts of development process modeling nd taask uncertainty on development quality pefrormance[J]. Information&Management,2000,37(6):335—346 [20]WALLACE L,KEIL M,RAI A.Understanding software pmjeet irsk:A Cluster Anlaysis[J].Ifnormation&Management,2004, 42(1):115—125 [12]LAUDON K C.Management Infomartion Systems[M].Perason/ Education,2010 [13]MOHR J,SPEKMAN R.Characteristics ofpartnership SUCCESS:part- nership attributes,communication,and conflict resolution techniques [J].Strategic Management Jounarl,1994,15(2):135—152 [14]LARSON E W.Partnering on projects:a study of the relationship be— tween partnering activiites and project success[J].IEEE Transac・ tions on Engineering Management,1997,2:188—195 [21]NA K S,SIMPSON JT,LIX,eta1.Software development riskand project performance measurement:evidence in Koera[J].Journla of Systemsand Software,2007,8O(4):596—605 作者简介:李萍(1982一),女,江苏武进人,上海理工大学管理学 [15]BEATH C M,ORLIKWOSKI W J.The contradictory structure of sys— tems development methodologies:deconstnctring the IS—user rela- 院硕士研究生,盐城工学院讲师,研究方向为管理科学与工程。 

因篇幅问题不能全部显示,请点此查看更多更全内容