1校园数据中心建设与管理方法的探索
戚丽 蒋东兴 武海平 冯珂
摘 要:本文结合清华大学数字校园的建设,从数据中心的职能、建设、管理队伍的建设、规章制度的建设等几个方面介绍了在校园数据中心建设与管理方面的经验。
一、前 言
随着高校信息化进程的提速,各高校校园网上运行的信息系统越来越多。由于互联网技术的不断深入,目前运行的大部分系统都要求通过浏览器能够访问,这样就对服务器端的系统维护提出了比较高的要求:7*24小时的访问,内容的及时更新等。现在高校中普遍存在着谁开发谁维护的现象,各单位提供的服务水平也就参差不齐,如何保证信息系统的正常运行,如何能够以最少的人力投入来完成系统的维护,保证信息系统提供服务的质量,就成为高校信息化必须考虑的问题。我们根据几年的经验,结合清华大学数字校园的建设,提出了校园数据中心的概念,并在建设与管理方面进行了一些探索。本文将从几个方面阐述我们对于校园数据中心的一些看法。
二、数据中心的职能
校园数据中心是数字校园的神经中枢,它存放着服务于学校信息化的各类服务器系统,是保证数字校园的各个应用系统稳定、高效的运行的基础。它需要提供7*24小时不间断运行服务;它需要防范黑客攻击,保证网络与应用系统的稳定运行;它需要对数据进行备份管理与安全保护,保证数据资源不因人为或意外的损毁而消失。另外,通过校园数据中心的建设,可以集中学校有限的财力,实现共享资源,达到降低学校的整体资本,提高服务质量的目标,保证学校的各信息应用系统稳定、高效的运行。
校园数据中心应具有以下职能:
1) 数据存储与管理:数据是学校的宝贵财富,特别是在管理高度依赖于信息化设施
的今天,数据支撑着学校的正常运行。因此,保证数据的安全,使数据不因意外的灾难而损毁就显得特别重要。做好数据的存储与备份,并且是在校园中不同区域的分布式数据备份,是保持学校可持续发展的稳妥之路。
2 奋斗的历程 丰硕的成果(二)2) 系统运行与维护:信息系统建设好后,最重要的是使用。如何保证系统能够稳定、
高效地为用户提供服务,系统的运行与维护是关键。校园数据中心必须有一个较高标准的机房,能够提供稳定的电源,干净整洁的机房环境,适宜的湿度、温度,有专人负责的管理,畅通的网络,以保证7*24小时的系统稳定运行。
3) 安全防护与管理:在病毒泛滥、黑客猖獗的互联网上,要保证信息系统的稳定运
行,还必须有严格的安全管理措施。校园数据中心要综合利用各种安全技术,制定相应的管理制度和管理规范,形成一个全面的、动态的安全防范体系,以保证校园数据中心的安全、保证关键数据、关键应用的安全以及关键业务部门的安全,实现校园网络及其应用系统的安全高效运行。
4) 提供增值服务。校园数据中心建立后,因为具有良好的运行环境,可以对全校各
单位提供多种服务:提供主机托管、虚拟主机等服务,可以使校内的其他单位减少机房建设的投资。校园数据中心有着专业的系统管理、数据库管理、网络管理及安全管理的人员,可以对各单位提供系统管理等服务,这样将大大减轻各单位对计算机管理人才的需求。校园数据中心负责全校各类信息系统的运行和维护,可以从全校的大局出发,对全校的整个信息系统搭建一个合理的架构,这样就可以为校内各部门做应用提供服务(ASP),全面考虑系统的维护、数据的安全、数据的备份和恢复、网络的安全等问题,而不再是只考虑某一个应用系统的运行,这样可以使校内的资源得到更合理的使用。
三、数据中心的建设
在这里所说的校园数据中心的建设主要是指硬件的建设,包括机房、网络、备份系统等。
1) 机房建设
校园数据中心的机房建设应从如下几个方面考虑:
¾ 优良的机房环境:保持恒温、恒湿、防静电、防尘的环境。
¾ 充足的电力保障:采用冗余的电源备份方案,并保障充分、持续的电力供应。 ¾ 安全系统:采取24*7的监控,设置门禁系统防止无关人员进入。 ¾ 合理的布线:将电源线与网线分离。
¾ 消防系统:使用烟雾报警系统和环保气体灭火系统。 2) 网络建设
为保证数据中心能够使各应用系统在网络上畅通无阻、稳定可靠的运行,建议在数据
奋斗的历程 丰硕的成果(二)
3中心内部建立冗余的网络链接,如图1所示。当校园网的某一部分出现故障时,数据中心内部的所有数据交换不会因此而中断。对于校内几个重要的单位可以提供专线连接,保证数据传输的完整性。
数据中心内部交换网数据中心机房1数据中心机房2数据中心机房3校园网 图1 数据中心冗余网络链路示意图
3) 服务器系统建设
服务器是系统运行与数据存储的直接载体,因此服务器系统建设的好坏直接影响到整个校园数据中心的运行。校园数据中心的服务器系统必须从整体上规划,根据应用的需求合理布局,切忌一个应用系统一套服务器系统,这样很不利于资源的优化配置,既不好管理,又不能实现资源的共享,浪费有限的经费。 4) 安全规划
校园数据中心要保证各应用系统的安全运行,同时还要保证数据的安全性,因此在系统架构上要充分考虑网络安全和数据安全。网络安全根据实际情况,架设多层防火墙,保护各应用系统;在主机安全方面,要定期清理用户、修改密码、安装补丁程序、停止不必要的服务等,制定安全检查规定,保证每台服务器达到基本的安全要求,在实施过程中,可能会因为资金问题无法一步到位,可以分步进行,但基础架构应搭建好。
5) 数据备份与恢复
数据的丢失可以有很多因素,误操作、磁盘等设备出问题等,都可以导致数据丢失。因此数据备份应是数据中心提供的基本服务。从校园数据中心的角度来讲,不仅要考虑到数据的快速备份、恢复等问题,还要提供应付灾难性的后备与恢复措施。所谓灾难,是指由于地震、火灾、硬件损坏而造成的数据丢失。为了应付这些局面,最好建立数据备份中心,该中心将是异地存储的,如果发生意外,某个数据中心节点不能正常工作时,可以从数据备份中心获得数据,使整个系统仍然能够对外提供服务。
4 奋斗的历程 丰硕的成果(二)四、管理队伍建设
保证数据中心的稳定运行,需要一支强有力的队伍,建议在人员配备要考虑用不同的层次的人员,完成不同的任务。根据我们多年的经验,将校园数据中心的维护工作划分为几种角色,不同的角色承担不同的工作。具体的划分为:系统管理员、数据库管理员、网络管理员、安全管理员、备份管理员、应用管理员、机房管理员和客户技术支持。不同的角色所需要的人员的层次也不尽相同,每个角色都有明确的职责,具体分工如下:
¾ 系统管理员:负责操作系统的运行,系统管理员要熟悉操作系统,能够对系统进
行优化,同时要了解系统中应用运行情况。系统管理员要熟悉所管理的系统常用的软件的配置和优化,能够对应用系统开发的人员提供一定的帮助。
¾ 数据库管理员:负责数据库的维护运行,能够对数据库进行优化,了解数据库的
用户运行方式。同时跟踪数据库技术的动态,对数据库的选型和升级工作给出合理化的建议。
¾ 网络管理员:负责数据中心的网络运行管理,在日常维护的基础上,能够进行网
络结构的设计,熟悉所管理的网络设备。负责管理域名服务、Email服务等公共网络服务。
¾ 安全管理员:负责数据中心的网络安全和主机安全。与网络管理员一起规划安全
的网络结构,加设防火墙、IDS等安全系统,跟踪各种操作系统的最新补丁和漏洞,通知相关的管理员进行安装。定期对数据中心的安全体系措施进行检查。 ¾ 备份管理员:负责数据中心的重要数据的备份和数据恢复,制定数据备份、恢复
的规范、策略和实施的步骤。
¾ 应用管理员:负责维护应用系统的正常运行,应用系统的升级。
¾ 机房管理员:负责维护机房的环境,监控电源、空调等设备的运行并定期检查,
监视网络、服务器等设备的运行。
¾ 客户技术支持:为客户提供帮助,培训用户,解答用户的问题,同时将用户的问
题定期反馈给管理员。
数据中心的管理通过角色的划分,能够形成一支有多层次、高水平的合理队伍。对于
具体的人员来说,一个人可以承担一个角色,也可以承担多个角色,这将根据实际工作人员的能力而定。这样划分以后,可以将一些重复性强的工作分流出去,减轻系统管理员、数据库管理员等要求较高的职位的负担,保证他们能够有一定的时间对技术进行深层次的研究。对于学校这个特殊的单位,可以较好地解决系统管理的繁琐和高水平研究之间的矛
奋斗的历程 丰硕的成果(二)
5盾。
五、规章制度建设
随着服务器和应用系统的不断增多,对服务器的管理应有明确的规定,这样大家在工作的时候就可以遵循一定的工作规范,同时将一些文档工作作为一种工作要求提出来,也利于管理员之间的交流。一旦服务器出现问题,如果同样的问题以前出现过,管理员可以根据以前的记录进行处理,为快速解决问题打下了基础,也大大减少了对某个系统管理员的依赖性。 规章制度建设分为以下几个部分:
1) 管理制度。这类规定是从管理的角度提出要求,以保证数据中心的物理设施能够
正常、稳定运行,包括机房的管理条例、电源管理条例、空调管理、设备管理条例、数据的安全管理条例、奖罚规定等。在制定规章制度时应给出比较明确的操作规范,以利于大家遵照执行。
2) 岗位职责。对每个角色所担任的岗位有明确的责任分工,使每一个人能够明确自
己的职责和权利。在制定岗位职责时还要考虑到可考核性,这样在进行工作检查时易于操作。
3) 技术文档。技术文档是用来降低数据中心的正常运行对具体人员的依赖性,也就
是说当某个管理员调离工作岗位时,其他人员能够通过完整的技术文档很快能够接手他的工作,使整个数据中心不会因为某个人或者某些人的离开而影响其正常运行。
技术文档可以分为五部分:
1) 档案。这类文档应包含数据中心的基本信息,例如数据中心的网络布线、电源线
的布局、每台服务器的存放位置、IP地址分配及每台服务器的应用统计情况、每个设备的保修统计等。通过这类文档,可以了解整个数据中心的基本情况。 2) 工作规范。这类文档给出了在数据中心的基本工作规范和工作流程,使管理员在
实际工作中根据指定的各种工作流程和工作规范,进行操作,规范管理工作,尽量减少出错的机会。例如服务器验收工作流程,管理员根据该文档对新到的设备进行验收,它使得管理员能够按照工作流程一步一步地操作,所有的步骤执行完毕,设备的验收工作就结束了。又如服务器安装工作流程,包括分区的划分、主机的安全检查、补丁的安装、一些系统的设置要求等,每项工作都有专人负责,完成后签字,通过这样的步骤,可以保证服务器在最初的安装能够
6 奋斗的历程 丰硕的成果(二)达到统一的要求。工作流程是我们在实际工作中不断积累的经验基础上逐步完善的。采用这种方式后,可以最大程度地利用管理员的经验,有效地避免重复出现错误的机会。工作规范的制定在初期可能不是很全面,是一个需要不断积累经验不断完善的过程。目前我们制定的工作规范及工作流程有服务器接收工作规范、服务器安装工作流程、服务器安全检查参考、数据库安装工作规范、系统升级工作流程、数据库迁移工作流程、软件升级工作流程、网络学堂客户服务工作规范、应用系统开发工作规范等。
3) 每台设备的整套技术文档。这类文档是针对每台设备列出的详细情况,包括数据
中心的服务器、网络设备、UPS等。一套技术文档的大部分内容应该是根据工作流程或工作规范产生的,应该含有设备的购买信息、保修信息、详细配置信息、系统安装信息、应用信息、备份策略、安全设置、用户信息等。购买信息是要了解该设备的购买时用的资金来源、价格,以备日后各项目检查使用,提供商是谁,售后服务如何联系,方便以后的维修;保修信息要注明保修期限,保修范围等;详细配置说明设备的硬件配置;系统安装信息要给出系统分区情况、IP地址、安装的软件详细说明、安装的补丁程序说明、完成的系统设置、关闭的端口等有关服务器或者网络设备的详细配置信息;应用信息需要给出在该服务器上运行的应用系统,各系统运行的方式,使用的端口以及是否调用他服务器的数据等;备份策略给出这台服务器从系统到应用的详细备份方法、备份保留的周期及如何进行恢复等,以利于在数据遭到破坏时,管理员可以根据该文档快速恢复数据;安全设置需要说明该服务器或者网络设备的防火墙的设置情况,能够由哪些机器访问,开放的端口等信息;用户信息说明服务器或者数据库建立的用户信息,用户的有效期、联系方式等,用户信息需要根据用户的添加、删除不断更新。
4) 管理员使用手册。这类文档是将管理员在工作中遇到问题的通用部分总结出来,
供管理员在工作中参考。例如操作系统安装手册,包括了如何安装WIN2K,如何安装LINUX,如何安装SOLARIS等,并对不同的版本有不同的说明,这样在操作系统安装过程中,就可参照此文档进行。这类文档有利于对新人的培养,也利于保留老的管理员的经验。在这类文档中,需要很详细的说明,文档的要求是让一个不太懂相应的技术的人员可以按照此文档完成相应的工作。 5) 问题记录。管理员在工作中遇到的问题,要求有详细记录,要说明现象、问题的
解决办法,并定期汇总。对硬件设备而言,可以更好地管理;对应用程序而言,
奋斗的历程 丰硕的成果(二)
7定期汇总客户的意见并及时反馈给开发人员,有利于系统的升级和完善。 无论建立了多么完善的制度,如果没有人监督执行,就发挥不了作用。因此在规章制度的建设中,更应该强调的是加强监督机制,定期检查、明确责任,只有这样才能够使各种规章制度发挥作用。
六、结束语
随着各高校数字校园建设的不断深入,校园数据中心的作用也越来也大,对稳定、可靠运行的要求也越来越高。在实际工作中,我们总结了以下三点经验供大家参考:
1) 三分技术、七分管理。在实际工作中,我们所遇到的问题,大部分问题是由于管
理不善所引起的,尤其是在系统正式运行以后,进入系统维护阶段,更需要注意各种工作规范的执行情况,要明确责任,奖罚分明,使各管理员能够有效地发挥作用,以保证各系统的正常运行。
2) 重视文档工作。通过规章制度的建设一节,我们可以看到在实际的工作中,需要
大量的技术文档。然而,现实情况是,几乎每个管理员都不喜欢写文档。这要从领导开始重视这个工作,花大力量抓这项工作。只有完善的文档,管理的连续性才不会断档,规范化管理才可能深入。
3) 加强技术交流,共同提高。要保证有一支稳定的队伍,一定要有好的学术环境。
因此在日常管理工作中,要加强各管理员的技术交流,达到共同提高的目的。各管理员每个人都有自己的技术优势,鼓励他们保持自己的技术优势,同时通过技术交流可以使大家互相了解其他领域的相关知识,不断丰富自己。
从简陋的机房到校园数据中心,是高校信息化过程中出来的新鲜事物。它的成长还需要更多的人来关心和支持,本文只是我们的一些体会,希望能够起到抛砖引玉的作用。
参考文献
[1] 沈培华、蒋东兴、王映雪、陈怀楚,清华大学数字校园建设规划建议书,清华大学计算机与信息管理中心文件,2000.8
[2] 蒋东兴、陈怀楚、沈培华、王映雪等,清华大学计算机与信息管理中心数字校园建设十五规划,清华大学计算机与信息管理中心文件,2002.2
[3] 戚丽、冯珂、武海平、蒋东兴,网络备份方案选择与实践,《金融电子化》,2001年第3期,p32-36 [4] 关石,技术搭建服务IDC应用及业务服务系统,《计算机世界》,2001年第11期,产品与技术专题
因篇幅问题不能全部显示,请点此查看更多更全内容