发布网友
共1个回答
热心网友
赵传玉
(中国石油化工股份有限公司石油勘探开发研究院)
摘要 油气地质资料数字资源服务的常规方式包括网络目录检索、网络全文浏览与下载两种; 创新方式则包括数字地图导航服务、在线绘图与对比服务、移动化利用服务、数据挖掘与知识服务以及大数据服务5种。油气地质资料数字资源服务的创新方式,需要具备丰富的数字化资源、完善的档案管理信息系统、大容量的网络带宽以及具有大数据思维的档案工作者4个方面的保障条件。
关键词 油气地质资料 数字资源 利用服务 数字地图 数据挖掘 知识服务 大数据
0 引言
油气地质资料是对石油天然气勘探开发地质资料的简称,是指在石油天然气勘探开发生产和科研过程中形成的文字、图表、数据、声像等形式的原始地质资料,以及成果地质资料和岩心、岩屑、光薄片等实物地质资料。《地质资料管理条例》及其实施办法发布十余年来,油气地质资料的数字资源建设与服务工作经历了一个从无到有、不断壮大的过程。
目前已经比较成熟、正在被各油气田勘探开发单位广泛应用的油气地质资料数字资源服务方式,主要包括网络目录检索、网络全文浏览与下载两种方式。网络目录检索是指通过网络提供油气地质资料的案卷级与文件级目录信息的检索服务,授权用户可通过这种方式查找到馆藏中的任何一个案卷或一份文件。网络全文浏览与下载是指通过网络提供油气地质资料的全文浏览与下载服务,该项服务在目录数据库建设的基础上开展,授权用户可在线浏览地质资料的主要内容,也可下载至本机进一步利用。
1 油气地质资料数字资源服务的创新方式
随着IT技术的不断发展和资源建设程度的不断推进,油气地质资料数字资源服务方式也要不断创新。结合工作实际及国内外的相关文献,笔者总结了如下5种创新服务方式。
1.1 数字地图导航服务
数字地图导航服务,是指利用基于GIS(Geographic Information System,地理信息系统)导航,以地质资料内容对应的工作区的地理坐标为检索点,向用户提供某一特定地理区域所包含的全部油气地质资料的一种服务方式,它是网络目录检索、全文浏览与下载的一种有益补充,要在地质资料检索系统上集成GIS服务方可实现,目前比较成熟的平台有ArcGIS平台、Google公司提供的Google Earth服务等。
油气田勘探开发工作,必须充分占有目标区域的全部资料,才能有的放矢深入研究。用户使用常规的检索方法,以题名、作者、关键词等作为检索词,往往难以覆盖目标区域的全部资料。地质资料馆藏机构通过对资料内容涉及的空间数据进行著录并在检索系统中集成GIS导航服务等方式,不仅让用户可以直观的掌握目标区域的地理与地形情况,还可以通过GIS导航平台提供的点选和圈选功能,查询该区域内的全部油气地质资料。
笔者所在单位通过建立空间数据库,著录油气地质资料内容对应的工作区的地理坐标信息,并在检索系统中集成GIS平台,实现了对油气地质资料的GIS导航查询服务。用户登录后,只需框选某一特定区域,即可查询这一区域内中石化各油气田勘探开发单位形成的油气地质资料情况,极大地提高了查全率与查准率,效果反馈良好。
1.2 在线绘图与对比服务
这是一种全新的服务方式,主要是以馆藏的各类数据体为基础,通过管理信息系统与检索系统,提供对这些数据体的自定义可视化以及对比服务。
以测井数据体为例,测井是指利用岩层的电化学、导电、声学、放射性等地球物理特性,测量地球物理参数的过程。测井的方法众多,也形成了多种类型、多种格式的测井数据体,而这些测井数据体一般都不便直接阅读,必须形成测井曲线图才能方便利用。在线绘图与对比服务,就是将馆藏每一口井的全部测井数据体,上传至存储服务器,并与相应的案卷级目录信息、文件级目录信息链接,用户在浏览时,可根据自身需要,选择一口井的某一类或某几类测井数据体,或者多口井的某一类测井数据体,利用管理信息系统提供的在线绘图功能,实时绘制测井曲线图并进行对比。该服务方式可以让用户自行确定测井曲线种类、选择图件参数、图件显示方式等,大大提高了利用效率和利用效果。
目前中石化油气勘探开发源头数据采集系统中的测井数据采集系统,采集了测井数据体后,就是通过在线绘图、在线对比、在线统计等方式来展示采集结果的,效果非常好。这一系统的成功实践,为油气地质资料数字资源的在线服务提供了一种借鉴思路。
1.3 移动化利用服务
移动互联网飞速发展,各种业务在移动设备上的应用越来越成熟。笔者认为,随着手持移动设备(手机、平板电脑等)硬件配置越来越高,对复杂任务的处理能力与处理速度大幅提高;3G、4G等高速移动互联网的进一步普及,为油气地质资料利用服务的移动化提供了机遇。英国地质调查局在2010年9月发布了其第一个基于iOS系统的APP——iGeology,用户可借助该APP在英国任意地方通过移动设备检索1:50000地质图及相关数据,利用效果显著。全国地质资料馆在2013年也分别发布了基于iOS和Android系统的手机客户端,可以直接通过手机查询地质资料并发起资料订购。
对于油气田勘探开发单位而言,我们可效仿上述成功经验,开发专门的第三方应用程序(APP),通过局部推送、切片技术、鹰眼技术等手段,解决大容量电子文件在移动互联网上的推送和在手持移动设备上的显示等问题,经授权和认证后,可根据勘探开发科研生产一线工作者的需要,将其急需的油气地质资料数字资源,推送到他们的手持移动设备上,提高服务与支撑效率。
1.4 数据挖掘与知识服务
数据挖掘一般是指从大量数据中自动搜索隐藏于其中的有着特殊关系性信息的过程。油气地质资料管理信息系统中,既保管有丰富的电子资源,又拥有庞大用户群的利用记录,这两者对计算机而言都是大量的数据,为提供数据挖掘与知识服务奠定了基础。
数据挖掘与知识服务包含了两个方面的含义,一方面是指对馆藏油气地质资料中的有用数据进行挖掘。对地质现象的认识,是随着相关资料档案的丰富、技术的更新、方法的优化而不断精确的。馆藏油气地质资料是在多年的勘探开发工作中不断形成的,其包含了广大勘探开发工作者对地质现象认识的不断总结和提炼。可以通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法,对地质资料中有关某一特定区域、某一特定地质现象的数据进行深入挖掘、分析,将其中的*知识挖掘出来转换成显性知识并提供服务。另一方面是指对用户利用数据的挖掘。用户在管理信息系统中,检索档案目录、浏览下载档案电子文件时,都会形成大量的有关利用的数据,包括利用时间、利用热点、利用兴趣方向等,对这些数据进行挖掘,可针对不同用户的兴趣点,提供个性化、有针对性的服务。对用户利用数据的挖掘,分为3个层次,一是对全体用户利用数据的挖掘,分析全体用户最感兴趣的利用服务内容、方式、方法等,以促进利用服务工作的改进和优化。二是对特定群体用户(如某一单位、某一研究室)特定时间段利用数据的挖掘,分析他们的阶段性利用兴趣,可为有针对性提供主动上门服务提供方向。三是对个体用户利用数据的挖掘,可分析该用户的研究方向、倾向的服务方式等,从而为该用户提供更好地数据资源利用服务。
笔者所在的单位已对用户利用数据进行了第一、三两个层次的挖掘,我们通过管理信息系统统计用户的搜索关键词、浏览与下载兴趣等,分析阶段时间内全体用户以及个体用户利用兴趣的Top 10,在用户检索界面进行动态显示与实时更新,总体效果不错。目前我们正在尝试对用户利用数据进行第二层次的挖掘,以便更好地提供利用服务。
1.5 大数据服务
大数据时代已经来临,借助飞速发展的信息技术和硬件技术,我们日常生活的衣食住行都在不断形成大数据,这已是社会共识。在目前的油气田勘探开发各项活动中,形成的数据量非常大,也属于大数据的范畴;各级地质资料馆(室)馆藏的油气地质资料及其数字资源,其数据量更加庞大。面对如此庞大的数字资源,单纯提供个体数字资源的服务将逐渐不符合油气田勘探开发工作的实际,我们要具备大数据的思维,将馆藏全部数据资源视为一个整体,提供整体服务,通过寻找各项地质工作与油气田勘探发现、油气田开发产能建设之间的相关关系来提供服务。
据笔者目前掌握资料来看,大数据服务尚未在油气地质资料部门开展,但Google、Visa等掌握了大量数据的公司进行大数据服务的案例屡见报端。中石油、中石化、中海油等公司都掌握了大量的油气地质资料数字资源,提供大数据服务来促进油气勘探发现与油气田开发产能建设,势必不会太遥远。
2 油气地质资料数字资源服务的保障条件
油气地质资料相较其他参考资料,具有原始性与系统性两大优势。原始性是因为其是油气田勘探开发工作的原始记录,系统性则是因为其系统记录了各项油气田勘探开发活动的过程和结果。基于这些优势,必须重点开展油气地质资料的数字资源服务,创新服务方式。结合工作实际,笔者认为创新服务方式,要具备如下几方面的保障条件。
2.1 基础条件——丰富的数字化资源
丰富的数字化资源是开展数字资源服务的基础条件。丰富的数字化资源包括两个方面,一是数字化的纸质地质资料,主要是指利用扫描技术、OCR技术、存储技术等技术手段,形成馆藏纸质地质资料的数字化版本;二是各种数据体,主要是指在物化探、钻井、测井、录井等油气田勘探开发工作中,利用各种仪器采集和(或)形成的大量的数据体,及其解译数据。这些数据体是对地质现象的原始记录,是数字资源服务的主体,对其利用需求远大于对数字化的纸质地质资料的利用需求。而这些数据体往往是各项工作的中间性成果,对其归档的控制力度稍弱,需要各级档案部门采取切实可行的归档监管措施,确保这些数据体及其解译成果能及时、全面地归档,以筑牢油气地质资料数字资源服务的基础。
2.2 技术条件——完善的地质资料管理信息系统
开展数字资源服务,完善的地质资料管理信息系统是技术保障。无论是数字化的纸质地质资料,还是各种数据体,都是以代码形式存储在光盘、磁盘等光磁载体上,必须借助完善的地质资料管理信息系统,方能有效地开展利用服务。完善的地质资料管理信息系统应该具备两方面的基本功能,一是能作为油气地质资料日常管理的工具,可提供从归档、整理到编目、著录检索、统计等各个基本环节的信息化管理,提高日常管理工作水平;二是能作为用户利用服务的终端,用户无论是进行目录、全文检索,还是全文浏览与下载,都可借助于该管理信息系统实时并动态显示。
2.3 环境条件——大容量的网络带宽
从笔者所在单位的情况来看,通过网络提供地质资料利用服务近年来发展迅猛,在部分单位的地质资料部门已成为提供利用服务工作的主要方式。油气田勘探开发工作中形成的地质资料,大部分是技术报告以及各种技术图件,其电子文件体积一般都比较大,动辄在几百兆字节(MB)甚至吉字节(GB),要将这些大体积的电子文件通过网络提供利用,大容量的网络带宽必不可少。
2.4 智力条件——具有大数据思维的地质资料工作者
任何一项工作的正常开展,都必须有一定数量的专业技术人才为依托。笔者认为,要充分开展油气地质资料数字资源的利用服务工作,具有大数据思维的地质资料工作者是必不可少的智力条件。一方面,他们可从资料档案专业的角度,按资料档案工作的规律与特点开展油气地质资料数字资源的利用服务工作;另一方面,他们还可从数据的角度,开展对油气地质资料数字资源中丰富数据的挖掘、提炼与整合,结合油气田勘探开发业务工作,提供有针对性的内容服务;第三方面,他们还可从大数据的角度,将油气地质资料数字资源作为一种大数据来整体考虑,通过IT部门的配合,来发掘各类数字资源与油气田勘探开发工作的相关关系,从而提供其他利用服务方式所无法提供的数据与知识服务。
参考文献
[1]葛红.数字时代档案信息资源的开发利用[J].科技与企业,2010(6):84~85.
[2]涂子沛.大数据[M].南宁:广西师范大学出版社,2012.
[3]Q/SH 0167-2008 石油天然气勘探与开发油气地质资料立卷归档规则[S].2008-02-25.
[4]British Geologecal Survey.British Geological Survey Annual Report 2010-11[EB/OL].2011[2013-02-25].http://www.bgs.ac.uk/downloads/start.cfm?id=2252.