您的当前位置:首页数据挖掘技术在商业银行中的应用

数据挖掘技术在商业银行中的应用

来源:小侦探旅游网
2011年5月第14卷第9期

ChinaManagementInformationization

中国管理信息化

May,2011Vol.14,No.9

数据挖掘技术在商业银行中的应用

(北京银行博士后科研工作站,北京100081)

[摘要]数据挖掘能够有效分析商业银行数据库中的信息,将其转化为知识为银行的经验决策服务。本文在介绍

数据挖掘技术及其主要任务的基础上,总结了数据挖掘在商业银行业务中的主要应用领域为客户关系管理、风险管理和金融欺诈监测,并具体介绍了数据挖掘技术在上述几个领域内的应用。

[关键词]数据挖掘;客户关系管理;风险管理;欺诈监测doi:10.3969/j.issn.1673-0194.2011.09.015[中图分类号]TP391;F832.33[文献标识码]A

[文章编号]1673-0194(2011)09-0059-04

1前言术来进行数据库中知识的挖掘。例如,美国汇丰银行用数据挖掘工具KXEN来挖掘不断增长的客户数据,用

来发现交叉销售和“翻滚”销售。美国花旗银行和瑞士银行也是较早采用数据挖掘技术的银行。以美国第一银行为代表的信贷银行深入地将数据挖掘技术运用到信用卡用户分析中。然而,数据挖掘技术在银行业真正得到重视是在客户关系管理系统兴起之后,众多的欧美银行纷纷采用数据挖掘技术来为自己的经营决策服务,其中包括美洲银行、美国商务银行、皇家苏格兰银行、法国兴业银行、德意志银行、荷兰银行、澳大利亚国

商业银行在经营的过程中积累了大量的数据,在信息时代,能否快速准确地从这些数据中发掘规律,获取知识;能否有效地利用这些规律和知识为银行的经营、决策服务,对银行提升竞争力及长远发展来说,是至关重要的。

发达国家和地区的商业银行早已利用数据挖掘技

[收稿日期]2011-01-05

陈敏(1976-),女,黑龙江伊春人,北京银行博士后[作者简介]

科研工作站博士,主要研究方向:数据挖掘技术在商业银行中的应用。

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!档Bayes鉴别器[J].计算机学报,2004,27(4):566-572.

[17]奚伟鹏,李昕,蒋凯,武港山.面向网上论坛的信息抽取技术[J].计算

机工程,2005,31(4):66-68.

[18]吴昊,耿焕同.基于潜在语义分析的BBS主题发现算法研究[J].电脑

知识与技术,2008,4(2):431-433.

[19]蒋凡,高俊波,张敏,王煦法.BBS中主题发现原型系统的设计与实现

[J].计算机工程与应用,2005,41(31):151-153.

[20]鲁明羽,姚晓娜,魏善岭.基于模糊聚类的网络论坛热点话题挖掘[J].

大连海事大学学报,2008,34(4):52-58.

[21]GiladMishne,NatalieGlance.LeaveaReply:AnAnalysisofWeblog

Comments[C]//TheThirdAnnualWorkshopontheWebloggingEcosystem,Edinburgh,Scotland,May2006.

[22]时明达,林鸿飞.基于内容相关度和语义分析的Blog热点话题发现

[C]//内容计算的研究与应用前沿———第九届全国计算语言学学术会议论文集,2007:570-575.

ResearchonDevelopmentofTopicDetectionand

Tracking

CHENXue-chang,HANJia-zhen,WEIGui-ying

(SchoolofEconomicsandManagement,UniversityofScienceandTechnologyBeijing,Beijing100083,China)

Abstract:TheresearchobjectofTDT(TopicDetectionandTracking)ismassivenewsflow,monitoringthetopicofnews,findsoutnewusersattractinginformation,andsomehowshowtheorganizedreportsaboutacertaintopic.Atfirst,thepaperintroducesTDTanditsprimarytasks,relatedconceptsandevaluationmethods.Then,recentresearchsituationaboutTopicDetectionisfocused.Finally,thepaperanalyzesthedevelopmenttendencyandfu-turedirectionofTopicDetection.

Keywords:Topic;TopicDetection;TopicTracking

CHINAMANAGEMENTINFORMATIONIZATION

/59

系统建设

民银行等。简言之,在数据仓库规模迅速膨胀,数据库技术日益成熟的今天,发达国家和地区的银行都把数据挖掘技术作为一个重要的战略决策手段。

上述欧美银行不仅有完善高效的数据收集系统,最重要的是将数据仓库中的数据切切实实地变成了有用的知识,并在经验过程中,实现了知识到财富的转换过程。

相比于国外的银行,数据挖掘在我国商业银行中的应用则显得相对苍白无力,对大部分银行来说,还处在数据收集、整理、规范的阶段。对大量数据的进一步处理和应用,还处在一个相当原始的阶段。数据挖掘这项强大的数据处理技术,仍停留在概念的层面。很多银行不知道数据挖掘在哪些银行业务中可以得到应用,更不了解数据挖掘针对银行业务的强大功能,因此在这方面的研究投入也不够。在此背景下,本文在概述数据挖掘技术的前提下,探讨数据挖掘可能在商业银行中的几种应用。

的组。每个组都叫做类(Cluster),每一类中的对象尽量相似,而不同类间的对象尽量不同。

2.4孤立点分析

数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致。这些数据对象是孤立点(Outlier)。统计方法常将孤立点视为噪声或异常而丢弃,或试图使孤立点的影响最小化。但在一些应用中孤立点本身可能是非常重要的信息,例如在欺诈探测中,孤立点可能代表了欺诈行为。

2.5演变分析

数据演变分析(EvolutionAnalysis)描述行为随时间而变化的对象的发展规律或趋势,并对其建模。例如可以从股票交易数据中挖掘出整个股票市场和特定公司的股票演变规律,帮助预测股票市场的未来走向,帮助做出股票投资的决策。

3数据挖掘技术在商业银行中的应用

数据挖掘在商业银行的应用可以分为客户关系管

2数据挖掘技术简介

数据挖掘是指“在数据中发现有效的、新颖的、潜

理、风险控制和金融欺诈识别3个方面。人们经常提到的市场营销,可以归在客户关系管理的范围内,客户关系管理的其中一个作用就是通过分析客户特征,从而提供更合适的产品与服务,而这就是营销的本质。下面对数据挖掘在以上3个方面的应用进行介绍。

在有用的、可理解的模式的非平凡过程”[1]。数据挖掘这个研究领域是数据库、模式识别、机器学习、统计学、人工智能、并行与分布式计算、数学和可视化技术等多学科交叉的产物,是一个新兴的但具有广泛应用前景的研究领域。数据挖掘的主要任务可以进一步分为如下几类。

3.1客户关系管理

数据挖掘在客户关系管理中的应用相对成熟,早在10年前,国外的相关学者就提出,数据挖掘技术能够使CRM系统向顾客提供更有针对性,更高质量的服务[2]。数据挖掘能够发现数据库当中数据之间深层次的关联;能够将本质相似的数据归为同样的类;能够发掘数据库中的异常数据,这都是传统的计量方法所不具备的能力。因此当银行建立了CRM系统之后,需要做的就是采用数据挖掘这样强大的工具来将数据库中的客户信息变成财富。

总体来说,利用数据挖掘来进行客户关系管理要实现3个目标:首先是留住现有客户。维持一个老客户所需的成本是寻求一个新客户成本的0.5倍。通过分析现有客户的特征,挖掘客户的爱好和兴趣,从而以最快的速度响应客户的需求,有针对性地提供金融产品及服务,可以提高客户的忠诚度,从而留住现有客户。其次是实现现有客户价值最大化,客户的生命周期决定了在各个不同的阶段,客户对金融产品及服务的需求是不同的,因此要合理地满足同一个客户在不同生命阶段的需求,在令客户满意的同时,最大限度地实现客户价值。最后是通过提供更有竞争力的产品与服务,通过更有效的营销手段来吸引其他银行的客户。

2.1关联规则挖掘

关联规则挖掘是从大量数据中发现项集之间有趣的关联或相关联系,是形如A圯B的蕴涵式,支持度s%是指事务数据库D中至少有s%的事务包含A∪B;可信度c%是指在事务数据库D中包含A的事务至少有

c%同时也包含B。关联规则可以帮助许多商务决策的

制定。

2.2分类与预测

分类需要构造分类函数或分类模型,通过分类函数,把数据库中的数据项映射到某个类上。分类模型可以用多种形式表示,如分类(IF-THEN)规则、分类树、数学公式或神经网络等。分类和预测可以用于提取描述重要数据类的模型或预测数据未来的趋势,例如可以通过建立分类模型,对银行的贷款客户进行分类,以降低贷款的风险等。

2.3聚类分析

聚类技术用于发现数据库中未知的类,与分类不同之处在于,在聚类前对类的数量与类型均是未知的,是按照“物以类聚”的原则,将满足相似性条件的对象划分在一组内,不满足相似性条件的对象划分在不同

60/

CHINAMANAGEMENTINFORMATIONIZATION

系统建设

要满足上述三个目标,就需要深入了解客户特征,而市场细分的过程就是发现客户特征的过程。银行业正在实现从大众营销到一对一营销的转变,劳埃德

金融市场的动荡。数据挖掘弥补了统计方法的不足,目前已广泛地应用于金融时间序列分析。时间序列模式挖掘研究目前主要集中在时间序列中相似序列搜索、频繁模式发现、关联模式发现、周期模式发现以及异常数据挖掘等方面,采用的方法主要有神经网络、遗传算法、模糊理论、粗糙集、支持向量机等。

信用风险评估实质上是一个分类和预测的问题,按照不同情况把客户分成若干组,并且预测客户分到相应类别组的概率。而分类和预测正是数据挖掘的主要任务之一。目前得到较广泛应用的分类技术有神经网络与决策树。在数据挖掘技术中,神经网络模型最早被应用在个人信用评估上。Odom和Sharda(1990)[3]采用人工神经网络技术,对Altman(1968)研究中的5个财务比率,选取1975-1982年间的65家正常公司和65家财务危机公司作为样本,选取企业财务危机前一年的财务资料,建立了神经网络预警模型,再与基于统计的分类方法做比较,结果证明其预测的准确率要高于基于统计的方法,从而实现贷款风险监测中的建模和预报功能。通过数据挖掘当中的分类技术,商业银行可以将贷款对象根据风险的高低进行分类,对于新的贷款申请者,可以将其归类进而预测其风险的大小。3.3金融欺诈监测

目前在这方面的研究主要集中在信用卡欺诈研究和反洗钱研究这两个问题上。

在信用卡欺诈研究方面,目前主要采用的数据挖掘技术是分类,如我们一再提到的神经网络、决策树及各种分类组合方法,同时关联规则在信用卡欺诈研究方面也有一定的应用,ChiuandTsai(2004)[4]就采用改进的Apriori算法研究了欺诈数据的典型形式。国际上,花旗银行、美国第一银行等欧美银行早已将数据挖掘作为信用卡欺诈研究的重要工具。然而,我国的信用卡业务起步较晚,对其特殊性和潜在风险缺乏足够的认识,无论是学术研究水平还是商业银行的反欺诈水平,都与国际上先进的银行有着不小的差距,数据挖掘技术几乎没有得到有效的应用。

在反洗钱方面,数据挖掘技术也有着不俗的表现,主要应用的技术有孤立点分析、序列模式挖掘、分类研究、聚类分析等。这方面的杰出代表有美国金融犯罪执法网络(FinCEN)的FAIS系统,其采用数据挖掘技术来实现对可疑交易报告进行分析和评估;另外还有澳大利亚交易分析与报告中心(AustralianTransactionReportsandAnalysisCenter),该中心采用数据挖掘技术开发了ScreenIT系统,用来实现可疑交易报告自动筛选;另外欧盟、加拿大也早已将数据挖掘技术应用到可疑金融交易识别中。与上述发达国家和地区相比,虽然我国央行于2004年成立了反洗钱监测中心,国家外

CHINAMANAGEMENTINFORMATIONIZATION

TSB集团(LloydsTSB)的Accucard和蒙特利尔银行的Mosaik产品已经分别通过允许客户创立自己的账户、选择年收益率(APR)、费用、卡型及奖励回馈来探索一

对一的营销理念。数据挖掘的分类、聚类等技术能够将数据库进行细分,这两项技术的差别在于一个是有监督的学习,一个是无监督的学习。均能在客户细分的研究方面起到很好的作用,从而发现不同的客户对产品的不同需求。

除了分类、聚类,关联规则也是重要的CRM系统分析技术,通过关联规则,银行可以发现产品之间的销售关联,这有助于实现产品的交叉销售。交叉销售作为一种重要的营销手段,不但能更好地进行产品营销,更重要的作用是保留能够带来利润的客户。

目前在国内,一些先进的商业银行开始使用一些通用的数据挖掘软件。学术界的研究也处于探索阶段,从已有的研究文献来看,大部分属于描述性和介绍性文章,虽然近年来有了数据挖掘在商业银行应用的一些具体实施方面的介绍,却几乎都集中在软件的使用上。这类软件所采用的算法往往是一些基础的数据挖掘算法,挖掘的准确率和速度均有待提高,例如,著名的数据挖掘软件SPSS17所采用的聚类算法仅有二步聚类及K-means算法,了解数据挖掘聚类算法的学者都知道,很多聚类算法的聚类效果要远远地优于这两种算法,例如基于密度的算法DBSCAN等。除了算法的不足,学术研究的内容也大部分局限于分类及聚类,没有更广泛的研究;另外对于数据挖掘结果也没有深入说明与阐述。

3.2风险管理

商业银行所面临的风险主要有市场风险、信用风险和操作风险,风险控制对于商业银行的可持续发展来说是至关重要的。随着信息时代的发展,风险管理的手段也在逐步发展,总体趋势是由定性分析向定量分析转变,由主观分析向客观分析转变。数据挖掘由于具有不需要依靠假设条件、能够处理大规模数据等优点,目前已经在市场风险与信用风险的防范中开始崭露头角,用于建立全面的风险管理预警体系,发现经营中存在的问题,增强风险识别和防范能力。

市场风险指因股市价格、利率、汇率、商品价格等风险因子的变动而导致银行表内和表外业务发生损失的风险。其中无论哪一个风险因子的变化都会产生海量的金融时间序列数据。传统的统计分析方法需要严苛的假设条件,并且只能着眼于全局,不能准确地描述

/61

2011年5月第14卷第9期

ChinaManagementInformationization

中国管理信息化

May,2011Vol.14,No.9

烟草商业企业数字仓库的基本流程

与系统功能设计研究

杜秀亭

(内蒙古自治区烟草公司,呼和浩特010010)

[摘要]数字仓库的应用将协助企业保证供应、压缩库存、提高货物周转效率、节约成本。本文介绍了数字仓库的

概念,研究了烟草商业企业数字仓库的基本流程与系统功能结构与设计,并对数字仓库的效益进行了评价。对这些问题的深入研究将有利于提高烟草商业企业的物流水平和服务效率。

[关键词]数字仓库;流程;库存

doi:10.3969/j.issn.1673-0194.2011.09.016[中图分类号]TP315;F270[文献标识码]A

[文章编号]1673-0194(2011)09-0062-04

烟草商业企业通过近几年的网建工作和与之配套的信息化建设,规范了卷烟经营行为,开拓了市场资源,同时也为建立基于现代物流技术的经营模式奠定了基础。目前各地实行的访销配送模式,极大地提高了

[收稿日期]2011-01-05

对卷烟经营业户的服务质量,拓展了卷烟市场,对烟草企业的发展有着深远的影响。

随着烟草流通领域的市场竞争日趋激烈,烟草企业居安思危,在健全的营销网络和全面信息化的基础上,通过现代化的仓库管理,建立完善的仓储和配送体

主要参考文献

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!汇管理局于2005年开发并推广了反洗钱信息辅助核查平台,然而我国的反洗钱系统建设不够完善。由于金融欺诈犯罪手段日新月异,识别可疑金融交易信息的技术也必须不断改进以适应其变化,数据挖掘等先进技术的应用更需要进一步深入。

[1]FayyadU,Piatetsky-ShapiroG,SmythP.FromDataMiningto

KnowledgeDiscoveryinDatabases[J].AIMagazine,1996,17(3):37-54.

[2]LSTillett.BanksMineCustomerData[J].InternetWeek,2000(831):

4结论

45-46.

[3]MDOdom,RSharda.ANeuralNetworksforBankruptcyPrediction[C]

本文针对国内商业银行对数据挖掘技术不够了解这一情况,首先介绍了数据挖掘技术及其主要任务,并在此基础上介绍了数据挖掘技术在商业银行中应用的主要业务领域,指出了我国大部分商业银行对数据挖掘技术的认识仍停留在粗浅的概念上,无论是商业银行或学术界都需要加强这方面的研究与实践。

//TheproceedingsofInternationalJointConferenceonNeuralNetworks,1990:163-168.

[4]ChiuC&TsaiC.AWebServices-BasedCollaborativeSchemefor

CreditCardFraudDetection[C]//TheProceedingsofIEEEInternationalConferenceone-Technology,e-Commerceande-Service,2004.

ApplicationofDataMiningTechnologyinBusinessof

CommercialBanks

CHENMin

(PostDoctoralProgrammeofBankofBeijing,Beijing100081,China)

Abstract:DatamininganalysesthemassivedataintheCRMsystemofcommercialbankseffectively,byturningtheinformationintoknowledge,dataminingbenefitsthebankswithmakingbetterbusinessdecision.Basedontheintroductionofdataminingtechnologyandthemainminingtargets,thispapersummarizesthattheCRM,riskmanagementandfrauddetection,andthenintroducestheapplicationofdatamininginthoseresearchfields.Keywords:DataMining;CRM;RiskManagement;FraudDetection

62/

CHINAMANAGEMENTINFORMATIONIZATION

因篇幅问题不能全部显示,请点此查看更多更全内容