数据挖掘技术在商业银行中的应用
[摘 要] 数据挖掘能够有效分析商业银行数据库中的信息,将其转化为知识为银行的经验决策服务。本文在介绍数据挖掘技术及其主要任务的基础上,总结了数据挖掘在商业银行业务中的主要应用领域为客户关系管理、风险管理和金融欺诈监测,并具体介绍了数据挖掘技术在上述几个领域内的应用。
[关键词] 数据挖掘; 客户关系管理; 风险管理; 欺诈监测
1前言
商业银行在经营的过程中积累了大量的数据,在信息时代,能否快速准确地从这些数据中发掘规律,获取知识;能否有效地利用这些规律和知识为银行的经营、决策服务,对银行提升竞争力及长远发展来说,是至关重要的。
发达国家和地区的商业银行早已利用数据挖掘技术来进行数据库中知识的挖掘。例如,美国汇丰银行用数据挖掘工具 KXEN来挖掘不断增长的客户数据,用来发现交叉销售和“翻滚”销售。美国花旗银行和瑞士银行也是较早采用数据挖掘技术的银行。以美国第一银行为代表的信贷银行深入地将数据挖掘技术运用到信用卡用户分析中。然而,数据挖掘技术在银行业真正得到重视是在客户关系管理系统兴起之后,众多的欧美银行纷纷采用数据挖掘技术来为自己的经营决策服务,其中包括美洲银行、美国商务银行、皇家苏格兰银行、法国兴业银行、德意志银行、荷兰银行、澳大利亚国民银行等。简言之,在数据仓库规模迅速膨胀,数据库技术日益成熟的今天,发达国家和地区的银行都把数据挖掘技术作为一个重要的战略决策手段。
上述欧美银行不仅有完善高效的数据收集系统,最重要的是将数据仓库中的数据切切实实地变成了有用的知识,并在经验过程中,实现了知识到财富的转换过程。
相比于国外的银行,数据挖掘在我国商业银行中的应用则显得相对苍白无力,对大部分银行来说,还处在数据收集、整理、规范的阶段。对大量数据的进一步处理和应用,还处在一个相当原始的阶段。数据挖掘这项强大的数据处理技术,仍停留在概念的层面。很多银行不知道数据挖掘在哪些银行业务中可以得到应用,更不了解数据挖掘针对银行业务的强大功能,因此在这方面的研究投入也不够。在此背景下,本文在概述数据挖掘技术的前提下,探讨数据挖掘可能在商业银行中的几种应用。
2数据挖掘技术简介
数据挖掘是指“在数据中发现有效的、新颖的、潜在有用的、可理解的模式的非平凡过程”[1]。数据挖掘这个研究领域是数据库、模式识别、机器学习、统计学、人工智能、并行与分布式计算、数学和可视化技术等多学科交叉的产物,是一个新兴的但具有广泛应用前景的研究领域。数据挖掘的主要任务可以进一步分为如下几类。
2.1关联规则挖掘
关联规则挖掘是从大量数据中发现项集之间有趣的关联或相关联系,是形如A?圯B的蕴涵式,支持度s%是指事务数据库D中至少有s%的事务包含A∪B;可信度c%是指在事务数据库D中包含A的事务至少有c%同时也包含B。关联规则可以帮助许多商务决策的制定。
2.2分类与预测
分类需要构造分类函数或分类模型,通过分类函数,把数据库中的数据项映射到某个类上。分类模型可以用多种形式表示,如分类(IF-THEN)规则、分类树、数学公式或神经网络等。分类和预测可以用于提取描述重要数据类的模型或预测数据未来的趋势,例如可以通过建立分类模型,对银行的贷款客户进行分类,以降低贷款的风险等。
2.3聚类分析
聚类技术用于发现数据库中未知的类,与分类不同之处在于,在聚类前对类的数量与类型均是未知的,是按照“物以类聚”的原则,将满足相似性条件的对象划分在一组内,不满足相似性条件的对象划分在不同的组。每个组都叫做类(Cluster),每一类中的对象尽量相似,而不同类间的对象尽量不同。
2.4孤立点分析
数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致。这些数据对象是孤立点 (Outlier)。统计方法常将孤立点视为噪声或异常而丢弃,或试图使孤立点的影响最小化。但在一些应用中孤立点本身可能是非常重要的信息,例如在欺诈探测中,孤立点可能代表了欺诈行为。
2.5演变分析
数据演变分析(Evolution Analysis)描述行为随时间而变化的对象的发展规律或趋势,并对其建模。例如可以从股票交易数据中挖掘出整个股票市场和特定公司的股票演变规律,帮助预测股票市场的未来走向,帮助做出股票投资的决策。
3数据挖掘技术在商业银行中的应用
数据挖掘在商业银行的应用可以分为客户关系管理、风险控制和金融欺诈识别3个方面。人们经常提到的市场营销,可以归在客户关系管理的范围内,客户关系管理的其中一个作用就是通过分析客户特征,从而提供更合适的产品与服务,而这就是营销的本质。下面对数据挖掘在以上3个方面的应用进行介绍。
3.1客户关系管理
数据挖掘在客户关系管理中的应用相对成熟,早在10年前,国外的相关学者就提出,数据挖掘技术能够使CRM系统向顾客提供更有针对性,更高质量的服务[2]。数据挖掘能够发现数据库当中数据之间深层次的关联;能够将本质相似的数据归为同样的类;能够发掘数据库中的异常数据,这都是传统的计量方法所不具备的能力。因此当银行建立了CRM系统之后,需要做的就是采用数据挖掘这样强大的工具来将数据库中的客户信息变成财富。
总体来说,利用数据挖掘来进行客户关系管理要实现3个目标:首先是留住现有客户。维持一个老客户所需的成本是寻求一个新客户成本的0.5倍。通过分析现有客户的特征,挖掘客户的爱好和兴趣,从而以最快的速度响应客户的需求,有针对性地提供金融产品及服务,可以提高客户的忠诚度,从而留住现有客户。其次是实现现有客户价值最大化,客户的生命周期决定了在各个不同的阶段,客户对金融产品及服务的需求是不同的,因此要合理地满足同一个客户在不同生命阶段的需求,在令客户满意的同时,最大限度地实现客户价值。最后是通过提供更有竞争力的产品与服务,通过更有效的营销手段来吸引其他银行的客户。
要满足上述三个目标,就需要深入了解客户特征,而市场细分的过程就是发现客户特征的过程。银行业正在实现从大众营销到一对一营销的转变,劳埃德TSB集团(Lloyds TSB)的Accucard和蒙特利尔银行的 Mosaik产品已经分别通过允许客户创立自己的账户、选择年收益率(APR)、费用、卡型及奖励回馈来探索一对一的营销理念。数据挖掘的分类、聚类等技术能够将数据库进行细分,这两项技术的差别在于一个是有监督的学习,一个是无监督的学习。均能在客户细分的研究方面起到很好的作用,从而发现不同的客户对产品的不同需求。
除了分类、聚类,关联规则也是重要的CRM系统分析技术,通过关联规则,银行可以发现产品之间的销售关联,这有助于实现产品的交叉销售。交叉销售作为一种重要的营销手段,不但能更好地进行产品营销,更重要的作用是保留能够带来利润的客户。
目前在国内,一些先进的商业银行开始使用一些通用的数据挖掘软件。学术界的研究也处于探索阶段,从已有的研究文献来看,大部分属于描述性和介绍性文章,虽然近年来有了数据挖掘在商业银行应用的一些具体实施方面的介绍,却几乎都集中在软件的使用上。这类软件所采用的算法往往是一些基础的数据挖掘算法,挖掘的准确率和速度均有待提高,例如,著名的数据挖掘软件SPSS 17所采用的聚类算法仅有二步聚类及K-means算法,了解数据挖掘聚类算法的学者都知道,很多聚类算法的聚类效果要远远地优于这两种算法,例如基于密度的算法DBSCAN等。除了算法的不足,学术研究的内容也大部分局限于分类及聚类,没有更广泛的研究;另外对于数据挖掘结果也没有深入说明与阐述。
3.2风险管理
商业银行所面临的风险主要有市场风险、信用风险和操作风险,风险控制对于商业银
行的可持续发展来说是至关重要的。随着信息时代的发展,风险管理的手段也在逐步发展,总体趋势是由定性分析向定量分析转变,由主观分析向客观分析转变。数据挖掘由于具有不需要依靠假设条件、能够处理大规模数据等优点,目前已经在市场风险与信用风险的防范中开始崭露头角,用于建立全面的风险管理预警体系,发现经营中存在的问题,增强风险识别和防范能力。
市场风险指因股市价格、利率、汇率、商品价格等风险因子的变动而导致银行表内和表外业务发生损失的风险。其中无论哪一个风险因子的变化都会产生海量的金融时间序列数据。传统的统计分析方法需要严苛的假设条件,并且只能着眼于全局,不能准确地描述金融市场的动荡。数据挖掘弥补了统计方法的不足,目前已广泛地应用于金融时间序列分析。时间序列模式挖掘研究目前主要集中在时间序列中相似序列搜索、频繁模式发现、关联模式发现、周期模式发现以及异常数据挖掘等方面,采用的方法主要有神经网络、遗传算法、模糊理论、粗糙集、支持向量机等。
信用风险评估实质上是一个分类和预测的问题,按照不同情况把客户分成若干组,并且预测客户分到相应类别组的概率。而分类和预测正是数据挖掘的主要任务之一。目前得到较广泛应用的分类技术有神经网络与决策树。在数据挖掘技术中,神经网络模型最早被应用在个人信用评估上。Odom和Sharda (1990)[3]采用人工神经网络技术,对Altman(1968)研究中的5个财务比率,选取1975-1982年间的65家正常公司和65家财务危机公司作为样本,选取企业财务危机前一年的财务资料,建立了神经网络预警模型,再与基于统计的分类方法做比较,结果证明其预测的准确率要高于基于统计的方法,从而实现贷款风险监测中的建模和预报功能。通过数据挖掘当中的分类技术,商业银行可以将贷款对象根据风险的高低进行分类,对于新的贷款申请者,可以将其归类进而预测其风险的大小。
3.3金融欺诈监测
目前在这方面的研究主要集中在信用卡欺诈研究和反洗钱研究这两个问题上。
在信用卡欺诈研究方面,目前主要采用的数据挖掘技术是分类,如我们一再提到的神经网络、决策树及各种分类组合方法,同时关联规则在信用卡欺诈研究方面也有一定的应用,Chiu and Tsai(2004)[4]就采用改进的Apriori算法研究了欺诈数据的典型形式。国际上,花旗银行、美国第一银行等欧美银行早已将数据挖掘作为信用卡欺诈研究的重要工具。然而,我国的信用卡业务起步较晚,对其特殊性和潜在风险缺乏足够的认识,无论是学术研究水平还是商业银行的反欺诈水平,都与国际上先进的银行有着不小的差距,数据挖掘技术几乎没有得到有效的应用。
在反洗钱方面,数据挖掘技术也有着不俗的表现,主要应用的技术有孤立点分析、序列模式挖掘、分类研究、聚类分析等。这方面的杰出代表有美国金融犯罪执法网络(FinCEN)的FAIS系统,其采用数据挖掘技术来实现对可疑交易报告进行分析和评估;另外还有澳大利亚交易分析与报告中心(Australian Transaction Reports and Analysis Center),该中心采用数据挖掘技术开发了ScreenIT系统,用来实现可疑交易报告自动筛选;另外欧盟、加拿大也早已将数据挖掘技术应用到可疑金融交易识别中。与上述发达国家和地区相比,虽然我国央行于2004年成立了反洗钱监测中心,国家外汇管理局于2005年开发并推广了反洗钱信息辅助核查平台,然而我国的反洗钱系统建设不够完善。由于金融欺诈犯罪手段日新月异,识别可疑金融交易信息的技术也必须不断改进以适应其变化,数据挖掘等先进技术的应用更需要进一步深入。
4结论
本文针对国内商业银行对数据挖掘技术不够了解这一情况,首先介绍了数据挖掘技术及其主要任务,并在此基础上介绍了数据挖掘技术在商业银行中应用的主要业务领域,指出了我国大部分商业银行对数据挖掘技术的认识仍停留在粗浅的概念上,无论是商业银行或学术界都需要加强这方面的研究与实践。
主要参考文献
[1] Fayyad U, Piatetsky-Shapiro G, Smyth P. From Data Mining to Knowledge Discovery in Databases[J]. AI Magazine,1996,17(3):37-54.
[2] L S Tillett. Banks Mine Customer Data[J]. Internet Week, 2000(831):45-46.
[3] M D Odom,R Sharda. A Neural Networks for Bankruptcy Prediction[C] // The proceedings of International Joint Conference on Neural Networks,1990:163-168.
[4] Chiu C & Tsai C. A Web Services-Based Collaborative Scheme for Credit Card Fraud Detection[C] // The Proceedings of IEEE International Conference on e-Technology, e-Commerce and e-Service, 2004.
Application of Data Mining Technology in Business of Commercial Banks
CHEN Min
(Post Doctoral Programme of Bank of Beijing, Beijing 100081,China)
Abstract: Data mining analyses the massive data in the CRM system of commercial banks effectively, by turning the information into knowledge, data mining benefits the banks with making better business decision. Based on the introduction of data mining technology and the main mining targets, this paper summarizes that the CRM, risk management and fraud detection, and then introduces the application of data mining in those research fields.
Key words: Data Mining; CRM; Risk Management; Fraud Detection
因篇幅问题不能全部显示,请点此查看更多更全内容