BI“掘金”数据大集中

  • Super User
  • 日期:2005-07-12
  • 1572

BI“掘金”数据大集中

中国计算机报   2005-07-12
 

   专题策划:唐川

专题撰稿:上海证券交易所工程师 郑斌祥 郑刚 龚婷

   中国科学院研究学院软件工程硕士 冯睿

   对外经济贸易大学信息学院电子商务系副教授 黄健青

   长软国际科技(北京)有限公司 华桦 刘会治

   如何才能更好地预测上市公司财务风险?

  如何让商业银行远离“财务风险”?

  如何从海量的消费者信息中挖掘有价值的数据?

  如何量化客户的信用程度?

  这一连串的问题,听起来似乎极为繁琐和缥缈。

  事实上,运用数据仓库、数据挖掘、理性决策等商业智能手段,以上问题就能迎刃而解。

  现在,让我们看看商业智能在银行、证券、信托、保险等金融领域的应用威力!

  关注商业智能

  如今,在金融行业大变革之后,一系列的新问题让我们不得不关注。例如,如何才能分析上市公司的财务情况,并规避财务风险?如何才能让银行、信托机构更好地分析、评价客户的信用程度和还款能力?如何大规模地分析用户的消费行为?

  商业智能系统很好地解决了以上的问题。商业智能可以为企业或机构提供大规模数据联机处理、数据挖掘、数据分析,以及报表展现等服务,通过对大量的特定数据进行分析、整理,从而形成量化的决策信息,以供企业决策者采用。通过商业智能,我们能方便地分析特定用户的消费行为,例如银行用户、网站用户等,我们就能及时评价用户的信用程度,从而规避财务风险。

  目前,已经有越来越多的企业开始高度关注商业智能。这不仅包括IBM、ORACLE、BO、SAS、SIBEL等商业智能平台厂商,还包括各类行业用户,特别是银行、证券、信托、保险等具有大量用户信息的金融行业用户。

  商业智能还引起了中国科学院等科研机构的高度关注。针对商业智能,中国科学院在6月24日,举办了“商业智能及其在金融领域应用研讨会”。来自于银行、证券、保险行业及监管单位的专家、中国科学院系统专家,甚至远在美国的加州大学的商业智能专家,汇集在一起,共同探讨商业智能在金融领域的应用。

  BI的威力

  商业智能到底有多神奇,它到底有哪些应用?

  在“商业智能及其在金融领域应用研讨会”上,中国科学院金融科技中心副主任刘世平博士如此描绘:“此前,银行开设新的银行网点,往往都是根据经验决策,看人口的密度、住房情况,新设的网点一般需要2至3年才能获利。然而,当采用商业智能手段后,就可以通过数据分析、理性决策,找到合适的新网点,如此开设的新网点可以在三个月内获利!”

  以上仅仅是一个具体的应用案例。其实,商业智能能够广泛地运用在金融领域。

  在信用化程度越高的社会,商业智能所起的威力将越大。现在,我们很多人都在使用银行卡、信用卡,以及门卡、公交智能卡等。要知道,在这些卡里,一般都会存储你的真实姓名、住址,甚至家庭成员等信息。

  当你在生活中,使用这些卡时,例如使用银行卡在商场购买物品。这个过程中,你所购买的物品已经被记录在系统中。经过长时间的统计,银行方面将可以获知,你最喜爱到哪个商场购物;而你喜爱购买什么样的物品,商场也可以推断。

  可能,当你自己还没有意识到自己的最爱时,他人已经把你的消费行为、个人偏好分析得一清二楚。这就是商业智能的威力!

  在本次专题中,我们特地挑选了证券、银行、信托、网站等4个在商业智能的应用案例。其中,第一个案例讲,如何通过数据挖掘预测上市公司财务风险。对于股民而言,最重要的是,如何通过上市企业的财务报表,进一步判断该企业的财务风险?对于证券公司而言,又将如何准确地判断上市企业的财务风险。

  第二个案例,主要讲通过商业智能,让商业银行远离财务风险。当前,商业银行处于各种内部和外部风险之中。例如,银行的内部操作控制风险等。我们如何规避这些风险,如何提高银行的风险管理能力?商业智能就是一项有利工具。

  第三个案例,我们运用商业智能手段,在信托机构中定量地评估了个人信用风险,它通过对个人客户信息进行量化计算得出信用分值,来反应个人客户的信用状况。

  最后,为了增加专题的趣味性,烘托商业智能的神奇“魔力”,特例选择一个网站应用BI的案例,在用户查看网页时,通过利用点击流(Clickstream)数据仓库手段,构建点击流数据仓库维模型,分析网站用户的消费行为、兴趣偏好,从而进一步优化网站的内容和产品销售种类。 (唐川)

  金融企业

  的发展“瓶颈”

  商业智能在最近几年中得到了快速的发展,已经在银行、证券、保险等金融行业广泛应用,很好地解决了金融行业理性决策、竞争力提升和效能提高的发展瓶颈问题。

  BI进阶

  提到商业智能,不得不提到数据库、数据仓库和数据挖掘。上个世纪60年代早期,第一个通用的DBMS(数据库管理系统)由Chares Bechman在通用电器工作时设计,当时被称为集成数据存储,它奠定了网状、层次数据模型的基础,而这个阶段也被看作是数据库历史中前关系型数据库时期。

  数据仓库的出现,给充分利用已有数据,进行复杂查询,并为更好的决策支持提供了可能。值得注意的是,我们要把数据仓库与数据库区别开来。数据仓库以方便查询(称为主题)为目的,打破关系型数据库理论中标准泛式的约束,将数据库的数据重新组织和整理,为查询、报表、联机分析等提供数据支持。数据仓库建立起来后,定期的数据装载(ETL)成为数据仓库系统一个主要的日常工作。

  数据挖掘技术的出现在一定程度上可以认为是现代商业智能的第二个阶段??将装载的数据通过智能存储转变为知识。数据挖掘就是从大量数据中发现潜在规律、提取有用知识的方法和技术。数据挖掘不但能够学习已有的知识,而且能够发现未知的知识;得到的知识既能为非技术人员所看懂,又便于存储和应用,因此,其一出现就得到各个领域的重视。从80年代末的初露头角到90年代末的广泛应用,以数据挖掘为核心的传统商业智能(BI)已经成为IT及其它行业中的一个新宠。

  最近,商业智能发展到了更新的程度。例如,SAS公司发布了EIP(Enterprise Intelligence Platform: 企业商业智能平台),它包含了数据收集、存储、挖掘、分析及预测全方位功能,构成一条完整的智能价值链,为企业数据呈现了真实的、唯一的版图。

  在这个层面上,完整的商业智能包括了数据仓库、数据挖掘、前端展现、理性决策等几个层次,它为特定的商业分析目标或企业整体绩效提供定量化决策支持的解决方案的综合。

  金融业的“瓶颈”

  自进入2000年以来,金融创新浪潮席卷了金融业的各个领域,引发了金融业的一场革命。当前,这股创新浪潮仍将持续,并且有加速的趋势。

  在“商业智能及其在金融领域应用研讨会”上,中国科学院计算技术研究所副所长徐志伟指出:目前,金融行业已遭遇发展瓶颈。金融企业的解决方案僵化,处于“紧耦合”状态,我们应该如何克服“紧耦合”?我们应该如何从金融企业浩如大海的数据海洋中,分析得出合理的决策?

  易观国际IT研究总监杨青峰指出:中国银行业面临了新的挑战,例如管理模式、风险控制手段、数据利用相对落后等。

  导入商业智能

  引入商业智能,这成为了我们的选择。正如杨青峰所言,我们需要加快商业智能应用,加快科学决策、量化管理的步伐,通过数据统计、分析,最后进行理性决策。通过它来解决金融企业目前的应用困境。

  商业智能到底能够起到什么作用?对此,在“商业智能及其在金融领域应用研讨会”上,中国科学院金融科技中心副主任刘世平博士给出了如下答案:商业智能是一个过程,它从数据整合出发,消除信息孤岛,通过数据查询、统计分析、监管报表,到利用数据挖掘工具挖掘出有效信息,再把信息转化为知识,再从知识应用到商务决策。在这个完整的过程中,商业智能帮助企业促进销售、与客户加强沟通交流、更好地服务于客户,从而也加强了产品研发。

  为了更形象地解释商业智能对我们的金融企业的重大意义,刘世平博士给我们举了一个实际例子:

  银行如何让一家新开的银行网点实现快速赢利呢?

  银行结合了GPS推理信息系统和商业智能应用系统,在银行的客户信息中,详细记录有客户的常驻地,并且,当银行客户到该银行网点办理业务时,银行商业智能系统将自动记录客户的操作信息,以及银行网点地址信息。经过大量的记录,客户的常驻地到银行网点的行动路线,将被通过数据分析而得出。

  大量的客户路线得出后,我们可能会发现,某个地区进行银行业务操作的客户特别多,但他们附近没有银行网点,而是要到离他们较远的地方去办理。于是,银行就决定在这个地区开办一个银行网点。

  可见,对于金融行业而言,商业智能是其突破发展瓶颈,实现量化决策、提高增长质量的关键!

  中国银行业需要理性决策

  易观国际IT研究总监杨青峰指出:

  根据易观国际对中国商业智能(BI)应用市场的分析,2004年中国BI应用市场规模达到7.5亿元,增长率46.3%。

  从这个调查数据可见,中国的BI市场有着很强的生命力。而在整个BI应用中,银行业起到了举足轻重的作用。据易观国际调查,中国银行业BI市场规模达到2.2亿,预计年增长达到52%。从目前来看,中国银行业面临了新的挑战:例如体制改革、管理模式、风险控制手段、数据利用相对落后等。对此,我们需要加快BI应用,加快科学决策、量化管理的步伐,通过数据统计、分析,最后进行理性决策。

  BI改善中国银行业的决策方式

  2004年~2009年中国BI市场发展趋势

  名词解释

  商业智能(Business Intelligence)

  BI是一种为企业或机构提供大规模数据联机处理、数据挖掘、数据分析,以及报表展现等服务,以实现对特定的商业分析目标或企业整体绩效提供定量化决策支持的解决方案的综合。它的实现依赖于一系列数据处理分析工具:ETL、数据仓库、OLAP、数据挖掘、数据分析与展现工具。

  BI的应用可以大致分为几个层面:数据仓库、数据挖掘、前端展现、理性决策。目前,很多企业仅仅是1至2个层面的产品,只有少数企业才能提供达到理性决策的层面。

  数据仓库(Data Warehouse)

  数据仓库是在以数据存储为目的的联机分析处理系统(OLTP)的基础上,发展起来的新型数据处理系统。“数据仓库之父”William H.Inmon先生在其《建立数据仓库》一书中定义了数据仓库的概念:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程,而不是一种可以购买的产品。

  数据挖掘(Data Mining)

  数据挖掘是一种决策支持过程,它主要基于AI、机器学习、统计学等技术,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。