V2EX / 企业管理软件 / 商业智能 商业智能BI
- 现在digg.com网站不仅仅是个人气活跃的社区和聚集新闻的地方,对于blogger和网站的拥有者来说,digg.com也变得越来越有影响力。它能帮你带来大量的流量从而产生收入,也能使得你的网站很受欢迎。为了说明digg.com的重要性与日俱增,我分析了digg.com网站的一些数据,判定了其主要的趋势。那么就先让我们看一下官方digg.com提供的数据材料,然后再把注意力转到非官方的duggtrends网站所提供的数据吧。
活跃用户分析
digg.com上的Top Diggers显示了一组极有影响力的digg用户。这些排名前列的digger与其他的用户比起来,其提供的文章更有可能进入到首页。不用惊讶,名列榜首的是Kevin Rose (译者:Digg的创始人)。他提供的120篇文章中有119篇上了首页(他的命中率达到了99%)!那唯一没上去的文章是哪一篇,我很想知道?
如果按照"提交文章数"最多来排序,你会发现这些排名靠前的用户中相当一部分人的"Popular Ratio"值很高(译者注:Popular Ratio指的是你提交的文章进入到首页的比例)。Albertpacino的比例是31%(2570篇文章中有800篇上了首页), BloodJunkie是26%,gwjc 24%, digitalgopher 36%, dirtyfratboy 则是37%等等。这些人都提交了1000多篇文章。我并不惊讶于这些数字,因为这毕竟是个社区网站。所以,朋友之间互相挖掘也就显得再自然不过了。
受欢迎blog和网站分析
digg用户也有他们偏爱的博客和网站,被偏爱的网站较之其他的网站会被给予更大的关注。(哎..我的很不幸属于后者)。比如说, AppleInsider 在过去一周,上了首页的文章至少有四页之多。通常,这些受欢迎的网站更新的内容又会很快地被digg的用户提交上去。但问题在于一些发表优秀原创文章的网站常常被忽略,相反那些人气度很高的网站则受到很多digg用户的青睐。我是根据最近的个人经验发表这一观点的 
星期几是提交文章最多的一天
一个叫做duggtrends的网站则在对digg数据的其他方面进行追踪。根据duggtrends的统计,星期天是发贴量最少的一天而星期四则是发帖量最多的一天。很明显,大多数的digg用户是在上班的时间登录网站提交内容的(按照美国时间)。所以duggtrends估计美国东部时间早上9:00是提交文章的最好时机。
首页率
Duggtrends以星期三和星期四的标准,统计得出一周内能上首页的文章占到总量的15%-19%。然而,在表1上的那些数字与显示在表4上较低的"首页率"似乎并无联系。
分类
Duggtrends在digg发布了第3版本后,也对新的分类进行了分析。毫无疑问,"Tech Industry News" (科技产业新闻)占据了主导地位--在一星期里面有2184篇文章被提交。"World News"(国际新闻)以1287篇文章占据了第二位。但是,看看duggtrends对其的评价:
“这一类的文章上首页的机会比较小。因为大多数时候,这些文章在几分钟内就会被新的文章推到了后面。”
事实上,这个统计显示Tech News类的文章只有120篇上了首页(只占到该分类文章总量的5.5%)。再过些时候,等第3个版本更加成熟之后,我们也许能看到其他几个板块(除Tech版)也会得到相应的发展。这当然是digg的管理层所希望看到的。
总结
对于digg,我们拭目以待。如果你有更多关于digg的数据或者是故事要来分享,那么请在下面留言。对了,如果你很喜欢这篇文章,那么还请将他提交到digg.com上吧!
评论 6:
我们得出一个理论: digg用户读了文章的标题和简介,一些人就加入到了讨论中去,只有极少的人会真正点击那个指向原文的链接。
(译者,所以给原创网站带来的推广效果要打个折扣,对么?板砖似乎也有类似现象)... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 新的调查研究结果表明,大公司正在排着队购买新的商务智能(BI)软件,并且在2007里面将升级企业资源计划(ERP)系统。
位于美国马萨诸塞州剑桥的福斯特研究公司对拥有超过1000名职员的1078家企业中的IT决策者进行了调查,发现有13%的人打算在2007年年初购买商务智能软件。
福斯特还发现,很多大公司都计划升级他们的ERP和客户关系管理(CRM),与此同时,还会加强他们的基础架构软件和中间件部署的安全性。
“商务智能软件代表了顶级的应用程序购买,企业资源计划也将继续保持为最主要的升级,而消息、电子邮件和协作软件是仅此的升级项目,”福斯特研究公司分析师RayWang在一次采访中谈到。
说道2007年软件项目的时候,27%的大公司都表示要将应用程序之间的集成提升到最高优先级别来,随后是升级安全环境和采用面向服务的体系结构(SOA),分别是21%和12%。
福斯特说作为服务的软件(SaaS)将会是小型企业中最流行的趋势,现在也逐渐开始在大企业中开始流行。大企业对于SaaS的兴趣主要是在人力资源应用程序上,随后是ERP和CRM。Wang说,调查结果显示,从2006年以来发生了很大的变化,负责人员更愿意使用SaaS作为CRM,而不是ERP。
总之,福斯特预测说,大公司的大笔资金将会用在新的软件项目上,在2007年年初的增幅就将达到10%,而通常对于现行IT系统维护的预算的下降幅度也是10%。分析机构说,这个趋势证明了,大企业正在收获与海外采购和SaaS之类有关的金融收益。
为什么是商务智能?
许多企业最近都进行了ERP和CRM的安装或者升级,Wang说,导致对商务智能软件的兴趣高涨,商务智能软件可以帮助用户预测未来公司的需要,这一点可以用在来自不同系统的分析和报告的数据上。
“人们购买商务智能,是因为他们把所有的数据都放到了系统中,现在他们想要把这些数据弄出来了,”Wang说。“没有商务智能的话,要判断你的投资就是一项苦差事。”
调查结果显示,具有讽刺意味的是,当商务智能持续增长的时候,对能够帮助企业对齐数据,避免错误的复制的主数据管理(MDM)的投资却被局限在“早期采用者”的小圈子里面。
“此刻就是个倒退,”Wang说,“如果你想要你的商务智能起作用,首先要解决的就是主数据问题。”
许多公司都不情愿使用主数据管理,他说,只是因为这是一个猛犸象似的项目,需要创建和实现一大堆新的数据管理规则和监管策略。
“公司真的没有时间去思考这样的问题,”他说。
中小型企业向纵深发展
福斯特还专门针对北美812家中小型企业的IT决策者进行了一次调研,发现许多小型企业都想要购买纵深方向的软件,或者是专门针对某个行业的,功能性的软件。例如,Wang说,银行业的公司就想要与银行相关的功能性,以此类推。
在中小型企业中,大概有10%的企业第一次对支持特定行业业务的软件进行投资,他说,但是还有43%的人希望升级现有的应用程序,使其具有纵深方向的功能性。
“这表明中小型企业的投资技术的整体愿望,期望这些投资可以深入他们的业务操作核心,”报告说。
从整体上说,福斯特发现新的软件许可费用在2007年里面将会占到中小型企业IT预算的33%,而许可的维护和代码的维护费用将会用掉27%,22%将会用于新的软件开发。
于此同时,与他们的较大的对手一样,许多中小型企业也在考虑应用程序的整合,有21%的中小型企业被调查者反馈说这是2007年的头等大事。 SaaS的脚本走顺了
第一次,大型企业对SaaS的兴趣超过了中小型企业,Wang说。
分析师说,大型企业开始考虑SaaS,是因为他们的资源短缺,但是他们仍然希望可以增加功能性和灵活性的级别。
“一件有意思的事情就是在2007年里,SaaS中人力资源应用程序所扮演的角色”,Wang说。“客户关系管理曾经是SaaS的榜样。现在是人力资源应用的领域了,例如性能管理和才能管理,所有这些辅助项目,都是人们曾经使用主机应用程序的地方。”
除了对SaaS的兴趣增加之外,妨碍采纳的障碍仍然存在,其中包括集成问题和整体的相关成本,报告中说。
MartinSchneider是位于纽约的451集团的高级企业软件分析师,他同意大型企业对SaaS的兴趣不断上涨的说法。他说,有两个主要因素导致了这种趋势:系统变得越来越复杂,他们帮助大型企业可以更加轻松地继承新的收购产品或者业务集团。
“当你想要建立起一个新的分支,或者在系统中运行,那么真的很难作出购买软件许可的样子,C/S模型的内在规定,创建登录、培训——所有这些都是与软件的席位一起出现的,”Schneider说。“SaaS模型可以节省大量的时间和金钱。”
5年前,应用程序服务提供商不会提供鲁棒的应用程序类型,例如今天的SaaS供应商,Salesforce.com所提供的。
“工具在将数据从那些SaaS系统中取出,再放入提前部署的系统中,生成历史性报告、分析和类似东西的能力变得越来越好,”Schneider说。“5 年前,ASP模型是个非常稳定的系统。数据的进出非常困难,这些系统的功能性要不是飞车号,因为它们不是大规模集成。”
SaaS的供应商还有NetsuiteInc.,EverestSoftwareInc.和Workday,它是前PeopleSoftCorp成立的新公司,老板是DaveDuffield。
外购盈利
在2007年里面,北美的企业对软件的开销会大幅增加,因为新的软件启动项目,福斯特说。
去年,大型企业的IT预算中有23%用在了新的软件启动上面,77%用到了正在进行中的维护和操作上。今年,这个数字将会改变为33%和67%。
“这个变化是巨大的,因为它意味着海外、外购,SaaS,IT部门综合使用新类型的开发工具可以带来更高的效率,并且——减少维护现有操作的成本,将预算留给新的采购,”Wang说。“我们查看留下的数据,并且看它们是否是真实的,我们仍然无法找到它的漏洞。”
Wang说,全球2000家企业对于外购的兴趣是最大的。大约有44%的企业外购获得客户应用程序开发,38%用于维护和支持打包的应用程序,还有34%的企业是用于维护并支持客户应用程序。... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 本报讯 谁说熊市不能赚钱?中国第一股民杨百万说“可以”,建德市莲花镇养鸡大户郑竹良也信心满满地说,“可以。”而且不仅嘴巴说说,在今年养鸡行情不景气的情况下,他还真收益不错。老郑摊出一张皱巴巴的纸说,这绝非偶然,全是因为读懂了这张8年来制成的蛋市K线图。
说起这张曲线图,老郑得意地合不拢嘴,随身摸出一张皱巴巴的纸,上面是手工绘制的曲线图,精细的程度只有他才能看得懂。
2000年,老郑从事蛋鸡养殖,就开始对销售的鸡蛋价格一一记录,绘起了曲线图,平时只要一有空闲,老郑就会对曲线图的走势和规律进行分析和研究。认识他的人说,老郑每次研究曲线图的劲头绝不比股民分析股市的差。
老郑一直相信,自己绘制的曲线图必定总结出道道来,为了让自己更吃透一些市场规律和知识,8年来,才初中学历的他,只要哪有全国性的家禽交易会和专家讲座,他都会不怕路远不怕费钱到处奔波,赶去赴会。
各式各样的家禽研讨会上,总有这个来自建德的养鸡户,而很多研讨会参加者不是学者专家,就是大型养殖场的老板或管理者。但老郑确实在这么多年的学习下,掌握了最新现代的养鸡技术。
“看久了看出了门道。”研究曲线图的好处在于老郑总是先人一步,预测市场的动向,每次为自己节省了一笔不小的成本。“现在的玉米、豆粕价格都在涨,差不多的小鸡饲料每公斤都要4元钱,再加上给鸡防病打针看病,雇工喂养,成本高得很,而我却在玉米、豆粕涨价前就购进了一批,光这一项我就比别的养殖户节省了一大笔成本。”
现在,老郑将这张曲线图放大,挂在了自己家里。这张图看起来,还真像股市的K线图。
老郑的蛋市曲线图经过整理后,还发表在养殖业专业期刊《中国禽业导刊》上,连那里的众专家都吓了一跳,直夸老郑的分析预测挺准的。
老郑的曲线图显示,近8年来,浙江鸡蛋价格最高的时候,出现在2007年8月,为4元/斤,最低价格出现在2006年3月,为1.75元/斤。这也和他的盈利水平是成正比的。
老郑还说,就今年来说,6月份的蛋价是相对较低的,为3元/斤,放在历年来看,这个价格不低,但他们却几乎不赚钱,这也是因为今年养鸡成本涨得很厉害,饲料成本、人工成本都有所增加。
不过,老郑说,根据他的分析,鸡蛋价格的走势应该要开始抬头了,他们很快应该可以恢复到盈利的正常轨道上去。
“这是黎明前的黑暗,挺过去就好了。”老郑对自己的判断很有信心。欧阳文华 游佩芝 娄炜栋
转载自:http://news.sina.com.cn/s/2008-07-27/032616006042.shtml... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- Business Intelligence平台魔法四分区(见图1)代表了Gartner对全球BI厂商的评估,其中的厂商是Gartner推荐企业购买BI应用程序时所需考虑的选择。企业采购人员应该考虑四分区中所有厂商——包括Niche Player和Visionary,因为Visionary通常代表推动创新的厂商,例如交互可视化、内存装载技术、实时仪表盘、向导式开发、电子表格式报表等技术。此文档中的评分和评论基于三方面来源:客户对厂商的评价和对BI相关问题的咨询;在2007年末发起的线上调查;从厂商回收的关于BI战略和运作的调查卷。
图 1. 2008年Business Intelligence平台魔法四分区

市场概要
2007年BI平台的“宏观趋势”是——市场整合——到目前,BI市场经历了热闹的一年。
在去年魔法四分区和其他Gartner报告中(例如,"Market for Business Intelligence Platforms: Round Two of Consolidation Begins")出现的大型应用程序和基础软件厂商,在2007年逐渐完成或发起它们重大的战略性收购:
*在七月,Oracle完成对Hyperion的收购。Hyperion System 9和Oracle Business Intelligence Enterprise Edition曾经是相互竞争的产品,在2007年的魔法四分区中都处于Leader分区中。通过收购活动使Oracle拥有了更多的BI资源和技术人员。(参考"Hyperion Purchase Will Strengthen Oracle in BI Platform and CPM Suites Markets.")
*在10月,SAP公布对Business Objects的收购,这将提升在“business user”市场的份额,SAP将这部分市场定义为需要丰富信息资源进行分析的业务角色。此项收购,预期在2008年1月完成,将填补SAP在查询和报表工具领域的重大缺陷,但也意味着背离以前“slot-in”式技术购买和组织化软件开发战略。(参考"SAP's Planned Business Objects Buy Signals Strategic Shift.")
*在年末,Cognos完成了对Applix和它内存联机分析处理(OLAP)引擎的收购,随后Cognos又同意的IBM的收购。虽然还没有开始严格意义上的收购行动,但此项收购意义重大,将会终结IBM在BI平台和应用软件市场缺席的状况。IBM反复申明它将关注基础软件层和中间件层,目的仅仅是“支持”应用软件层。因为BI平台包括的许多基层组件,Cognos BI和绩效管理应用程序将填补IBM的空白。(参考"IBM Aims for the Business Intelligence Endgame With Cognos.")
大型厂商开始支配BI市场——不用一年时间,Microsoft、Oracle、SAP和IBM的市场份额将从四分之一到三分之二。2008年魔法四分区就反映了这一转折点,市场由Business Objects和Cognos这类独立BI厂商领导转变到了由大型厂商统治的状况。未来企业对BI的投资决策将更加受限于战略源和堆叠因素,且受组织内其他应用程序和基层软件厂商的影响。
同时,“扁平化”因素——包括Microsoft的BI产品组合的成熟、Web 2.0技术的应用、开源BI和软件既服务(SaaS)的兴起——使得BI系统比以前更能承受和更方便获取。所以,此次的魔法四分区包括了一些兴起厂商的评述,尽管这些厂商还没有达到进入魔法四分区的标准,不过在某些BI应用领域提供了可行的选择方案。
预测
尽管市场收购活动产生不确定性,但Gartner仍然维持之前所预测的市场增长率。从2006年到2011年BI市场的平均收入增长率大约在8.6%。(参考"Forecast: Business Intelligence Platforms, Worldwide, 2006-2011, Update")。
多方面的需求因素表明BI平台收入将持续增长:
* CIO面临压力,需要投资新技术以驱动业务转变和策略变更。因为BI可以改进决策和运营效率,接着会帮助企业顶线和底线的增长,所以成功的部署BI可以让CIO实现其承诺。
* 企业应用程序会不断产生信息,BI平台可以将这些信息转变为为决策服务的财富。
* 由传统的查询、报表、OLAP到仪表盘、记分卡、可视化,因为企业接纳BI平台不断扩展的功能,我们看到了持续的增长和技术创新,使得BI更容易使用和建立(例如,搜索、数据内存转载、SaaS和服务向导构架)。
* 企业继续跟进BI的扩展和完善,从分析人员/用户驱动的BI应用程序,到战略和过程驱动的BI应用程序。
* 中小型企业正成为BI厂商的重要目标。许多厂商已修改或扩展了它们的产品、定价和合作策略,以满足那些关键群体要求。而且一些厂商还提供了托管式的SaaS服务。
* 工具的标准化也是增长的驱动因素,但也因企业需要逐步合理产品搭配,而减缓销售周期。
* 绩效管理系统的增长已经开始了,特别是注重财务的企业。非财务应用程序的分析工具,例如CRM和供应链分析也驱动市场增长。
信息“消费”意味着用户越来越明白如何利用和管理信息,这将使BI能跨组织的传播和扩展。可视化等技术的发展,会进一步促进这种趋势。
下面包括市场定义、入选标准等跟去年的差不多,我就不翻译了,具体见Gartner去年的报告。
http://www.cnblogs.com/esestt/archive/2007/06/02/768661.html
厂商的优势与劣势
Business Objects
优势
* 作为最大的公开交易的纯BI公司,Business Objects提供广泛和完整的BI平台,客户对它的报表和Ad-hoc查询功能评价很高。
* 在询问到是否将Business Objects作为企业BI标准平台采用,调查中大约90%客户表示曾考虑将Business Objects作为企业BI平台。
* 通过收购Inxight,Business Objects扩充了产品线,提供了文本分析功能。且扩展了SaaS服务。
* Business Objects的SaaS服务快速增长,客户已经超过了70,000家,使其成为此领域佼佼者。SaaS服务既吸引着新用户,又被Business Objects的老客户作为另一种选择并行使用。
劣势
* 随着Business Objects被SAP收购,它的技术前瞻性和市场执行力将会改变,这些改变可能会终结它的产品线、销售渠道、支持、客户合约。
* 虽然Business Objects成功说服大部分客户升级XI版本,但客户抱怨升级过程困难重重、代价高昂。许多进行大型部署的客户抱怨XI版本配置、部署困难,缺乏相关技术支持。
* 因为产品整合配置困难,加上在所有厂商中,客户对Business Objects技术支持的评价最低,导致在此次魔法四分区中降低了Business Objects执行能力的评分。
* 根据对客户的调查,OLAP仍被视为Business Objects最无法满足用户需要的功能。
Cognos
优势
* Cognos意外地获得了最高比率的企业标准平台评价——超过90%联系过的客户表示会考虑将Cognos作为企业标准BI平台。
* Cognos从四年前开始重构它的BI平台,引入新的ReportNet组件,现在它已经受益于新的平台了。随着8.2以及未来8.3版本的发布,Cognos 8改进了以前支持和稳定性的问题。调查中联系到的大部分Cognos客户已经运行最新的版本,升级和配置过程需要花费相当精力,不过很顺利。
* 当IBM对Cognos收购完成后,可以提升Cognos在WebSphere和Data Stage用户中的市场占有率。而且将显著提升Cognos的数据整合和非结构/文本分析功能,这些功能目前还落后于其它主要竞争者。
* 随着逐渐合并Applix的TM1 OLAP引擎,Cognos有机会重新管理系统的性能问题,之前Cognos曾放弃了性能的优化技术,而依靠数据库厂商的优化技术。
劣势
* 事实上,所有的Cognos 8部署都是报表为中心的,Analysis Studio并没有广泛被采用。Cognos必须提升使用OLAP式分析的客户数量,特别使用多大型关系数据库,但也使用具有竞争力的多维OLAP(MOLAP),例如Analysis Services、Essbase、Infocubes的用户。
* Cognos的预测分析和数据挖掘功能落后于其他处于Leader分区中的厂商。
* Cognos 8 BI的Report和Query studios之间在功能上存在残缺。如果有更多层和弹性化报表功能,客户将能受益于Ad-hoc查询工具,例如为维度创建多个块。
* Cognos 8缺乏优秀的缓存机制,用户每次刷新报表,必须查询数据库。Cognos需要增强查询性能。
* Cognos的TM1和PowerCubes目前有清晰的使用组合,但还没有明确说明这两种独立的技术在它未来的平台中充当何种角色。
Microsoft
优势
* Microsoft的产品定价和Office(包括PerfomancePoint Server)与SQL Server的整合格外吸引基于微软基础构架的企业。产品的打包和定价非常经济,吸引着许多企业。
* Microsoft的BI产品吸引着大型Microsoft应用程序开发社区。Microsoft的BI平台提供开发者基础构架、开发工具、工作流、协作功能,这比其他许多竞争者更吸引人注意。
* 受益于发展直销、服务渠道、市场宣传,Microsoft估计它已有2,000的OEM/ISV伙伴。许多业务部门的终端用户听说Office和SharePoint整合,将可能向他们的IT部门询问产品和相关支持。
* 根据我们联系到的用户,Microsoft提供的BI软件质量最好,超过半数的用户声称使用和部署过程中没有碰到任何质量问题。这反映了Microsoft对BI的关注,产品线管理团队的努力,和通过内部开发而不是收购的事实。
劣势
* Microsoft加入BI市场的时间不长,仍处在追赶的状态。根据用户反映,它的产品仍缺乏元数据管理、报表、仪表盘和Ad-hoc查询功能。不过,Microsoft准备在这个市场持久的发展,Gartner期望它会继续向BI领域投资,以便成为一个强劲的竞争者。
* 拥有多种应用程序、基础信息构架和开发环境的企业会发现,Microsoft的BI战略很有意思,但会让人发狂,因为难以整合已存信息构架和应用程序。
* 就算有价格优势,Microsoft将面临着不断提升的竞争压力,因为BI正变成越来越具有战略意义的市场,也因为其他大型厂商的收购行动。
Oracle
优势
* 尽管在2007年中收购Hyperion前,Oracle的BI产品就已经非常引人注目了——BI平台和分析应用程序(Oracle BI Enterprise Edition [OBIEE] and Oracle Analytic Applications)的组合是一套更好的产品。拥有合理的产品搭配,Oracle可以提供运作和战略BI功能,既有独立的,也有嵌入其他应用程序的垂直或水平布局的BI产品。
* 基于在大型企业部署的可靠性,客户普遍对OBIEE持正面评价。用户赞赏其工作流和协作功能,特别是超出市场上其他产品的可视化功能。
* Essbase OLAP引擎和Hyperion的Microsoft Office整合功能,扩展了Oracle BI的功能。而OBIEE的语义层,弥补了Hyperion BI平台的功能的残缺。
* Oracle开放的姿态,称为“热接入整合”意味着它的产品组合将吸引其他厂商使用Oracle Fusion中间件整合BI产品。
劣势
* Oracle对其BI产品和产品线的整合与调整在2008年仍将继续。
* 有强烈的证据表明,Hyperion的用户仍在等待和观望,并没有升级到最新版本——事实上,在所有的用户调查中,Hyperion用户运行最新版本的比率是最低的。Oracle必须特别小心以前Brio的客户流失,在Hyperion被收购以前,这部分用户就已经对Hyperion计划升级到System9所要收取的“增强费”非常不满了。
* Oracle需要对其BI产品提供更好的支持。调查中部分用户报告说,得到的技术支持不够完善,Oracle的一线技术专家不够。
SAS
优势
* SAS支配着高端分析方案,魔法四分区中没有其他厂商像SAS那样,拥有多种功能的分析工具和高端分析部署数量。
* SAS有强力的分析产品打包销售计划,产品不光包括了报表和关键绩效指标(KPI),还有更多的针对专门业务需求的分析工具,比如欺诈侦测。
* SAS有强大的品牌,和覆盖全球主要地区的支持体系。
* 它的Stored Services能够有效地将高级分析功能嵌入到报表、仪表盘和其他应用程序中。
* SAS整合JMP提供了数据载入内存分析和非常好的可视化效果,相比传统的SAS用户,能使用更多业务分析功能。不过JMP的界面应该再简化些。
劣势
* SAS历来就被认为使用难度大。特别,许多数据处理和高级分析任务需要SAS编程语言,对掌握了这些技能的用户来说这非常有利,但对缺乏相关技术人员的企业来说就成为了技术障碍。
* 尽管BI Server和Enterprise BI Server已经在上百个企业中部署,但SAS传统的报表和仪表盘工具仍然不为人所熟悉。SAS仍在艰难地努力使它的工具成为企业BI方案的选择之一。
* SAS的BI Server仍缺乏关键的特性,包括优秀的Web报表工具、报表中的下拉选择菜单、Cube增量更新。希望2008年中发布的9.2版本将会弥补这些不足。
* SAS向来被看作封闭的、只推广自己构架的厂商,它很少开放应用编程接口(API)。直到现在,它仍不鼓励在其他厂商的应用程序中整合自己的分析工具。不过最近与Teradata的合作申明已经迈出了好的一步。
* SAS的订阅价格政策只能吸引那些需要永久权限的企业。... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 企业就如同一辆汽车,领导者把握方向盘,驾驶驰骋的同时,需要从海量的数据中看出端倪,洞察商机。而其间曾经被认为是“旁门左道”的商业智能(BI)已经跨入“主流社会”,承担起企业提升数据价值的重任。
明确商业智能的价值
BI通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智业务经营决策的工具。它所能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的。明智的经营决策不等于正确的决策,BI工具的精髓在于促使企业去思考更多的问题与疑惑。商业智能到底该为企业解决哪些问题?SAP&BO咨询师高云龙认为,第一是了解过去; 第二是发现问题分析原因; 第三是预见未来; 第四是实时商业智能; 第五就是让机器自动做决策。
解过去,就是让领导和企业的管理层和决策层了解到企业当前的运行状态是什么,发生了什么事情?以前通过纸质报表来体现的,现在有更好的形式,比如液晶大屏幕显示墙,通过这种模式,让企业领导一目了然地看到企业所有的指标。如果发现有异常存在,可以通过多维分析工具或者机器查询工具分析原因。当某些事件发生时,通过数据分析对市场各方面运营会产生什么样的影响,这就是一种数据挖掘的预测。根据过去五年来,企业或者市场的发展情况,预测未来一年的销量,决策如何投放资源和力量则是传统预测。实时商业智能是一种较高的智能境界,在行业竞争激烈的态势下,对信息的时效性要求更高、更准,例如有些厂家促销活动半天后,立刻需要知道促销效果。这样就需要将历史数据与ERP系统或者业务支撑系统里面来的实时数据结合起来。
最重要的就是业务战略执行,这是最高境界,也是BI的最大挑战。在这一过程中,机器能够自动做一些决策。例如在保质期与价格的管理上,面包店保质期为三天,第一天卖10元,第二天卖8元,第三天卖3元。如何让机器自动调整价格,做出决策都是BI应该自动执行的。
实现数据图形化
心理学家在测试中发现,绝大数人对图形的认知能力远远超过对数字的认知。如何能够让海量的枯燥数据更易被接受?如何能让企业得到更好的数据应用效果?如何提高业务数据分析的效率?为此,某些商业智能软件公司推出了数据图形化产品,利用图形的先天优势再加上后天技术,让用户不再为数据头疼。
动态图形化数据的制作简单便捷,通过Excel建立数据模型,后将Excel数据模型通过专门软件工具导入到它的环境里,再通过一个个简单拖拽和设置建立它的关联,最后导出到PPT,或者PDF、Flash等格式文件,四步便完成了操作。
中国石化北京石油财务部马力强日常工作中分析的数据,有从公司ERP软件中获取的,有从手工报表中获取的,基本有七八十张报表。马力强介绍,报表数据要求在120分钟的时间内清楚明确地呈现给领导,这是财务部进行数据整理的一大目标。传统方式的数据展现已经不能满足需要,而动态的图形化数据有着引人入胜的展现方式。
马力强介绍: “在对上百项费用分析中,数据图形化首先对费用进行归类,把所有的费用根据部门的需要、实际情况与领导关心的内容,分为十大类,再把所有东西放在一张表上,这样所有费用所占比重都一目了然。此外,图表还有针对不同变动状况和趋势的分析。动态表格中提供趋势增减图,绿色代表增长,红色代表下降。不仅每项费用的变动趋势,而且每项费用的增减状态都能直观看到。预算对比状况中,如果哪一项费用超了预算,可以找到各个中心。因为组织架构是按照各个中心来设计的,有销售、直售、材料批发等,因为什么原因超了,可以进一步向下钻取,进一步向下进行细分。”
进行数据整合
企业从数据源抽取出所需的数据,经过抽取、转换和装载,即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图。为获得准确数据,打通应用系统间的有效沟通,ETL的重要性不言而喻。
首钢第二耐火材料厂ERP工程师陈冲介绍,首钢在行政规划上面分成各个不同的分厂,包括耐火材料厂、热轧厂、冷轧厂、炼钢厂等。每个分厂在不同时期建立业务系统、生产系统,不同系统在不同时期由不同厂家完成,必然其技术接口、数据形成的标准都不相一致。数据的来源也不一致,例如导灌站使用ERP系统的数据,捶压使用国内集成商的系统。为此首钢使用了数据集成理论方案来进行数据的整合,在短时间内完成首钢的需求分析以及真实的设计、制作等。
如何保障ETL的大量进行呢?博易智讯公司咨询师柴岳强认为,在完成大数据量的数据存储交换中,系统升级和迁移的时候,必须有稳定性能高的引擎支撑来保证老系统和新系统之间的平稳交互,并且在新老系统同时运行时,要高效地将老系统数据一次性导入新系统。数据接口从各个不同分离的数据源里抽取数据,具有多种数据接口即意味着联通性越高。
整合商业智能平台
建立商业智能的标准构架,可以节约成本。充分利用资源,通过统一平台、统一界面、统一培训从而提交深层次的商业分析与决策,这是BI服务中的一大课题。将企业内部所有方方面面,不同部门的数据,整合在整个应用平台上。在这个共同开放的应用平台上,不同的人通过不同的权限了解到最准确、最及时的数据,这样来帮助企业不同部门的决策层,做出精确的判断和分析,为企业带来最佳的绩效展现。
高云龙介绍,商业智能平台功能包含数据报表与分发共享,而更多隐性的平台功能不常被用户所发现,例如保障数据来源以及可靠性的数据仓库、贯彻企业经营管理的数据分析与模型、提供精确影响所用关键指标的数据挖掘以及常备的数据备份和恢复等。
北京首都机场规划部俞勇表示,在首都机场的BI平台建设中一直遵循这样的规则: “首先,统筹规划,化零为整。现代化的机场已具备大量相对专业和相对能满足局部功能的系统,但缺乏完全的统筹规划。因此,所有的单独系统必须按照统一的标准构架来进行规划。其次,统一标准,化整为零。在化零为整的基础上,把所有数据全收在这一平台上。因为个性化的满足放在大的系统构架平台中将很难满足业务要求,因此在建设中,都将通过整个平台进入数据中心,这样各个用户的要求也可以在这个平台上完成。第三,分工协作,有机互补。各种系统和平台的建立,使平台间相互重叠和相互交叉,在找出众多平台与系统的共同点后,做成一个单独的系统平台,每个有需要的人都可以在这个平台上查找出所需的数据。”
转载自:http://cio.ccidnet.com/art/18439/20080715/1506587_1.html&cid=1239218744&ei=kU59SMmpF4SG6QPA7JXHCA&usg=AFQjCNHU_osnYlfq7wpzDhV19Npb_C5Dbg... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 如何结合自身需求,进一步认识商业智能,需要主流产品供应商的引导,也需要制造企业的关注。商业智能如何推开制造业应用之门,我们拭目以待。
时至2005年,我国已经走过了十个“五年计划”。半个世纪的时间里,我国信息化水平大幅度提高,信息化应用逐渐和世界接轨,各种先进的技术、产品在国内都得到了不同层次的应用。前不久,有关专家就“十一五”工业化提出了“节能降耗、安全环保”的目标,这将成为我国工业化未来几年的发展方向。要达到这一目标,不仅要重视工业生产环节的智能化,也要加强管理的智能化。与此同时,国家有关部门正在进行“企业信息化评价体系”的研究工作,有关专家指出:评价企业信息化水平,关键要看信息化是否真正的发挥其作用,通过实施信息化,达到了促进生产、降低消耗、增加效益的目的。商业智能产品在制造业领域应用的核心就是通过数据提取、整理、分析,最终通过分析结果制定有关策略、规划,达到资源的合理配置,节约成本提高效益。商业智能在制造业信息化领域大有可为。
什么是商业智能
商业智能(BI)的概念最早是由Gartner Group提出来的。确切地讲,商业智能并不是一项新技术,它是将数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等技术与客户关系管理 (CRM)结合起来应用于商业活动实际过程当中,实现了技术服务于决策的目的。商业智能可以为企业提供外部和内部两方面的信息分析。外部信息包括竞争者、供应商、原材料、需求、顾客购买模式等信息;内部信息包括产品和服务的成本、质量,进入市场的时间,全员劳动生产率等等。商业智能通过将信息转换为知识,帮助企业了解新的趋势、抓住新的市场机会、发现潜在的威胁,从而更好的优化资源、改进财务绩效、引导产品潮流、提高服务水平,保持企业的竞争优势。
制造业将是商业智能的重要市场
Manufacturing Insights(IDC公司附属公司)的最新报告显示,2004年亚太区(不含日本)制造业IT市场规模为137亿美元,预计该市场将以11.4%的年复合增长率平稳增长,到2008年市场规模将达210亿美元。2004年底,亚太区(不含日本)制造业IT支出共137亿美元,其中离散制造占 78.6%,流程制造占22.4%。由于市场全球化和自由化带来了更加激烈的竞争和复杂性,亚太区(不含日本)的许多制造商继续对IT进行投资,以提高运营效率,更好地控制不断增长的业务成本。随着越来越多的制造商在华建立了生产基地,降低成本并占领巨大的国内市场,这些制造商需要对主要的IT基础架构、应用和服务进行投资以使其运营能够健康平稳地发展,并获得领先优势。这将继续促进中国和海外制造商的制造业IT投资。在对基础架构投入大量资金的同时,在中国和印度这样的新兴大型市场的许多制造商将继续对企业资源管理(ERM)和商务智能(BI)解决方案进行投资,从而为更好的内部协作和决策制定提供基础平台。
IDC的最新报告也显示,2004年亚太区(不含日本)商务智能(BI)工具软件市场规模为2.332亿美元,预计该市场将以12.3%的年复合增长率迅猛增长,到2009年市场规模将达4.173亿美元,增长预计主要源于中国和印度日益发展的经济。这两国近几年更加健康的经济环境和不断增多的应用系统部署为未来5年BI工具的采用打下了基础。有关专家指出,随着互联网的普及,在决策支持系统基础上发展商业智能已成为必然。随着基于互联网的各种信息系统在企业中的应用,企业将收集越来越多的关于客户、产品及销售情况在内的各种信息,这些信息能帮助企业更好地预测和把握未来。所以,电子商务的发展也推动了商业智能的进一步应用。
早在2003年,国内商业智能领域曾一度“火热”。在和勤软件公司李汉生发出“我们的目标是在未来5年内成为中国商业智能市场第一名”的豪言前后近两个月时间里,Hyperion、Business Objects(简称BO)、Actuate、SAS等全球商业智能软件市场的重量级供应商,逐一在国内亮相。其中,Hyperion召开了产品研讨会或发布会,BO的全球CEO访华并成立了北京办事处,Actuate则在上海浦东建立了自己的全球第四个研发中心。国内的软件厂商也纷纷宣称进入商业智能市场,并推出了各自的商业智能产品——用友推出了商业智能和企业绩效管理软件“用友BPM1.0”,博科则推出了财务智能软件系统的“博科FIW财务智能仓 ”。在随后的两年里,电信、金融、保险这些数据集中程度高的行业,商业智能得到了大量的应用。但在制造业领域内,由于企业信息化水平参差不齐,商业智能市场并未真正打开。
不过,从行业发展来看,商业智能作为业务驱动的决策支持系统,其发展是以较为完善企业的信息系统和稳定的业务系统为基础的。商业智能未来的应用与行业内信息化的基础状况密切相关,以制造型企业为主,其次是流通企业,这两个领域将是商业智能不可忽视的新市场。企业随着信息化水平的提高,商业智能产品将会与ERP和CRM等管理软件进一步融合,目前很多ERP厂商都把商业智能嵌入到相应的ERP系统内,比如SAP的ERP就嵌套了BO公司的商业智能产品,QAD也与和勤软件进行了类似的合作。CRM与BI的融合也是一样,商业智能将基于CRM系统以及企业其它应用系统,甚至手工积累的数据或者数据集,从企业决策分析的角度拓展出更大的发展空间。无论是集成的BI软件还是自己的统计分析工具,CRM系统必然要强调对数据和过程数据的预测和分析,这样才能真正做到科学管理、精细型管理和过程管理。基于CRM的BI,就是企业在CRM流程中对数据的统计分析,只不过其指导思想和商业模型更加智能化,更加体现以客户为中心的营销战略。
当然,商业智能如ERP一样,实施中存在着一定的风险,企业首先要认清自身的需求情况,在选择合作伙伴的同时也要进行充分的了解。各主流厂商都有各自的优势,比如SAS的数据挖掘、Hyperion的预算与报表合并、BO的数据分析与报告等。而商业智能产品的发展趋势必将是整合平台基础上的集成化应用。如何切实了解自身需求、选择具有优势的厂商产品,将是企业实施商业智能成功的关键。
我们知道,信息化建设是一个长期的过程,要随着企业发展,由需求引导得以实现。商业智能产品在国外企业的成功应用告诉我们,企业需要商业智能。如何结合自身需求,进一步认识商业智能,需要主流产品供应商的引导,也需要制造企业的关注。商业智能如何推开制造业应用之门,我们拭目以待。
转载自:http://tech.sina.com.cn/s/2008-07-13/2239730891.shtml... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 对于一个企业来说,最关键也最为重要的是,如何以一种有效的方式逐步整理各个业务处理系统中积累下来的历史数据,并通过灵活有效的方式为各级业务人员提供统一的信息视图,从而在整个企业内实现真正的信息共享。数据仓库技术正好满足了这一需求。数据仓库是商业智能系统的基础,如果没有数据仓库,没有企业数据的融合,数据分析就成为了无源之水。
数据仓库主要有四个重要特征:
1、数据仓库是面向主题的。传统的操作型系统是围绕公司的应用进行组织。如对一个电信公司来说,应用问题可能是营业受理、专业计费和客户服务等,而主题范围可能是客户、套餐、缴费和欠费等。
2、数据仓库是集成的。数据仓库实现数据由面向应用的操作型环境向面向分析的数据仓库的集成。由于各个应用系统在编码、命名习惯、实际属性、属性度量等方面不一致,当数据进入数据仓库时,要采用某种方法来消除这些不一致性。
3、数据仓库是非易失的。数据仓库的数据通常是一起载入与访问的,在数据仓库环境中并不进行一般意义上的数据更新。
4、数据仓库随时间的变化性。数据仓库中的数据随时间变化的特性表现在三个方面:
1)数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是6 0~9 0天,而数据仓库中数据的时间期限通常是5~1 0年。
2)操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是有效的,同样当前值的数据能被更新;而数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照。
3)操作型数据的键码结构可能包含也可能不包含时间元素,如年、月、日等;而数据仓库的键码结构总是包含时间元素。
OLAP:海量数据分析利器
对于TB级的海量数据,联机分析处理OLAP无疑是一种有力的数据分析工具。它可以让管理者灵活地对海量数据进行浏览分析。利用多维的概念,OLAP提供了切片、切块、下钻、上卷和旋转等多维度分析与跨维度分析功能。相对于普通的静态报表,OLAP更能满足决策者和分析人员对数据仓库数据的分析。
区别于传统的联机事务处理 (OLTP)系统,OLAP有12条准则:
1、 OLAP模型必须提供多维概念视图
2、 透明性准则
3、 存取能力推测
4、 稳定的报表能力
5、 客户/服务器体系结构
6、 维的等同性准则
7、 动态的稀疏矩阵处理准则
8、 多用户支持能力准则
9、 非受限的跨维操作
10、直观的数据操纵
11、灵活的报表生成
12、不受限的维与聚集层次
虽然随着技术的发展,部分准则有所突破,但这些准则仍然是OLAP技术的基础。
OLAP系统架构主要分为基于关系数据库的ROLAP(Relational OLAP)、基于多维数据库的MOLAP(Multidimensional OLAP)、基于混合数据组织的HOLAP(Hybrid OLAP)三种。前两种方式比较常见。ROLAP表示基于关系数据库的OLAP实现。它以关系数据库为核心,以关系型结构进行多维数据的表示和存储。 ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。MOLAP表示基于多维数据组织的OLAP实现。它以多维数据组织方式为核心,使用多维数组存储数据。MOLAP查询方式采用索引搜索与直接寻址相结合的方式,比ROLAP的表索引搜索和表连接方式速度要快得多。
转载自:http://tech.sina.com.cn/s/2008-07-13/2238730897.shtml... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 摘要:
按照时间顺序编写商业智能开发过程中可能遇到的各个阶段;各个阶段可能遇到的问题,如何注意这些问题。
u 需求阶段:
1. 需求阶段习惯上也就是客户提出要求的阶段,这个阶段原则上我们应该积极主动与客户联系,听取他们的需求。他们对数据仓库的了解没有那么深刻,但是提出的问题却是很现实的他们解决不了的,需要我们协助解决的问题。
2. 需求阶段是重要的一个环节,跟一般的软件需求一样,需要明确我们的OLAP系统要实现的是什么。这个阶段我们可以先不考虑我们的技术是否可以实现,只要目前世界上有这样的技术我们就可以应允,技术可以是在开发过程中学习的,在以后的项目中我们会继续遇到类似的问题,那个时候我们的技术也就相对成熟了。
3. 需求阶段是我们跟客户互动的阶段。客户在跟我们的沟通过程中也会逐渐的发现数据仓库还可以实现什么,所实现的功能用到他们的项目中是否会有大的帮助。这样,我们也在向客户输送数据仓库的相关信息,也在宣传着我们的技术或者产品。客户所在的行业,可能在之前我们都没有接触涉及过,相关的行业经验缺乏,这个过程也是我们学习了解相关行业知识积累行业经验的过程。
4. 这个过程双方达成协议,并签署合同。
u 策划阶段:
1. 在需求分析的基础上,我们对整个项目的整体规模有了一定的了解。接下来就是要把项目工程化,应用软件工程一般规则策划整个项目。
2. 从大体上确定需要多少人力投入这个项目,这些人对项目所涉及行业熟悉吗,是否需要培训相关的行业知识。如何根据项目组成员个人技术能力分配相关工作,如果项目过程中有人离开项目组或者离开公司怎么处理等。
3. 策划阶段也需要不时的与客户沟通,比如根据合同的内容安排项目的进度等。如果没有协调好就可能发生某些不符合合同要求的情况。
u 设计阶段:
设计阶段是整个OLAP项目的规划阶段,属于架构或者计划。将来的分析开发阶段都将根据设计阶段规定好的架构进行。因此设计阶段是非常重要的。不可否认设计阶段架构的框架可能在后续的开发过程中发现错误,需要重新架构。为了尽可能避免这种情况的发生,宁可多话时间在分析研究,或者实行多种方案,有备用的方案应急。
u 编码阶段:
ü 模型分析
1. 定义问题,确定分析的目标:
OLAP和数据挖掘是商业智能家族中两种重要的技术。
OLAP的优势体现在其在维度定义基础上对数据的预先聚合、对复杂查询分析放映速度快;OLAP可以解决如下典型问题:
1. 饮料在过去三个月内在某个地区的销售总额是多少。
2. 上个月所有商店汇总过来的销售最好10中产品是什么。
3. 男性顾客&女性顾客购买量分别是多少。
4. 促销期间&非促销期间的日均销量有什么区别。
数据挖掘的优势体现在通过分析属性间的相互关系发现隐藏的规则或者规律。数据挖掘可以回答如下典型问题:
1. 哪些类型的消费者有可能购买新潮的数码相机。
2. 哪些商品适合推荐给某特定消费者。
3. 接下来的三个月数码相机的销量预计会是多少。
4. 如何按照某种规则给消费者群体分组、分类。
在很多情况下,隐藏规则、模式的挖掘、发现需要在聚合数据的基础上才能实现;直接从事实数据表挖掘隐藏规则、模式是困难甚至是不可能实现的。多维数据集的维度可能包含数百万的成员以及上千万的聚合值;跟关系数据库中的数据一样,多维数据集中也包含了某些隐藏的规则、模式,这些隐藏知识的发现需要数据挖掘的辅助。
在具体项目中,我们可以同时向客户推荐这两种技术或者根据他们的问题描述确定使用哪种技术。
2. 准备数据,ETL:
建模过程需要比较清晰的逻辑思路。一般需要对基础的业务数据库结构比较了解,也就是对数据源的理解。
客户提供的数据源可能由于来自不同的部门而有多种形式,比如平面文本文件,excel,access等,或者来自非Sqlserver的关系数据库,如mySql,sybase,db2,oracle等。有了SSIS(SQL Server Integrating Service),对这些不同格式的数据源的整合变得相对容易些。数据源数据也可能包含缺陷项或缺少项之类的不一致性。例如,数据可能显示客户在其出生日期之前购买产品,或者客户在距离她家 2,000 英里的商店定期购物,再比如男性客户的老公信息或者带有中文字符的不标准的时间等等。这些在生成模型之前,甚至定义数据源视图之前就应该解决,纠正,否则将会出现错误的信息或者挖掘出错误的模型。上述过程属于ETL过程,SSIS提供大量工具,这些工具已经涵盖或者取代了SQL Server 2000的DTS(Data Transform Service)。
SSIS可以解决大部分上述的问题。通过设置数据流源和数据流目标的格式,数据流转换工具控件就可以实现对不同格式数据的整合。控制流工具中容器的应用可以实现循环或者根据函数脚本来判断控制流的分支,最终实现数据向预定的类型转换。比如,从一个文件中根据文本规则(如空格标识,或者‘|’标识),吸取出某些数据作为数据库的某个字段的记录;把名和姓两个分开的字段合并成一个字段等等。数据流控件中还提供了专门处理AS的工具控件,如UDM,SCD处理控件,数据挖掘查询控件等。ETL 流程也可以通过构建Package来完成了,众多的DTS函数和图形化界面的操作省去很多繁琐的操作,元数据、函数都可以通过拖拽来实现。难点在于函数与函数、函数与脚本的组合使用。在IS中,也可以使用用户自定义组件,结合VS的组件开发,我们可以开发符合我们特定需要的IS组件,功能很强大。我们甚至可以对客户说,没有我们不能处理的数据源。
3. 浏览数据源,分析关联:
这里指的数据源已经是经过ETL处理后的数据源了,否则所作分析、关联将是无效或者错误的。个人感觉构建多维立方体的最关键一个环节就是分析设置众多的表与表之间的关联。表与表之间,字段与字段之间的关联分析设置
4. 构建模型:
A. 根据提供的数据源和客户需求确定分析的主题
分析的主题最终也就是提供给用户的立方体,通过透视(Perspective)还可以细分虚拟立方体,指定某些角色可以分析的角度。
B. 根据分析主题确定分析粒度
事实粒度需要根据提供的基础表的详细情况而定,一般而言,字段多分类详细的基础数据可以建立比较细致的粒度。粒度的确定也是根据用户的需求而定的,对于领导层次的分析,虽然可以建立明细的粒度,但是他们往往只是需要知道总体的情况、趋势。粒度越小,提供的信息越详细。
C. 根据分析主题以及数据源确定事实度量
量度组直接来源于事实表,事实表中数字型(如int,smallint等)的字段都可用作度量来使用,很多时候只是抽取需要的数字型字段。但是有些时候需要统计的量在事实表中没有相应的数字型字段,这个时候就需要增加字段或者设置相应的关联。有些时候需要统计的量恰恰是字段中某个非数字型的字段,这个时候需要做相应的变换,或者增加含有对应数字型的代码表,或者直接在构建数据源视图的时候做转换处理(需要比较复杂的Sql语句).不包含任何数字型字段的事实表也可以有度量,那就是对主键的count计数。
D. 确定分析问题的角度(维度创建)
分析问题的角度也就是立方体的维度。比如销售立方体,可能需要从时间,地点,分销商,消费者,促销信息等角度进行分析。维度层次结构分为属性层次结构和用户层次结构,属性层次结构可由系统(Visual Studio 商业智能Solution)自动完成构建,需要修改部分属性细节;重点在用户层次结构,需要注意的事项比较多,而且需要根据用户的分析需求修改属性,比如排序、聚合方式、层次属性是否可见等。
E. 形成多维数据集,验证多维数据集,修改更新多维数据集
5. 浏览、测试、验证模型:
6. 部署、更新模型:
ü 前端展现
特定项目一般需要特定的展现程序,我们可以通过修改淘金者来展示立方体,或者用Reporting Service,或者开发新的C\S 或者B\S结构的程序来实现特定的展现。ReportingService虽然只能在界面上提供静态的报表,但是报表的展示内容却可以由用户来自行决定,因为RS报表生成器也是拖拽式的工具,操作简单。用户只要知道业务分析常用的报表即可。OWC的表格&图形展现也是比较成熟的,有微软的技术支持,我们只要知道则怎么用,怎么赋值就可以。
在多维数据集的前端展现方面,我们已经有比较成熟的技术。对Analysis Service AdomdClient有比较熟悉驾驭能力, 对AMO的理解还比较浅,但是以及知道了其能够实现什么,我完全可以熟悉并掌握它。
对数据挖掘模型的展现也不是问题,Analysis Service AdomdClient下已经提供了展示微软提供的11种挖掘模型的控件,在.NET下可以方便的开发。
u 测试阶段:
u 试运行阶段:
u 验收阶段:... 0 篇回复 | 参与讨论 | john | | | | | | | | | 
- 知识型企业研究中心 2006-12-26
http://business.queensu.ca/index.php
Queen商务学校,任务是提高领导力的管理和促进商务和社会的发展。目前我们的研究工作...
英国谢菲尔德大学自然语言处理研究组 2006-12-26
http://nlp.shef.ac.uk/
英国谢菲尔德大学自然语言处理研究组研究领域主要为:自然语言分析,自然语言的产生以及相关资...
PC AI 2006-12-26
http://www.pcai.com/
在线免费电子期刊,除了包含每期期刊内容外,还包括一个AI讨论组,和经过整理的Intern...
美国印地安那大学人工智能/认知科学报告和再版文件汇编 2006-12-26
http://www.cs.indiana.edu/%7eleake/INDEX.html
美国印地安那大学人工智能/认知科学报告和再版文件汇编,网站提供了PDF格式的文件,相关书...
美国橡树岭国家实验室图像处理和机器视觉研究小组 2006-12-26
http://www.ornl.gov/sci/ismv/
美国橡树岭国家实验室图像处理和机器视觉研究小组,图像处理包括:机器视觉,图像管理和检索,...
人工智能研究者俱乐部 2006-12-26
http://www.souwu.com/
分类论坛:自然语言语音识别论文资源相关编程专家系统知识表示机器学习神经网络数据挖掘模式识...
DFKI人工智能研究所 2006-12-17
http://www.dfki.uni-kl.de/
与人交谈时,对方吐出一串叽哩咕噜的洋话、而你半个字也听不懂,怎么办呢?在过去,这可能需要...
数据管理前言技术国际研讨会(中国,上海,2006) 2006-12-17
http://www.iipl.fudan.edu.cn/DM06/index.htm
2006年该会议的主题是网站管理和挖掘. 它包括6-8个主题,邀请了一系列的研究者和当地...
媒体计算与WEB智能实验室(复旦大学) 2006-12-17
http://www.cs.fudan.edu.cn/mcwil/irnlp/
媒体计算与WEB智能实验室主要从事多媒体方向(包括文本、图象和视频)的教学和科研工作,研...
奥地利人工智能研究所机器学习和数据挖掘小组 2006-12-11
http://www.oefai.at/oefai/ml/mldm/
研究区域包括数据挖掘和知识发现,文本挖掘,机器学习,此外还网站提供关于研究领域,相关人物...
加拿大渥太华大学知识获取与智能化学习研究小组 2006-12-09
http://www.site.uottawa.ca/tanka/kaml.html
知识获取与智能化学习研究小组有他们的发展项目:智能化信息的获取项目,文本摘要项目,TAN...
美国麻省理工大学生物与计算学习研究中心 2006-12-09
http://cbcl.mit.edu/
美国麻省理工大学生物与计算学习研究中心在麻州理工学院成立。主要从数学,工程学和神经学的角...
德国乌尔姆大学人工神经网络小组 2006-12-09
http://www.informatik.uni-ulm.de/ni/forschung/ann.html
德国乌尔姆大学人工神经网络小组的研究重点在于神经网络,数据挖掘,信号处理等领域和方向的研...
优秀知识发现网络 2006-12-09
http://www.kdnet.org/
优秀知识发现网络是一个开放的网络,它的参加者来自科学,工业和公共部门。这项国际项目的主要...
奥地利维也纳医科大学脑研究中心医学控制和人工智能学院 2006-12-02
http://www.ai.univie.ac.at/
创建者是地利维也纳医科大学脑研究中心医学控制和人工智能学院,研究包括: 自然语言处理,机...
奥地利维也纳医科大学脑研究中心医学控制和人工智能学院 2006-12-02
http://www.ai.univie.ac.at/
创建者是地利维也纳医科大学脑研究中心医学控制和人工智能学院,研究包括: 自然语言处理,机...
美国伍斯特工学院人工智能研究小组 2006-12-02
http://www.cs.wpi.edu/Research/airg/
多主体系统,学习,单功能主体,智能界面,图标界面,专家系统,数据挖掘,知识库的设计等。
微软研究-机器学习和应用统计研究小组 2006-12-02
http://research.microsoft.com/research/mlas/
机器学习和应用统计研究小组把重心集中在从数据和数据挖掘。藉由软件自动从数据中学习获取新信...
英国爱丁堡大学信息学校人工智能应用学院 2006-12-02
http://www.aiai.ed.ac.uk/
情境基础的推论: 利用过去的经验和存在的技术指导诊断企业的资源过失;遗传基因的运算法...
北京大学计算语言学研究所 2006-12-02
http://www.icl.pku.edu.cn/
北京大学计算语言学研究所成立于1986年。研究所的使命是致力于计算语言学理论、语言信息...
哈尔滨工业大学智能技术与自然语言处理实验室 2006-12-02
http://www.insun.hit.edu.cn/default_cn.asp
哈尔滨工业大学计算机学院智能技术与自然语言处理研究室(ITNLP)是国内较早从事自然语言...
加州大学伊荣/尔湾分校机器学习小组 2006-11-29
http://www.ics.uci.edu/~mlearn/Machine-Learning.html
机器学习是一种通过经验获取知识的机制。加州大学伊荣/尔湾分校机器学习小组的研究包括基于统...
DMI:数据挖掘学院 2006-11-24
http://www.cs.wisc.edu/dmi/
数据挖掘研究所于1999年6月1日在微软的数据挖掘小组的帮助下在微软公司的计算机科学系成...
数据挖掘:原理,算法及应用 2006-11-24
http://www.cs.unc.edu/Courses/comp290-90-f04/
这是北卡罗莱纳洲大学计算机科学系2004年关于数据挖掘的一系列的研讨会的网站。上面列出了...
麻省理工学院开放课程--数据挖掘 2006-11-24
http://www.core.org.cn/OcwWeb/Sloan...5-062Data-Mi...
麻省理工学院的关于数据挖掘开放课程.上面列出了教学大纲、教学日程、讲义、作业、考试以及学...
国家数据挖掘中心 2006-11-24
http://www.ncdm.uic.edu/
芝加哥的伊利诺伊大学的国家数据挖掘中心于1998年成立,提供资源研究、标准开发和推广高性...
IBM智能情报系统研究中心 2006-11-24
http://www.almaden.ibm.com/software/disciplines/iis/
智能信息系统研究所主要在于设计维护隐私和数据所有权而不是妨碍资讯流通的信息系统.我们的工...
清华大学知识工程研究室 2006-11-24
http://keg.cs.tsinghua.edu.cn/
清华大学计算机系软件所知识工程研究室以网络计算模式下知识处理为研究方向,以Java、XM...
数据挖掘和数据仓库 2006-11-24
http://www.crm2day.com/data_mining/
这是一个关于CRM的网站。其中有在数据挖掘这一版块列出了许多著名的公司或者专家写的关于数...
数据挖掘课程 2006-11-24
http://cs.nju.edu.cn/zhouzh/zhouzh.files/course/dm.htm
是南京大学的数据挖掘课程的网页,上面列出了基本的课程介绍,提供课件下载,还列出了其他国家...
数据挖掘的连接 2006-11-24
http://www.galaxy.gmu.edu/stats/syllabi/DMLIST.html
该网页列出了关于数据挖掘的一系列链接
数据挖掘的连接 2006-11-24
http://www.galaxy.gmu.edu/stats/syllabi/DMLIST.html
该网页列出了关于数据挖掘的一系列链接
人工智能研究实验室 2006-11-17
http://www.cs.iastate.edu/~honavar/aigroup.html
人工智能研究实验室是爱荷华州立大学的计算智能、学习和发现中心的一部分.目前的研究包括:人...
美国人工智能协会 2006-11-17
http://www.aaai.org/home.html
成立于1979年的美国人工智能协会(aaai)是一个非营利性的致力于推进科学认识的社会科...
知识媒体学会 2006-11-16
http://kmi.open.ac.uk/index.cfm
研究与电视大学本身相关的区域: 认知的和学问科学,和多媒体。 研究包括下列的主题: 叙述...
WEB数据挖掘实验室 2006-11-16
http://www.wdmlab.cn/
本Web数据挖掘实验室隶属于南京师范大学教育科学学院教育技术学系。实验室立足于我国基础教...
Java资源网——Java数据挖掘 2006-11-16
http://www.javaresource.org/data-mi...-mining-73.html
Java资源网是由Java领域的爱好者组成的技术联盟,主要成员均来自java和相关领域的...
中国科大博纳数据挖掘中心 2006-11-16
http://bona.ustc.edu.cn/
中国科大博纳数据挖掘中心(Bona Institute of Business Data...
西南财经大学商务数据挖掘中心 2006-11-16
http://riem.swufe.edu.cn/dataminingcenter/
西南财经大学商务数据挖掘中心是一个应用研究机构,它和从事商务决策和数据挖掘的软件公司、...
国际数据挖掘技术研究中心 2006-11-16
http://59.77.6.145/dmlab/DesktopDefault.aspx
数据挖掘技术及其应用实验室是厦门大学国家示范性软件学院软件研究与开发中心的一个重要的分...
互联网数据挖掘服务中心 2006-11-16
http://idm.yatio.com/index.html
互联网数据挖掘服务中心(IDMSC)是以雅信核心搜索技术为依托,面向所有网络分众领域,为...
中科院数据技术与知识经济研究中心 2006-11-16
http://www.dtke.ac.cn/
中国科学院数据技术与知识经济研究中心(CAS Research Center on Da...
机器学习研究室 2006-11-15
http://www.cald.cs.cmu.edu/
这个机器学习研究室是卡内基梅隆大学计算机科学系的一个学术部门.我们集中有关于统计机器学习...
数据挖掘工程小组 2006-11-15
http://www.chem-eng.utoronto.ca/~datamining/
数据挖掘工程组是基身于多伦多大学的化工和应用化学系.其目标是把背景不同的在各个领域研究数...
查尔斯顿学院的信息发现 2006-11-15
http://di.cofc.edu/
信息发现是从现有的资料中,无论是以前贮存的、还是流经过沟通渠道的,去发现新的信息.如何运...
2006年数据挖掘论坛 2006-11-14
http://www.data-mining-forum.de/
这次会议是每年召开的一系列的基于数据挖掘的工业会议的第六次会议,该会议每年都在国际活动方...
数据挖掘 2006-11-14
http://www.ccsu.edu/datamining
这是ccsu的一个在线数据挖掘的项目,ccsu是唯一开办了在线数据挖掘科学硕士的学校.这...
第四届全国搜索引擎和网上信息挖掘学术研讨会 2006-11-13
http://www.sewm2006.sdu.edu.cn/
全国搜索引擎和网上信息挖掘学术研讨会是网络信息应用领域的重要活动,其目的是:促进国内外相...
第三届全国搜索引擎和网上信息挖掘学术研讨会 2006-11-13
http://www.sewm2005.edu.cn/index.htm
全国搜索引擎和网上信息挖掘学术研讨会是网络信息应用领域的重要活动,其目的是:促进国内外相...
第二届全国搜索引擎和网上信息挖掘学术研讨会 2006-11-13
http://www.scut.edu.cn/sewm2004/index.htm
全国搜索引擎和网上信息挖掘学术研讨会是网络信息应用领域的重要活动,其目的是:促进国内外相...
首届全国搜索引擎和网上信息挖掘学术研讨会 2006-11-13
http://net.pku.edu.cn/~sewm/sewm2003.htm
全国搜索引擎和网上信息挖掘学术研讨会是网络信息应用领域的重要活动,其目的是:促进国内外相...
数据挖掘技能 2006-11-10
http://www.statsoft.com/textbook/stdatmin.html
这是一本关于数据挖掘的一本书的章节
数据挖掘课堂笔记 2006-11-10
http://infolab.stanford.edu/~ullman/mining/mining.html
国外大学关于数据挖掘相关课程的课件。
智能科学网站 2006-11-10
http://www.intsci.ac.cn/
这是一个关于智能科学的门户网站,主要介绍的有关智能科学的内容由智能系统、智能科学研究、智...
数据挖掘词汇表 2006-11-10
http://www.twocrows.com/glossary.htm
数据挖掘的词汇表
智能工具,数据挖掘,可视化2005国际会议 2006-11-09
http://www.infonortics.com/idv/05pro.html
2005年6月27-28号在美国费城召开的智能工具、数据挖掘和可视化国际会议。网站上...
SIGIR2006会议网站 2006-11-07
http://www.sigir2006.org/
关于信息检索的会议网站,本年度的主题是用户交互与检索效率。该网站提供年度会议的论文目录,...
数字经济研究中心 2006-11-07
http://w4.stern.nyu.edu/ceder/
网站简介:25年多来,纽约大学的Stern's数字经济研究中心已经利用信息技术站在了商业...
原文挖掘和基于网页的信息检索参考书目 2006-11-07
http://filebox.vt.edu/users/wfan/text_mining.html
该网页提供了许多关于原文挖掘研评价和分析的连接。
数据挖掘爱好者 2006-11-04
http://datamining.diy.myrice.com/
数据挖掘就是从海量的数据中找出潜在的有价值的信息。这是一门综合了统计学、数据库和人工智能...
数据挖掘资源 2006-11-04
http://www.opendata365.com/datamini...200506/235.html
该网页提供了许多有关数据挖掘方面的链接,资源丰富。
第七次国际数据仓库存储与知识发现会议 2006-11-04
http://www.dwway.com/newcontent.php...5userid=corpid=
主要介绍了会议的时间、地点、宗旨以及讨论的主要内容。
数据挖掘:文本挖掘,数据挖掘和社会传媒 2006-11-04
http://datamining.typepad.com/data_mining/
这是一个私人博客,记录了作者研究方向的一些资料、信息。而作者主要的兴趣所在为:人工智能、...
与统计相关的数据挖掘课件 2006-11-04
http://www.autonlab.org/tutorials/
这个网站提供了基于统计的数据挖掘各个方面的研究类的课件,包括概率论的基础、数据统计分析的...
诊断试验评价与数据挖掘 2006-11-04
http://statdtedm.6to23.com/
该网站是个科研个人网(非商业盈利),目的是相互交流,共同提高;网站开辟的几个专题,如数据...
统计分析与数据挖掘实验室 2006-11-04
http://www.bistudy.com/
该网站主要提供一些相关软件介绍及其下载,包括: 调查类软件 、 统计分析类软件 、...
数据挖掘技术简介 2006-11-04
http://www.itcomputer.com.cn/Databa...0601/78529.html
数据挖掘是目前一种新的重要的研究领域。本文介绍了数据挖掘的概念、目的、常用方法、数据挖掘...
数据挖掘技术简介(PPT) 2006-11-04
http://eb.zzei.net/ebSimple/dss.ppt
PPT课件
数据挖掘教程 2006-11-04
http://www.sobooks.com/product_info...oducts_id/14953
本书为数据挖掘的基础教程,是作者多年来从事数据挖掘和专家系统课程教学经验的总结。它从商业...
数据挖掘 2006-11-04
http://www.the-data-mine.com/
这个网站是1994年4月建立的,主要是提供关于数据挖掘的信息,包括数据库中的数据挖掘和简...
数据挖掘:实用机器学习工具和技术(第二版) 2006-11-04
http://www.cs.waikato.ac.nz/~ml/weka/book.html
一本关于数据挖掘的书籍的介绍
数据挖掘讨论组 2006-11-04
http://www.dmgroup.org.cn/
数据挖掘讨论组网站建于2000年7月,是由复旦大学计算机系发起创建的。 该网站...
数据挖掘研究院 2006-11-04
http://www.dmresearch.net/
数据挖掘研究院是由HAMMER_SHI于2004年4.17日搭建成立的数据挖掘研讨平台,...
Lotus知识发现服务器 2006-11-04
http://www.chinakm.com/share/list.asp?id=2579
主要介绍了Lotus知识发现服务器及其功能和作用。
知识发现新进展与成果概述 2006-11-04
http://202.113.96.26/tjcbe/xueshubaogao/yangbingru.ppt
主要介绍了知识发现的内涵与外延的扩展、挖掘知识类型扩展、方法技术扩展、应用及发展趋势以及...
第四届知识发现与数据挖掘国际学术大会 2006-11-04
http://www2.ccw.com.cn/1998/37/170858.shtml
主要介绍了这次会议的8个专题介绍会,以及本届大会的几个特点。
数据挖掘研究院 网摘 2006-11-04
http://www.dmresearch.net/rss/
关于一个动态搜集的有关数据挖掘资料的网页。
数据挖掘 2006-11-03
[url]http://databases.about.com/od/datamining/
about.com[/url]
展示了原有的专题文章的收集、网络连接,以及专门讨论数据挖掘和数据仓库课...
UCI数据库知识发现 2006-11-02
http://kdd.ics.uci.edu/
在线的大型数据库,包含多种类型的数据,分析任务、适用范围.本库的主要作用是作为基准测试,...
关于应用解析的新闻以及商业资源 2006-11-02
http://www.secondmoment.org/
关于应用解析的新闻以及商业资源.强大日志内容混合了评论、技术、以及对知识发现和直接的知识...
数据挖掘与知识发现软件 2006-11-02
http://www.kdnuggets.com/software/index.html
这是一个通用数据挖掘软件的目录... 0 篇回复 | 参与讨论 | leo | | | | | | | | | 
- 数据挖掘在证券行业中的应用
作者:胡乐群
本文从应用角度出发,介绍了数据挖掘技术的基本概念及其在证券行业中的应用,并简要介绍了创智“先机证券”产品的功能,展望了数据挖掘在证券行业的发展前景。
一、前言
面对经济全球化和和全球经济信息化的发展趋势,以信息化带动工业化,发挥后发优势,实现社会生产力的跨越式发展既是战略上的必由之路,亦是策略上的可行之法。其核心是加速信息高科技的发展及其产业化,提高信息技术在经济和社会诸领域的应用水平,最终推动经济和社会的发展。
自八十年代投资人工智能(AI)研究项目失败后,人工智能转入实际应用时提出了一个新兴的、面向商业应用的研究课题 ——数据挖掘。目前,越来越多的管理人员正在利用数据挖掘工具,解决所遇到的至关重要的商业问题和决策问题,如企业经营方向的定位、管理模式的确立、营销的决策、内部生产力的促进、成本的控制和企业核心竞争力的获取等。
数据挖掘首先是需要在商业环境中收集了大量的数据,然后运用挖掘的知识对企业已有的数据进行分析,具有不同的应用形式。例如:
(1)作为企业经营分析研究工具 (Research)
(2)嵌入企业运营系统提高过程控制(Process Improvement)
(3)作为市场营销分析工具(Marketing)
(4)作为客户关系管理CRM工具(Customer Relationship Management)
创智BI研究小组以商业问题为导向,深入研究了数据挖掘在证券、银行、电信、保险等数据密集型行业的应用。同时,针对证券行业CRM应用,及时推出了“先机证券”产品,以期协助证券公司在分析客户、了解客户、开发客户,细分市场的基础上确定企业的经营策略,建立企业的竞争优势和增强企业整体盈利能力。
本文将从数据挖掘技术谈起,结合行业特点和实际应用,提出并分析证券行业需求,给出创智“先机证券”的解决方案,并进一步展望数据挖掘在证券行业的发展前景。
二、数据挖掘技术的概念和实用价值
1.数据挖掘的概念
所谓数据挖掘,是从海量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。也就是根据预定义的商业目标,对大量的企业数据进行探索和分析,揭示其中隐含的商业规律,并进一步将其模型化的先进有效技术过程。数据挖掘是一门交叉学科,它集成了许多学科中成熟的工具和技术,包括数据库技术、统计学、机器学习、模型识别、人工智能、神经网络等等。
数据挖掘能做以下六种不同事情:分类 (Classification) 、估值(Estimation)、 预测(Prediction) 、相关性分组或关联规则(Affinity grouping or association rules) 、聚类(Clustering)、描述和可视化(Description and Visualization)
(1)分类
分类即区分数据类别。首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。
(2)估值
估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出,同时分类的类别是确定数目的,估值的量是不确定的。
(3)预测
通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。预测其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
(4)相关性分组或关联规则
通过分析数据或记录间的关系,决定哪些事情将一起发生。
(5)聚类
聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚类不依赖于预先定义好的类,不需要训练集。
(6)描述和可视化
即对数据进行归约、概化或图形描述等。
2.数据挖掘的使用价值
数据挖掘技术源于商业的直接需求,因此它在各种商业领域都存在广泛的使用价值。
★客户分析
随着“以客户为中心”的经营理念的不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对积累的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献、交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。
★运筹和企业资源的优化
节约成本是企业盈利的关键。通过分析历史的财务数据、库存数据和交易数据,可以发现企业资源消耗的关键点和主要活动的投入产出比例,从而为企业资源优化配置提供决策依据,例如降低库存、提高库存周转率、提高资金使用率等。
★异常事件的确定
在许多商业领域中,异常事件具有显著的商业价值,如客户流失、银行的信用卡欺诈、电信中移动话费拖欠以及医学中特殊病情的征兆等。通过数据挖掘中的奇异点分析可以迅速准确地甄别这些异常事件。
★企业分析模型的管理
企业成员在使用数据挖掘系统时,会对模型进行调优和定制。这将会逐步积累符合企业自身需要的模型库,成为企业知识库的重要组成部分。
目前,数据挖掘技术在商业上实际应用十分丰富,业务应用中常见的具体例子有:客户细分、客户保留、目标营销、客户拓展、欺诈检测、购物篮分析、信用打分、信用风险评估、投资组合管理、行情分析、安全管理、客户盈利能力分析、资源管理、利润分析、交叉销售、增量销售、客户服务自动化、活动分析、销售预测、收入预测、需求预测、理赔分析、业绩分析、商店选址、库存控制、流程质量控制、故障分析、处方分析等等。以下将重点介绍数据挖掘在证券行业中的应用。
三、证券行业是数据挖掘技术应用的一个重要领域
数据挖掘是从数据中发现知识,数据密集型行业如证券、银行、电信等经过多年运营沉淀了大量的数据,挖掘、开发和利用这些数据可以使企业进行最适合的定位,将使企业长期的积累得以充分发挥,从而树立竞争优势。
证券市场是国家经济的情雨表,受多方面因素影响,券商的经营对数据正确、实时、安全性要求极高。长期以来各券商的交易系统一直走在IT技术应用革新的前列,同时也积累了丰富的数据。整个运营系统产生的数据主要分为两大类:股票行情数据与客户交易数据。股票行情数据由交易所产生,广泛分布,是实时共享信息。一些现有的实时行情接收分析系统例如(钱龙、胜龙、金融家、指南针等等)都能够对其进行从简单到复杂的分析;客户交易数据在各个证券公司的营业部产生,分布于证券公司的营业部及证券交易所,属于相对私有数据。这些数据反映了客户的资金状况,交易状况,持仓状况等,对证券公司和交易所而言具有极高的分析价值。数据挖掘技术已有了应用的空间。
随着国内证券行业政策的逐步开放,证券行业的竞争越来越激烈,券商分析决策时对数据的依赖性和敏感度也越来越高。数据挖掘技术作为分析与辅助决策工具已经越来越得到国内券商的重视。即该应用空间亦急需数据挖掘技术。
四、数据挖掘技术可以为证券行业解决哪些问题
目前,国内证券行业的外部经营环境发生了较大变化,证券市场由卖方市场变为买方市场,市场开始细分,券商对其传统的业务如经纪业务、投行业务和自营业务都在进行不同程度的调整,以期建立自己的核心竞争力,树立竞争优势。如何形成差别化优势是各券商应考虑的重点,形成差别化优势的主要依赖于券商提供的咨询服务与附加服务。数据挖掘在此过程中将发挥重要作用,其技术应用的方向主要有:客户分析、客户管理、财务指标分析、交易数据分析、风险分析、投资组合分析等。
从业务角度看,经纪业务是目前国内券商竞争的焦点,它仍是券商利润的主要来源,据统计从事经纪业务获得的收入占各主要券商利润来源的80%以上,而中小证券公司90%的利润主要来自证券营业部。从营销角度看,证券经纪业务是为满足客户需要而提供的一种金融服务活动,营销战略贯穿在证券经纪业务整个活动过程中,分析型客户关系管理(CRM)是国内券商(特别是各营业部)尤其关注的技术,而数据挖掘技术作为分析型CRM的核心技术将扮演重要角色。
营业部是否真正了解自己的客户,知道他们的特征、分布和习性?谁是真正的有价值的客户,谁在为证券营业部贡献利润?谁带来了当期的利润,谁又有潜在的价值?传统的按资金量大小来区分大、中、小、散客户价值的方法是否真正反映了客户对营业部利润的贡献?凡此种种问题可以通过客户价值分析来解决。它不仅让我们从投入产出角度去看待客户,而且还为营业部的经营方针提供了决策依据。
市场竞争的关键在于对“有价值的客户群”的争夺,“如何抓住客户”是一个永恒不变的主题。毫无疑问谁能够了解客户的属性,预测客户的投资心理变化,谁就能真正地把握证券市场的发展动向,获得市场竞争的优势。客户忠诚度分析正是通过对有价值客户的流失和沉寂客户的分析,寻求有针对性的营销方法和服务,进行客户的拓展和客户的保持。
证券行业对划分客户的传统方法是按资金量的大小区分为机构客户、个人大户、中户和散户。几乎所有的证券公司都是将机构客户和大客户视为自己的衣食父母,营业部的组织架构、产品配置,甚至考核指标均是围绕着这部分客户展开。久而久之,这种划分客户的方法似乎已经成为证券行业公认的标准。但从长远观点来看,是否更应该注意客户的平均盈利率,即是否应维持一定的客户盈利率(或适度的客户平均亏损率)才能够使证券营业部获得利润的最大化,使营业部得以长远的发展。客户帐户分析计算了客户的各种盈利率和资金周转率,通过这些指标的分析,并与营业部的当期总体收入相比较,将会发现其中有价值的规律。
几乎每一个证券营业部都有相当数量的沉寂客户,他们主要由于亏损和深度套牢而形成。一些营业部沉寂客户的规模竟达到总客户数的1/4—1/3,如能将这些客户唤醒,将会给营业部带来可观的收入。持仓分析的目的就是发现各种程度被套人群,并通过对他们持仓品种和比率的分析,有针对性地提供各种交易建议等咨询服务,使他们可以快速解套,保持一定的活跃度。例如对于套牢的客户,在股票趋势的判断下,给予平仓操作的建议,并在价格底部将该股票买回,这不仅给客户带来了现实的利益,更重要的是将一个可能会沦为沉寂的客户,转变成了活跃的客户,单从本次的一买一卖,营业部就可以获得相当的手续费收入,再考虑到整个套牢的人群,其价值是不言而喻的。
随着市场竞争格局的形成,证券营业部客户的随意流动性正在逐步降低,券商的竞争方式也从向着深层次的智能型转变。通过深层次、智能化的服务营销来提升客户的价值,从而使营业部获得最大的收益正成为行业的共识。然而提供个性化的智能营销不能单纯地依赖于有价值客户的自然属性和简单的投资行为,而要结合他们持股的习惯、对行业板块的爱好、持仓比例、交易方式的选择等指标的科学统计和分析。这种深层次的分析要求服务措施的执行者——经纪人必须具备丰富的专业知识、高超的交际能力、以及高度的责任心。这些经纪人不仅是营业部策略的实施人,更是沟通证券营业部和有价值的客户之间的桥梁。
以人为本是服务行业的基础,人的价值在证券行业更加得到充分的体现。良好的客户关系是靠长久的感情投资建立的,优秀的经纪人是靠营业部长期培养而成的。简单的奖勤罚懒是法真正地评估经纪人对营业部所能和将要产生的价值。通过对各经纪人小组所辖客户群的盈利状况、资金流失情况、周转情况等历史和实时数据的比较,使营业部对经纪人的管理和奖惩在具有充分说服力的同时,既富人情味,又不失偏颇。既如何管理高水平的经纪人和如何避免由于经纪人的流失而带来的营业部有价值客户的流失,又是摆在营业部管理层的急需解决的课题。
上述所有问题及其解决方案都只是证券营业部现代化管理的手段,其结果将最终体现于营业部在激烈的市场竞争环境中的竞争能力是否得以提高?营业部的市场份额是否在持续扩大?营业部的经营成本是否得到有效的控制?营业部的利润是否大幅度地增长?做为证券营业部的最高决策人,以及分析型CRM的最终受益人,营业部的管理者将可以从总体交易状况、现金流动情况、客户总体状况和他们的资产变化情况等方面,对系统的实施效果进行综合的评估和考核。并通过系统对外部报表的自动收集,了解本营业部的市场份额和排名的变化,从而加强管理的力度,制定行之有效的市场营销策略,拓展盈利的空间,实现最大化的投资回报。其典型应用包括有:
1、客户分析
建立数据仓库来存放对全体客户、预定义客户群、某个客户的信息和交易数据,并通过对这些数据进行挖掘和关联分析,实现面向主题的信息抽取。
★对客户的需求模式和盈利价值进行分类,找出最有价值和盈利潜力的客户群,以及他们最需要的服务,更好地配置资源,改进服务,牢牢抓住最有价值的客户。
★通过对客户资源信息进行多角度挖掘,了解客户各项指标(如资产贡献、忠诚度、盈利率、持仓比率等),掌握客户投诉、客户流失等信息,从而在客户离开券商之前,捕获信息,及时采取措施挽留客户。
2、咨询服务
根据采集行情和交易数据,结合行情分析,预测未来大盘走势,并发现交易情况随着大盘变化的规律,并根据这些规律做出趋势分析,对客户针对性进行咨询。
3、风险防范
通过对资金数据的分析,可以控制营业风险,同时可以改变公司总部原来的资金控制模式,并通过横向比较及时了解资金情况,起到风险预警的作用。
4、经营状况分析
通过数据挖掘,可以及时了解营业状况、资金情况、利润情况、客户群分布等重要的信息。并结合大盘走势,提供不同行情条件下的最大收益经营方式。同时,通过对各营业部经营情况的横向比较,以及对本营业部历史数据的纵向比较,对营业部的经营状况作出分析,提出经营建议。
此外,从券商角度看,增加经纪业务总量、提高市场占有率是目前营销与客户关系管理的主要目标,券商经纪业务总量可由下式表示:
券商经纪业务总量=客户数量×客户平均资产量×客户交易换手率
从上式看,营业部经纪业务的实际目标可以归结为以最低的成本来扩大客户群、增加客户投资量与促进客户交易。数据挖掘的CRM应用系统应解决上述主要商业问题。
五、创智“先机证券”产品目前有哪些功能
创智“先机证券”是分析型CRM证券行业应用产品,其应用对象是证券公司营业部。系统以经纪业务为主线,以增加营业部盈利为目的,从客户角度与经营角度,可进行如下主题应用:
A、客户分析主题
通过对客户状态、交易行为、自然属性和其他信息的综合分析,细分客户群,确定核心客户。同时通过对其进行关联分析,可为协助制定各种有效的营销方案,开展针对性的个性化服务。
B、经纪人小组管理主题
通过对经纪人小组工作业绩的分析和评价,发现问题提取成因,以便采取相应的措施,实现业绩的提升。
C、经营分析主题
通过对营业部每日、周、月、季、半年、年交易总体状况、市场占有率、发展水平等的分析、总结和评价,及时获得准确数据,辅助经营决策。
产品有四大主要业务功能,即客户分析、客户管理、经纪小组管理、营业部经营分析。这其中,客户分析是整个系统的核心模块,它不仅提供了客户价值、忠诚度、属性、帐户、持仓和交易的分析,更重要的是,它提供了属性指标之间,特别是不同客户群之间的相关分析,这对于发现客户交易的内在规律,为营业部提高经营管理水平、增强获利能力,提供了有力的决策依据。功能详细介绍请参阅《创智先机证券产品白皮书》。
六、今后“先机证券”产品的发展策略与前景
从经纪业务角度看,系统最终将以问题为导引,同时进一步导入营业部智能决策和智能管理、智能营销、咨询服务等功能,使证券咨询与营销、咨询服务完美结合,使不同的证券公司营业部形成自己独特的市场定位和核心竞争力。
从数据挖掘分析技术角度看,“先机证券”仅在数据描述、数据可视化、聚类分析、分类等方面进行了探索,今后还应继续采用预测、相关、关联等技术,挖掘更深层次的规律。
从系统角度看,“先机证券”目前仅为单个营业部服务,将进一步扩展为地区总部系统和券商总部系统,以适应券商整体营销的需求。
业务流程角度看,“先机证券”应逐步将分型型CRM、操作型CRM与协作型CRM整合。从而使系统真正能以客户为中心,以盈利为目的,将市场需求、决策分析与操作实施结合形成闭环控制。
从经营角度看,“先机证券”将进一步丰富品种,综合考虑除经纪业务外的其他业务如投行业务、自营业务等,以适应券商业务的拓展需求。
此外,由于国内证券行业发展迅速,交易系统不断更迭、交易品种一直在扩展、交易代码、交易规则也一直在变化之中,使得源数据异常复杂,产品应对产品数据预处理功能的特殊要求,增强产品源数据处理能力,提高产品的实施速度。
七、总结
“先机证券”产品是创智在证券分析型CRM方面应用的初步尝试,数据挖掘技术解决了经纪业务中的关键业务问题,为企业的核心资源——有价值客户的保留和拓展奠定了基础,并为营业部的经营定位和成本控制提供了决策的依据和操作的方法。相信在今后的研究中,创智BI研究小组还能深入研究数据挖掘技术,在证券行业不断推出更为完善的产品,协助券商获取长期稳定的利益。... 0 篇回复 | 参与讨论 | leo | | | | | | | | |  创建新主题 | RSS | NORMAL Mode |