导读:长期以来,BI似乎都是企业领导者和财务管理人员的专用工具,为高层决策提供必需的信息。其实,广大的一线人员更需要BI为他们在日常运营的具体操作中提供及时、迅速、有效、直接的指导。
伪BI 之一:BI只能分析结构化数据
BI以往总是专注那些最易获取的数据,即以流程为核心的结构化信息——存储在内部数据库中的数字和文本。而据IDC的预计,全球每年产生的数字化信息中大约有95%是非结构化信息。非结构化信息是指因载体含糊而在电脑中混乱存在的信息,即无法在记录和字段格式中定义的信息,即时信息、电子邮件、散乱的文件、语音信息包和监视摄像机视频流中的像素,都属于非结构化信息。
非结构化转为结构化
确实,目前我们所见到的BI系统或者说我们所了解的实施过BI的企业,所做的都是针对结构化数据的分析,对于非结构化数据的分析处理少之又少。但这并不代表用户对非结构化的信息分析没有需求,只是进行分析的难度太大和实现所需要的投入太高所造成的。
对于国内的企业而言,信息系统建设多停留在基本业务系统的构建阶段,如采购系统、ERP系统、知识管理系统等。由于企业内的数据信息越来越规范,对于跨系统的信息处理的需求逐步产生,这样就加速了对于BI系统进行建设的需求。他们迫切需要处理的是存储在业务系统中的结构化数据,这样的方式在很大程度上可以满足企业内部管理者的实际需求,同时能够比较快地看到实施BI所带来的效果。
而非结构化的信息的价值不可否认。用户在实际的业务分析和决策过程中,通过结构化数据的分析加上所了解到的非结构化信息进行综合判断来辅助决策。
那么,BI就只能分析结构化的数据吗?答案是否定的。
事实上,众多的BI厂商在不断完善BI对非结构化数据的处理机制,以方便用户能够方便、有效地分析这些非结构化数据。目前多采取的方式是通过文本分析/内容分析工具将需要处理的非结构化数据按照设定的数据抽取规则转化为结构化存储的数据,来达到对非结构化数据进行分析的目的.
搜索、管理非结构化信息
在企业中,除了结构化信息之外,通常还存在大量的非结构化信息。企业员工在日常工作中,都大量使用和依靠着这些非结构化信息,并基于这些信息进行商业决策。
Microsoft Office SharePoint Server 2007中内置的文档管理和档案管理等组件,能帮助企业有效地管理各种非结构化信息。通过实施档案管理系统,企业能够有效地将各种非结构化信息进行分类归档,并通过应用企业的各种信息管理策略来对企业的非结构化信息进行有效、安全的存储与管理。
同时,Microsoft Office SharePoint Server 2007中的企业搜索服务能够帮助企业员工迅速对各种非结构化信息进行搜索。企业员工能够使用基于元数据,或者用全文检索的方式查找到自己所需的信息和数据,而SharePoint内置的安全过滤机制保证了每个员工都只能检索到自己有权限查看的信息,以避免企业敏感信息的泄漏。
配合有效的管理和强大的搜索能力,企业员工就可以将企业中的非结构化信息作为一种有价值的资源,随时加以利用,让它们能够帮助企业员工更快速、明智地做出商业决策。(微软 涂曙光 吴龙)
对BI如何正确定义
如果按照狭义的BI定义,也就是我们对BI概念传统的理解,它是指用数理统计学的方式对我们现有的数据进行综合统计分析,找出规律性的东西,以辅助我们决策。在这种定义下,一般用的就是结构化的数据。事实上,目前流行的BI分析工具,比如BO、Cognos、BRIO、Microstratige、Hyperion、SaaS、SPSS等,都是针对结构化数据做的。
如果按照广义的BI定义,也就是从BI泛指用计算机辅助人进行信息处理的角度讲,它就不一定是只处理结构化的数据,还可以处理非结构化的数据。有些情况下,BI可以分析非结构化的数据,如针对Word文档或网页搜索到的字的频率等。再比如一些特殊的应用,例如分析奥运场馆,比如鸟巢在发生突发安全事件后人员如何疏散的问题,采用特殊的数学模型来模拟各点起火时的情况,就是一个典型的BI应用,而且分析的数据绝对是非结构化的。还有例如涉及语音和图像识别这样的应用,它们处理的也不是结构化的数据。
目前企业ERP系统中都是结构化数据。双汇BI系统中的数据都是结构化的。我们把ERP系统里面的数据提炼出来,形成一个多维数据仓库,用一个BI工具进行分析,并实时在线直观地展现给管理者。如果管理者要看预算完成情况或者计划的利润实现情况,可以点开相应的页面查看,这时系统把当前的利润数据展示出来,并与预算值进行比较。如果数值是在计划范围内,就显示为绿色;如果超出正常范围,就会显示为黄色或红色。管理者看到这种不正常的数值,就可以直接知道企业运行出了问题,他就可以从这个数据点进去,查看具体出问题的地方。
也会有更深入的层次应用例子,比如系统可能显示出其他各个事业部的运行指标都在正常范围内,只有物流事业部的指标出现了黄色或红色。于是使用者再点击物流事业部,系统就展示出它下面又有哪几个部门,是哪个部门出了问题。这样一层一层一直“钻取”到问题发生的最终根源所在。这就是一种很直观的BI应用,它给使用者提供的不是枯燥的数据,而是一些形象生动的分析结果。 (双汇集团CIO 刘小兵)
伪BI之二:BI只能分析静态信息
其实对企业真正有用的是一些实时的信息采集和分析,企业根据这些信息才能做出及时的决策。
静态+近实时
“BI只能分析静态的信息”是对BI比较片面的认识,看到的是BI在实际商业应用中的表面现象。因为多数企业实施的BI系统,给用户使用的数据信息确实是相对静态的、按照一定时间规则进行更新的信息,但这并不代表BI只能分析静态的信息,实际上BI整个的系统架构是可以分析实时信息的。
那么,为什么这么多企业实施BI不选择进行实时信息分析的方式呢?
主要有以下两个原因:一是管理分析的具体要求,二是企业信息系统现状及系统投资成本。
管理分析的具体要求
企业内部不同层级的BI用户,对信息分析的实时程度要求是不相同的,基本体现为从基层人员到中层人员到高层人员逐步弱化。当然,也不排除中层和高层在某些信息分析领域有较高实时性的要求,比如对库存的关注等。由于BI中各层级人员信息分析需求的特点不同,在详细的BI设计中就需要充分考虑不同层级人员在具体信息分析上实时性要求的差异,这些将直接决定BI中各个业务分析主题的合理安排和ETL(Extract-Transform-Load)对数据进行抽取、清洗、加载、转换的策略和具体规则。
企业信息系统现状及系统投资成本
由于各个企业在实施BI时的信息化环境或信息系统建设的方式不同,导致BI在实施的进程中解决信息分析的阶段性内容不同,进而导致BI在对信息分析采取静态信息分析还是实时信息分析的策略选择上不同,且付出的成本不同。
一种策略是单一系统,简单分析主题需求的情况,可以采取实时分析的构建方式。如果用户使用的是单一的系统,所有信息都在一个业务数据库中,面临的是一些简单的分析需求,不需要BI系统进行复杂的数据计算和转换过程。这类BI的设计过程相对简单,一次生成业务系统中BI需要的分析信息,通过BI前端展现工具进行访问展现即可。
另一种策略是多系统、复杂分析主题需求的情况,可以采取静态分析或者静态加近实时的组合构建方式。如果用户的数据信息来源于多个系统的综合体现,需要BI进行复杂的计算和加工才能呈现给用户使用,如果用户对实时性要求不高,则可以采取定时更新的方式来静态展示信息。如果用户确实存在一些时效性要求比较高的信息分析需求,可以将这一类需求单独建立一个主题进行处理,并匹配可调整的ETL机制来保障数据信息处理的时效性。但一般企业不会花高成本去建立完全实时的BI主题,采取的方式为近实时的方式,如对于库存数据的更新每小时一次。
评论列表
|
||||||

