正在加载数据...
首页 视频 专题 方案 案例 原创 博客 论坛
您的当前位置:首页  >> 应用  >> BI  >> 实施

商务智能技术在组织机构的应用

2008-09-05作者:安茂香 来源:万方数据

导读:随着计算机和网络通讯技术的发展,网络化组织机构代码信息系统已经建立起来,并在海关、银行、税务、统计等领域取得了可喜的社会效益。随着代码数据的不断积累,如何从现有的数据中发现对于经济社会发展更具指导价值的信息就成为所要研究的一个课题。

    0 引言
    
    随着计算机和网络通讯技术的发展,网络化组织机构代码信息系统已经建立起来,并在海关、银行、税务、统计等领域取得了可喜的社会效益。随着代码数据的不断积累,如何从现有的数据中发现对于经济社会发展更具指导价值的信息就成为所要研究的一个课题。
  
    商务智能是近十多年来运用数据仓库技术发展起来的海量数据分析技术。它能够使用户从大量不同来源的数据中挖掘信息、发现问题、寻找机会,以帮助管理者作出及时、科学、正确的决策,提高决策的效率和质量。
   
    本文基于oracle公司的商务智能产品,介绍商务智能技术及其在组织机构代码中的应用。
    
    1针对组织机构代码的商务智能系统实施中考虑的几个方面

    
    1.1充分发挥组织机构代码在信息共享中的作用
   
    虽然商务智能系统的主要对象是高级分析人员和决策人员,但由于其查询的高效性和展现工具的方便性,它可以满足不同用户对数据查询的不同需求,所以针对组织机构代码的商务智能系统将成为众多管理人员和决策人员的信息中心。如:公、检、法利用该系统可以更有效地采集信息并有的放矢地打击犯罪,保障社会的安全稳定;外贸、海关等部门,可更高效地解决进出口贸易问题,改善我国投资环境,吸引外资投人建设;财、税、金、贸的有关部门可更好地加强联合监管,防止偷税、漏税及金融诈骗等,保障国家财政收人、减少税收流失、防范金融危机。
   
    1.2MOLAP还是ROLAP
   
    MOLAP和ROLAP在技术上各有优缺点
   
    MOLAP是专为OLAP设计的,能够自动地建立索引,有良好的预计算能力,支持高性能的决策支持计算;但MOLAP在多维数据库建立之后,如果要增加新的维度,则多维数据库通常需要重新建立;当数据频繁变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引,乃至重构多维数据库。
   
    OLAP建立在传统关系型数据库技术之上,在存储容量上基本没有限制;如果要增加新的维度,OLAP只是增加一张维表并修改事实表,对于维度的变更有很好的适应性;当数据频繁变化时,设计者可根据需求使其生成所需的综合数据,因而对数据变化的适应性高;另外关系型数据库已经在众多的软硬件平台上成功地运行,即ROLAP对软硬件平台的适应性很好,并且熟悉关系型数据库的人员可以很快的掌握ROLAP的操作,客户培训的工作量相对要少。
   
    就本文研究的系统而言,每年各地区新增加的组织机构数量是相当可观的,并且目前的组织机构代码管理信息系统建立在关系型数据库之上,因此我们选择OLAPO
   
    1.3产品选型时的考虑
   
    甚IBM, Oracle,Microsoft和SAS等公司相继推出自己的商务智能解决方案,其中有的公司产品线很全,有的公司仅在部分领域有自己的产品,不能提供构建商务智能系统的全部工具。这些产品各有特点、各有优势,面向的应用层面、应用规模、客户群体各不相同。
   
    我们选择产品时有两种策略。一种是每一部分都选最优的,即便它们来自不同的厂家;另一种策略是选择一家产品线齐全的厂家。后一种策略的优点是各个部分集成性好,实施风险小,缺点是某部分产品也许不是目前最好的。我们选择后一种策略,主要原因是集成性是我们选择产品时优先考虑的因素,且Oracle公司提供的商务智能方案能很好地满足我们的需求。
    
    2系统分析与设计

    
    在众多的数据特征中,组织机构的机构类型、经济类型、所从事的经济行业、所在的行政区划等信息是查询组织机构代码信息所重点关注的,因此我们把组织机构的这几个属性确定为数据分析的几个基本变数,以提高数据分析的效率。
   
    数据仓库采用的结构形式为常用的星型模式。
   
    其含义分别是:组织机构的代码、机构类型、经济类型、经济行业、行政区划、组织机构成立的时间。
   
    设计如下:组织机构代码维,包括:组织机构代码、机构名称、法人代表、主要产品、注册号、注册资金、主管部门、规模、货币种类、外方投资国别或地区、职工人数、作废日期等组织机构代码的详细信息。
   
    time: 时间维,层次结构为年、季度、月、周、日。
   
    ogtype 、维 :机构类型维,层次结构为机构类型大类(包括企业、事业、社团、机关和其它)和机构类型小类(包括企业法人、企业非法人、事业法人、事业非法人、社团法人、社团非法人、机关法人、机关非法人、民办非企业单位、个体、工会法人、其他)。
   
    ecotype维 :经济类型维,层次结构为经济类型大类和经济类型小类。
   
    ecotrade维:经济行业维,层次结构为经济行业门类、经济行业大类、经济行业中类、经济行业小类。
    Zone维:行政区划维,层次结构为中外、中央直属否、省(市)、地(市)、街道镇乡、村(居)委会。
    
    3系统实现
    
    3.1创建数据仓库
   
    在oracle 9i中创建数据仓库的方法有:使用CREATE DATABASE 语句; 使用DatabaseConfiguration Assistant向导。为创建数据仓库而新建的数据库名称为ogcode(o rganizationsco de)。
   
    为保证控制文件的安全,避免单点错误的危险,使用了多路控制文件。在多路状态下,oracle更新文件的时间会稍微变长,但为系统带来的安全性价比是值得的。
   
    3.2从数据源提取和加载数据
   
    源数据主要是新旧组织机构代码信息数据库中的数据和各种国家分类标准。
   
    针对数据的提取和加载,oracle提供了多种工具:OWB,SQLLDR ,IMP等。其中OWB是一集成环境,包括:数据建模、数据抽取、数据转移和装载、元数据的管理等功能,并可以在OWB中制定自动化数据加载流程,以实现数据仓库数据的定期自动更新。
   
    从数据源提取和加载数据过程中需要考虑的问题如下:
   
    (1)数据提取。数据仓库通常按照分析的主题组织数据,从数据仓库的角度看,并不是源数据库中的所有数据都是必需的,我们只需提取出系统分析所必需的那部分数据。如对于本系统,操作员的数据就没有必要放进数据仓库。
   
    (2)数据变换。数据仓库的数据往往来自一个或多个异构的数据库系统,如第二代组织机构代码管理信息系统基于Foxbase/Foxpro,第三代组织机构代码管理信息系统基于SQL-Server/oracle;这些数据源提供的数据类型不同,需要把不同格式的数据转换成统一的数据格式。另外,不同系统还存在同一属性使用不同的书写格式和数据类型、同一属性采用不同名称和测量单位、不同的编码方式等问题。通过数据变换能够使数据具有正确的取值范围、统一的格式、相同的编码方式和语义。这些工作可视具体情况在不同的阶段处理,如可以在数据提取时进行转换,也可以在数据加载时进行转换。
   
    (3)数据清洗。组织机构代码已经在外经贸、海关、银行、税务、统计、劳动和社会保障、国有资产管理等部门得到了应用。基于商务智能技术的组织机构代码在今后社会发展中的应用会更为广泛,而代码广泛应用的前提就是要保证数据的质量。数据的质量是商务智能系统的基础,而数据在进人数据仓库之前大都存在错误,因此有必要在数据进人数据仓库之前进行清洗。所谓“清洗”就是把错误的、不一致的以及冗余的数据在进人数据仓库之前予以更正或删除。本系统进行数据清洗时主要处理的问题如下:
   
    ①逻辑错误:如第二代身份证号位数不够或年月日存在逻辑错误;办证日期、作废日期、变更日期三者之间存在逻辑错误;外方投资国别与经济类型之间存在逻辑错误;注册号错误等。
   
    ②数据遗漏:在第二代织机构代码管理信息系统的16个代码信息项中,只有机构代码、机构名称、机构地址等9个信息项为软件监控必录项,业务范围、批准机构名称、注册号等7个信息项为人工监控必录项;而第三代网络化组织机构代码管理信息系统在原系统基础上又增加了新的必录项,如法人代表(负责人)、成立日期、主要产品、注册资金、货币种类、外方投资国别或地区、职工人数、作废日期等,这样就会造成很多数据空缺。
   
    ③重复记录的匹配和合并:也被称为对象标识问题和重复记录清除问题。代码工作已在全国范围实现了网络化管理,从技术上杜绝了重、错码现象的产生,造成重名重码的主要原因是第一、二代的单机环境所致。如联网前已经手工赋出的代码又由机器重新赋出;有的单位名称变更,前来办证的人员不主动说明情况,工作人员也没有按照常规在计算机中查询此单位是否办过代码证,而按新办处理,造成一个单位两个代码。
   
    (4)添加附加字段。数据清洗后,还可以添加一些附加字段。对于数据仓库记录来说,有用的附加字段包括:添加记录时的日期、最近更新日期、状态标志。
   
    本系统添加的字段有:最近更新日期、状态标志(用以标识某代码是正在使用还是已经撤销)。
   
    3.3数据挖掘和数据分析
   
    数据经过转换清洗加载到数据仓库后,就可以利用数据分析工具对数据进行分析了。
   
    Oracle提供了多种数据分析工具,其中Discoveerr是一个直观的即席查询、浏览、报表输出和Web信息发布工具;ODM (Oracle Data Mining)是一个功能强大的数据挖掘工具,包括分类、聚类、关联规则等功能,能够帮助数据分析人员挖掘数据,发现有价值的隐藏信息和模式,其前端工具是Oracle Data Minero
  
    通过Oracle提供的数据分析工具,可从多侧面、多角度查询和分析各种类型组织机构分布状况及发展趋势等情况;计划部门可通过本系统了解各种类型组织机构在本地区分布情况以便对经济进行宏观调控;税收部门可通过本系统了解各行业在本地区分布情况以便有效防止偷税漏税;银行在开户结算等过程中,可以更有效杜绝多头开户;商务组织机构代码分配部门可通过本系统预测下一年各地区组织机构的规模以便为下一年代码发放工作做好规划等等。
    
    4结束语
    
    在传统的组织机构代码管理信息系统数据库中,由于不存在多层次的数据,不能为决策者的分析提供全局性的知识,得到的往往只是一个单一的结论。这些问题在商务智能技术中能得到有效的改善。在传统的组织机构代码信息数据库基础上应用商务智能,能为决策者提供一个更清晰的视野,将更有助于提高政府管理和服务社会的整体效能。
 

评论列表

用户名:
密码:
匿名发表
Jason Uppal:总体架构的框架TOGAF
∷行业
政府旅游烟草纺织
电信钢铁零售出版
新闻邮政物流造纸
矿业军事冶金医药
家具食品服装建筑
航空农业煤炭医疗
石油教育交通金融
房产电子电力贸易
化工汽车机械
∷应用
OAOA咨询天地咨询天地销售管理销售管理
DCSDCS开源软件开源软件集团管控集团管控
协同应用协同应用企业门户企业门户人力资源人力资源
财务管理财务管理EAMEAM电子政务电子政务
CADCAD移动商务移动商务竞争情报竞争情报
GISGISMISMISMESMES
SaaSSaaS电子商务电子商务中小企业中小企业
BPMBPMPDMPDMBIBI
KMKMCRMCRMSCMSCM
ERPERP
∷基础设施
RFID数据库实用技巧
WEB服务安全语音
网格开源视频
存储网络通信虚拟化
中间件SOA服务器
zol企业信息化 51cto 赛迪网信息化 比特网 希赛信息化 MBT杂志 搜讯网 IT168信息化 E-works CNET科技资讯 E制造
IT专家网 中计在线 中国网联网 eNET信息化 ERPworld.net 信息周刊 支点网 环球财富网 信息中国 中国制造业信息化杂志社 畅享网
任务中国 三好在线 网界网 IT商网 CSDN CuteSEO 中国软件网 中国信息产业网 更多>>  
 关于我们 版权声明 广告服务欢迎合作友情链接联系我们诚聘英才  
Copyright © 2004 CIO时代网 版权所有
京ICP证030336号
本网站服务器由北京联通IDC提供