我国高校图书管理中的数据挖掘平台建设

摘 要 :随着我国高校图书情报管理的日益信息化和国际化,基于信息技术的现代管理系统开始深入高校图书馆的日常管理活动中,尤其是对信息对象、管理人员和高校读者的整个流程管理中开始应用的数据挖掘技术平台,突显其资源活化与整合的综合功效.本文正是基于这样一个研究背景,展开对高校图书馆应用数据挖掘技术,搭建实用便捷的数据挖掘平台,深化图书馆管理创新这一整体研究.我国高校图书馆的管理创新关键是基于数据挖掘平台,我们研究得出这一平台的四大功能模块,其核心理念是客户关系管理(CRM),关键是贯穿整个流程的技术实现.它将使我国高校图书馆的管理步入全新的开放型、国际化和个性化运转轨道.

关 键 词 :图书馆管理数据挖掘技术信息化

中图分类号:G250 文献标识码:A文章编号:1007-9416(2012)03-0000-00

信息化环境下我国高校图书馆的图书资源管理必须藉由信息技术手段由传统图书馆向数字化、网络化图书馆转变,由馆藏文献资源建设向网络信息资源建设转变,由传统文献传递服务向网络信息导航服务转变,由封闭的办馆模式向开放的社会化办馆模式转变,为此,图书馆管理中的信息技术平台建设关系到图书馆在高等人才培养中的功能实现及其教育地位.其中,优化图书馆的信息管理,采用新型信息管理技术就显得十分关键.本文利用数据挖掘技术就图书馆的资源信息管理及其个性化发现等信息化管理平台建设进行分析,旨在推动我国高校图书馆信息化管理的有效转型.

1.相关背景研究

1.1高校图书资料管理中的数据挖掘现状及面临的问题

近年来,我国高校图书馆管理中利用数据挖掘技术主要做了三个方面的创新性工作:其一,在文献信息管理中的应用.传统的图书信息采集多由专门采访人员独自确定,或采纳学科专家的意见,不可避免地带有极大的主观性以及个人喜好.同时,图书馆每年的文献购置费是有限的,各门学科之间如何分配,各种文献载体形式如何均衡才能使有限的文献购置经费发挥最大的效益,对于这些问题数据挖掘技术提供了较好的解决方案.如利用数据挖掘中的供求关系动态图找出图书类别与借阅次数的对应关系,对借阅量的大小进行分析进而确定新的购书目录及其数量.其二,在信息服务中的应用.随着网络技术、计算机技术的广泛应用,图书馆服务模式由以往等着读者上门改为主动为读者服务,由以往单纯图书文献形式的信息呈现转为依靠新技术的信息生成,具体包括四类服务创新模式:信息检索服务;定题与查新服务;信息分析服务;个性化服务.其三,在人员管理上的应用.新时代读者对图书馆的需求不仅仅局限于简单层次上的信息查询与反馈,而是要求图书馆员提供附加值大的信息产品,因此图书馆必须加强对工作人员的管理.在对职工兴趣、资历等信息分析的基础上,成立多个有特色的专业小组,激发馆员的工作和学习热情,为馆员提供信息交流平台,不断提高馆员的业务能力,为读者提供个性化服务.与此同时,利用数据挖掘中的一些技术,如统计回归、逻辑回归、决策树、神经网络等,揭示用户的行为习惯、兴趣爱好,将用户感兴趣的内容与服务系统结合在一起,为每个用户提供主动的个性化的服务,提高图书文献的利用效率.

当然,在利用数据挖掘技术实施图书管理创新方面仍存在着以下一些亟待解决的问题:首先,网站建设中利用数据挖掘技术设计不合理,致使读者利用图书馆网站获取信息资源的功能实现上存在着人为的障碍,影响了用户使用的便利性和实效性.其次,个性化服务程度不高,智能化服务内容不多.对于大多数高校图书馆线上资源管理来说,不能根据用户个人的具体需要提供高质量的、系统的信息服务,即不能全面客观地分析用户的信息需求,对各种信息资源进行过滤,把用户所需要的个性化的精品信息资源提供给用户.最后,信息孤岛现象比较明显.信息孤岛是指在社会信息化过程中,由于信息系统、软件系统、数据库之间关联性差,难于互联、互通和互操作的弊端,造成数据共享性差,信息难以融合贯通,无法实现业务协作,系统效率低,而无法真正实现信息化的问题.当前,各高校图馆部保存有大量的数字化资源,诸如馆藏书目数据库、全文期刊数据库、学位论文库、会议记录库等.然而,它们的存储和读取方式不尽相同:有些以数据库形式存放;有些以文件形式保存.读者在使用时,需要用各自数据库不同的用户名和来登录系统,并以各自专有的客户端检索界面进行数据读取和检索.这就需要图书馆用户进行反复的登录,通过适应千变万化的检索界面和要求,来获取相应的数据资源.

1.2数据挖掘技术及其应用进展

上世纪90年代以来,随着信息技术的飞速发展,海量繁杂的数据使管理组织日益感受到这些业务数据中蕴涵着丰富的有价值的知识,如何充分发掘出这些知识会对管理组织产生巨大的实时管理效益.因此,数据挖掘作为知识发现领域中的一个核心技术一直是众多学者研究的热点.数据挖掘包括了分类、聚类、关联规则、序列模式等几个类别机器学习算法.在国外,数据挖掘已经在金融、保险、医疗、电信等许多行业投入应用.在国内,也产生了很多数据挖掘技术的理论,但数据挖掘软件的实际应用则刚刚起步.随着互联网的普及以及 Web技术的不断成熟,面向服务的体系结构(service oriented architecture-SOA)成为近年来软件模式研究领域的一个新热点.Gartner的最新报告显示,2006年有 6 0 %以上的组织考虑以SOA为指导原则来设计关键任务应用和流程,到2008年SOA为 8 0 %的新管理项目提供实施基础.目前,市场上已有很多流行的数据挖掘软件,主要为国外产品,如SAS Enterprise Miner、SPSS的Clementine以及IBM的Intelligent Miner等.这些数据挖掘软件基本均为用户提供了一些经典的和部分自行研究的数据挖掘算法,但在数据预处理和结果可视化方面提供的功能则较为有限.这样一来,用户要使用这些数据挖掘软件,往往要借助其他工具和方法完成大量的数据预处理工作.更值得关注的是,出于竞争等多方面原因,这些商业数据挖掘软件内部功能模块之间基本都是紧耦合关系.每个算法与其分析结果的可视化功能紧紧绑定在一起,没有向用户提供调用接口,用户除了接受软件厂商制定的所有使用规则外别无选择.这些软件也不会为用户提供功能的扩展接口.用户只能使用现有的算法,无法通过增添其他算法来扩展软件功能,也不可能在几种软件之间进行功能的优化重组.因此,如何设计一个松散耦合的、支持功能模块的重用和优化重组且容易扩展的数据挖掘平台成为一个值得研究的问题.


1.3面向服务的数据挖掘平台

面向服务的数据挖掘平台(service oriented data mining platform-SODMP)其概念模型如图1所示,主要由DM应用、DM服务、DM服务三部分组成.DM应用包括了各种具体的数据挖掘应用项,是服务的请求者角色;DM服务包括了各种服务的调度、目录维护和管理,充当服务的中间角色;DM服务提供了各种所需的功能服务,是服务的提供者.SODMP平台通过使用服务,实现了服务请求者与服务提供者间的分离,同时也实现了两者在调用关系上的松散耦合.这种松散耦合对数据挖掘流程中各部分功能的重用、优化和扩展有着非同寻常的意义:

首先,对DM应用而言,新应用的创建部署不再需要全部重写分析算法,只需向服务发出关于请求服务的描述,最大程度地使用现有的服务,因而,应用扩展变得简单方便.此外,可能有多个服务单元提供相同的服务,当某一服务单元出现功能故障时,可以调度其他的服务单元来替换,使服务变得更加可靠.

其次,对DM服务而言,同一个服务模块可以同时为多个应用提供服务,大大提高了功能的重用程度和软件的利用率;同时,只要遵循统一的接口标准,新的服务项可以方便地添加到平台中,使平台的功能可以方便地扩展.另外,不同阶段(如预处理阶段、分析阶段和可视化阶段)的服务还可以自由组合,实现资源的优化重组.

2.图书馆的数据挖掘平台设计及其应用检验

数字图书馆知识服务的实质是数据挖掘,利用统计分析、关联规则、决策树、神经网络技术、遗传算法、聚类等高级计算处理程序,从大量的、噪声的、随机的数据中发掘出隐含的、新颖的、未知的、有潜在价值的知识,并将知识挖掘结果以图表、三维立体图形、决策树、文本形式等直观地提供给专业用户.数字图书馆承载着海量信息资源,蕴涵着无限的知识瑰宝,为实现数字图书馆方便、快捷地为用户提供知识服务:计算机协助人脑智能化知识推送;高速、透明的知识整合,必须借助现代化技术工具,创建先进的知识服务技术平台, 提供强大的技术支撑势在必行.根据我国高校图书馆信息化管理现状及其存在的问题,基于四个方面的面向服务的数据挖掘平台结构能够较好满足今后高校图书馆的信息化管理任务.

面向服务的数据挖掘平台设计主要包括四大模块:DM应用;DM服务;DM服务;操作系统接口.SODMP平台的设计方案通过使用数据挖掘服务,从结构上实现了数据挖掘服务的使用者与提供者之间的松散耦合,有效地支持了数据挖掘软件功能的开放性、可重用性和可扩展性(见图2).

近年来,通过部分高校图书馆应用数据挖掘技术平台的实施,其功能检验得到确定并有效服务于广大的师生用户.具体来说,其主要得到检验的功能及其解决问题的方案体现为如下几个方面:

第一,统计分析实效性强.借助数学模型进行归纳、推断、预测,如回归分析,揭示自变量与因变量的关系,预测各种条件下实现目标的期望值;与时间有关的统计分析有时间序列分析、周期分析、趋势分析等可预测事件的未来目标或已发生事件随时间变化的内在规律, 另外还有K――平均值算法、贝叶斯分类等统计技术.这些统计技术的应用极大地提高了高校图书馆的客户高校管理(CRM)效率,使信息化操作流程敏捷化.

第二,知识发现功能强大.知识发现技术KDD(Knowledge Discover in Database)克服了统计分析不能自行发掘知识,只能对数字化的数据进行挖掘的缺陷.利用决策树、神经网络技术、遗传算法、粗糙集技术进行知识挖掘,如神经网络技术模拟人脑的学习、识别、技艺、归纳功能,解决高复杂度问题.这些年来我国高校图书馆的知识管理得以实现,主要得益于上述知识发现技术的有效应用,大大提高了与教学、科研互动的能力.

第三,有效解决信息孤岛问题.随着与日俱增的读者需求与科研需要,图书馆迫切需要消除“信息孤岛”问题,使各个数据库的应用既相互独立又能有效协同合作,将不同的资源、功能集成到一个完整的企业级信息化环境中.把SOA应用到数字图书馆建设之中,已经成为研究的一个热点.SOA是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口和契约联系起来.实现系统之间的整合与协同.Web服务和SOA的本质思路在于使得信息系统个体在能够沟通的基础上形成协同工作.在图书馆的应用中,其资源和服务的异构性决定了SOA技术将获得极大的施展空间.通过实现SOA,可以带来大量好处,包括(1)松散耦合的组件和系统;(2)基于网络的基础设施,允许分散于各地且采用不同技术的资源协同工作;(3)动态构建的按需应用程序;(4)更好地使图书馆内的流程标准化;(5)更易于实现图书馆的集中控制.

类似论文

高校财务管理信息发布与查询平台建设

摘 要:构建高校财务管理信息发布与查询平台,是解决高校财务管理信息不对称的重要手段,有助于学校财务管理的透明度和公。
更新日期:2024-3-16 浏览量:46205 点赞量:11476

我国高校行政管理现状

【摘 要】随着我国高等教育管理体制改革的深化,高校内部管理体制表现出许多的问题,面对新形势和新要求,作为高校。
更新日期:2024-5-14 浏览量:67752 点赞量:15026

我国高校绩效管理

摘 要:本文在对高校绩效管理具有的重要意义进行研究的基础上,深入研究了绩效管理的作用、内容等,&。
更新日期:2024-4-15 浏览量:54934 点赞量:12228

我国高校教育管理的去行政化改革

摘 要我国高校的行政化管理体制是计划经济体制的产物,高校管理的行政化违背了教育发展规律,禁锢着高校应有的新思。
更新日期:2024-12-14 浏览量:155834 点赞量:33515

我国高校工商管理专业的人才素质与培养

摘 要:新时期教育事业不断发展,同时国民经济生产总值增长迅速,科学技术以及市场经济的发展更具活力 繁荣发展的市场经。
更新日期:2024-10-15 浏览量:132491 点赞量:29107

我国高校学位管理存在的问题其

摘 要:学位管理是一种与学生利益关系极为密切的管理行为 近年来,高校学位纠纷时有发生,学位管理存&。
更新日期:2024-8-25 浏览量:107540 点赞量:23568

我国高校工商管理教育存在的问题

摘 要:随着经济全球化及我国成功加入WTO,我国企业不仅面临着国内市场的竞争,还将面对国际市场的竞争,这将致使企业之间。
更新日期:2024-10-15 浏览量:131311 点赞量:28518