第1篇:分析科技人才数据库建设的现状论文
分析科技人才数据库建设的现状论文
当前,广东省经济发展已经进入新常态,实现经济可持续健康发展,根本途径是要走创新驱动发展的路子,人才是科技创新的关键,创新型科技人才更是实施创新驱动发展的中坚力量。建立一个结构优化、技术先进、信息完整的创新型科技人才数据库,对于合理使用和配置我省各地科技人才资源,释放科技人才队伍效能,提供科技人才服务水平,智力支撑广东创新发展具有十分重要的意义。
1.广东省科技人才数据库建设现状概况
目前广东省初步形成了政府、高校、院所、科技企业和中介机构等多方参与科技人才信息资源建设的格局。如省科技厅、地市科技局依托科技计划建立了各类项目评审和课题专家信息库;省内各高等学校及科研院所以本单位科研人员为主体的系统内部专家库;还有中介服务公司面向市场的科技人才数据库,如广东科技人才网等。而当中最具代表性、最权威、最全面的科技人才数据库,则是广东省科技厅建设的“广东科技咨询专家库”。这是我们重构“广东省科技人才数据库”的核心资源。
总体看我省科技人才数据库建设存在多种问题:如各单位独立建库,无法全面把握省科技人才信息与发展趋势,不能为科技人才资源的开发和优化配置提供有效支撑;欠缺区域协调联动、行业协调联动、部门协调联动等;各方共享信息程度低,信息资源的开发利用率低等。当中最突出的是各个人才库间缺乏统一的数据标准规范,这对于数据的共享交换产生很大的障碍。
2.“广东省科技人才数据库”建设规划的总体思路和目标
上文我们多次使用了“广东省科技人才数据库”这一名词,在大多数情况下,它只是个泛称,即在广东省内建设的拥有科技人才信息的数据库。它们的名字各异、用途差别、单位不同,唯一的共同点就是都以科技人才为数据采纳的对象或对象之一。但此处要提出的“广东省科技人才数据库”则是一个专称,特指本文规划的面向全省各相关单位及公众使用的和实现科技人才信息采集、管理、使用、开发全链条功能的以及能够代表整个广东省科技人才信息管理水平的科技人才数据库。可以说,这是一个“重构”的数据,即集合我省目前已有的各类科技人才数据库的信息资源和建设基础,重新规划、重新设计的一个更完备、更先进、更开放的科技人才库;也可以说这是我省一个“总的”科技人才数据库,从规模、功能、层次上它是唯一的,它涵括已有各类科技人才数据库的所有信息资源,功能更完备,使用更方便,技术更先进,可完全替代已有的任何一个科技人才数据库。
总体的规划思路是要整合我省现有分布在各系统、各单位、各地市的科技人才库资源,解决其各自为政、重复建设、标准不一、类型单一、共享不足等问题,同时能具有前瞻性、长远性、实用性能支撑我省科技人才服务的未来发展,引领我省在创新发展中引才用才的新方向,这就必须要运用新思维、新技术来构建我省全新的科技人才数据库系统。本文提出要将科技人才数据库的建设纳入电子政务的范畴,同时应用云计算、大数据等技术模式创新科技人才库的建设和运作。革新原有科技人才库的性质和功能,按照“物理分散、逻辑集中”和“资源整合、集约建设”的要求,统筹建设“广东省科技人才数据库”(包括广东省科技人才数据中心和科技人才信息资源共享交换平台),实现各业务应用系统之间、各区域之间、各部门之间、及其3者与统一的协同工作平台之间,与公共数据中心之间的高效链接与信息资源交换。科技人才数据资源库根据实际需求实行“分布与集中”相结合的方式建设,业务性、专业性的数据库实行分布建设,各主体按需要有条件共享,通用性、基础性的数据库则集中建设,各主体共享;充分利用已有的网络基础、业务应用系统、各类资源和信息技术为实现我省科技人才数据库流程再造提供支撑;通过加强信息资源整合与信息公开,实现信息共享、透明与互联互通,提升各部门之间、各业务应用系统、各区域与其他社会主体之间沟通协调的能力,形成网络化协同办公环境,并面向全社会提供科技人才信息共享的电子化服务,实现“大科技咨询”的首要业务功能和全省一盘棋的科技人才信息收集、管理、使用、开发的全链条基础应用。
“广东省科技人才数据库”要实现的主要目标概括如下:
2.1 —个真正涵盖广东所有科技人才信息的数据库
其实目前我省现有的各类科技人才数据库,收录的科技人才基本都是我省各科研单位的高层次科技人才。而“广东省科技人才数据库”要收录的科技人才范围将更大,只要是在广东工作的,进行创新创业相关事业的,或潜在性能引进到广东的科技人才,如省外人才、海外人才等都包括在内。他们或许信息采集的标准不一样,因为如工作单位在广东的科技人才,获取的信息将更为全面,而其他工作单位不在广东而又在广东从事相关事业的科技人才,获取的信息将有所收窄。但“广东省科技人才数据库”必须有这样的“胸怀”,“不为所有,但为所用”,让每一个在广东工作过的科技人才都能以“入库”的形式找到归属感,获得重视,并且能进入我省相关政府部门的“视野”,为广东的自主创新发挥力量。
2.2 一个真正实现“大科技咨询,的科技人才数据库
目前我省大多数科技人才数据库其实是科技专家库,主要功能还是为了政府部门的`项目管理做“咨询”,例如立项评审、结题验收的专家遴选等,真正为政府部门相关政策战略制定进行调研、分析、研究、预测比例偏少,而更大层面上为企业、相关组织及社会公众提供智力服务,更是凤毛麟角。“广东省科技人才数据库”就要真正实现以上所有功能,具体来说,它除了包括广东省科技人才数据中心和科技人才信息资源共享交换平台外,还有一个直接面向公众使用的站,以多种业务功能为政府部门及相关管理单位以外的企业、社会公众提供“科技咨询”服务,库内的科技人才能“一对一”的面向公众进行沟通交流。“广东省科技人才数据库”能真正成为广东创新驱动发展的“智囊”和“助推器”,智力支撑我省“大众创新、万众创业”。
2.3 一个真正有数据挖掘价值的科技人才数据库
能做到有数据挖掘价值的前提,“广东省科技人才数据库”必须拥有海量的数据,并且数据持续更新,动态发展。以原有的人才信息收集模式和标准,即使科技人才的入库范围进一步扩大,也谈不上海量的信息。所以重构后的“广东省科技人才数据库”和原有的相关人才数据库模式并不一样,对于每一个入库的科技人才,其相关个人信息和科研信息是动态抓取的,譬如一个专家近期参加了一个什么学术会议,发表了一篇什么学术文章等都可以从互联网上搜集到相关信息,并且进行甄别和清洗,最后更新汇总到他的个人信息当中。甚至引入“社会网络可视化技术”,能清晰地看到他的科技人脉圈子,和谁共同发表了一篇文章,和谁申报了一个科技项目等,所以信息量是十分巨大的,涵盖了一个科技人才成长、发展的全生命周期,这也是数据挖掘的价值所在,能为我省研究人才培养、人才引进、人才流动提供最宏观又最微观的一手数据。
3.“广东省科技人才数据库”的主要技术运行机制
“广东省科技人才数据库”主要由站、公共数据中心、数据交换平台3部分组成。数据中心和数据交换平台是实现我省科技人才数据库跨部门业务协同、跨地方资源共享和一体化协作,实现全省科技人才数据共享使用的业务流程再造基础平台建设的重要组成部分,实现全省科技人才信息统一管理能力现代化的重要物质基础。而站则是一个在统一标准、规范及管理方针下建立起来的信息共建、共用和共享的网群体系,是一个模块统一、功能集成的科技人才数据站。它需要利用云计算技术,以分布式的管理方式建立横向与纵向的数据供应链,横向数据链包括科技系统、教育系统、各社会机构、企业等发布的数据集,纵向数据链包括省直各部门、21个地市系统等发布的数据集。然后通过数据网为用户的数据利用提供有效的集成服务,与此同时有效消除服务方面的“数据孤岛”和重复建设的问题。
所以要建立有效的数据管理机制:一是需要建立全省科技人才数据管理部门,专门负责数据的管理、审查和发布工作。因为数据来源将涉及众多系统和部门的基础及专业数据的公开使用,要由专门的数据主管对数据使用发布进行严格把关,避免数据信息触及保密、安全、个人隐私等法律问题,同时要监控各主体、各部门发布数据的数量和质量,确保数据发布工作的完整执行,满足公众对科技人才数据的使用需求。二是建立有效的数据管理体系。建立一套有效完整的元数据分类体系,整合数据网上RSS、CSV、Test、XLS、KML、KMZ等多种格式的数据,开发多元的检索工具与应用程序,提升用户查找利用数据的效率,通过强大高效的数据分析技术发挥“大数据”的效能。三是确保数据发布的质量。数据分析技术再强大,没有高质量开放数据也是枉然,要对大数据进行有效分析,提取其隐含的“准确的”“有用的”信息,就必须在数据管理的整个生命周期都要把好质量关,保证数据的准确、完整、有效,才能让其产生价值。
从总体上说,“广东省科技人才数据库”的建设涉及多部门、多区域,所以需要建立跨部门的统筹协调机制,在技术实施过程中要推动信息共享标准的使用;要推动跨部门跨系统标准认证和保持一致性;要提升数据、服务和网络的互操作性;而最重要的是要推动服务共享。因为在电子政务环境下,广东省科技人才数据库的搭建必须使用共享计算模型——“云计算”。在这种模型中,数据中心是统一的,计算机基础设施被用于提供共享服务。通用基础设施上的主机系统和应用、分配了工作负担,减低了对计算性能的要求,减少了总成本。将来,除了共享计算能力以外,可能会通过提供其他能力带来额外的改进,例如共享应用和共享信息服务。因此,各部门和机构可以继续使用现有性能,将目光关注于服务和技术的开发上,来更好地满足部门职能。性能共享将使部门和机构为特定的终端用户提供有针对性的服务,而不是为所有用户尝试性的提供所需的全部性能。这一方法的预期优势包括简化成本、提高效率,以及减少个性化的界面和所需标准的数量。
第2篇:图书馆数据库建设的现状浅论文
图书馆数据库建设的现状浅论文
【摘要】文章通过网络调查方法,以详实的数据阐明目前黑龙江省高校图书馆特色库建设的现状、存在的问题、及相应的建设建议。
【关键词】特色库现状问题建议
随着计算机、信息技术、文字识别技术、检索技术、扫描技术的发展,我国高校依托馆藏信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将本馆特色资源数字化,建立起特色数据库。具有自己鲜明的特色和独创性。所建特色库如果发布上网,形成网络资源,为更多的用户会快捷方便获取系统资源,这对形成资源共享的信息化和整体化无疑是有积极的促进作用的,然而就笔者对黑龙江省所属11个高校所建特色库的网上调查得知,实际的状况不是十分乐观,问题很多,感觉大多数学校的特色库反而不“特”。本文以网络调查的形式,析出存在的问题、叙述现状、并提出发展建议。
1黑龙江省高校特色库建设的现状
高校图书馆已全面启动特色数据库建设,在局部、个别馆取得了一定的进展,各高校能从多方面、多角度开发本馆的特色资源,建立形式多样的数据库,但是,据表一和表二统计数据看出存在的问题也比很多,特色不突出、很少把自己的突出的学科特色和地域特色作为建库的重点,70%以上学校自建的特色库还是处于自建自用的状态,不能被外网访问,没有实现资源共享,纸质文献的数字化没有深入加工,数据更新、维护停滞表现出特色库发展并不是沿着可持续发展势头进步,整体上建设还处于初级阶段,没有形成较为完善的建设体系、共享体系和服务体系。
2图书馆在建设特色库中存在的问题
2.1数据库的学科特色只限于纸本文献的转换,学科、地域特色不够突出
表一显示,被调查特色库48,属于馆藏纸质文献的电子转换、原文献题录的数据库有28个占总数据库的53%,而体现学科特色的仅有15个,占总数的30%,体现地域文化特色和地域经济的只有2个学校建立了地域特色数据库,占学校总数的18%,以建库总数算,体现地域特色的只有5个不到总数的10%,表明,目前数据库的选题还只停留在学位论文、科研成果、学科导航层面,没有把真正体现专业特色、地域特色作为选题的重点。除了齐齐哈尔大学和黑龙江商业大学建立地域经济、文化或抗日的数据库外,其他高校都没有涉猎。
2.2建库的.标准化与规范化较差
通过对能够访问的4所高校调查,特色库建设中存在许多不标准、不规范的问题。经访问得知,建库的标准不够规范,高校自选软件,建库过程都是依据软件自身所带的标准建库,对数据采集、数据加工、数据检索、数据传递、数据交换以及数据维护等标准各异,没有采用的国际标准,建立兼容性强、标准高的数据库。在访问这些数据库时,我们遇到很多问题:由于文本格式不规范,数据下载困难或不能下载;由于检索令不规范,同一系统中出现有多个检索命令;由于标引不规范,文献信息检索经常出现误检、漏检现象等。
2.3数据的深层次加工与后续维护力度不够,数据更新慢
以齐齐哈尔大学为例,文献加工方面:该校的“博、硕士学位论文数据库”等只是纸质文献的数字化转换,数据库停留在一次性建设上,没有深入加工和提供增值服务。
数据更新方面:在被调查的11个数据库中,有7个数据库(有1个数据丢失)从20xx年11月30日到20xx年5月30日数据没有更新,占64%。
后续维护维护与可否使用方面:在对该校11个数据库33次调查中,我们发现数据库没有技术维护、读者不能够点击访问的次数各有15次,占抽查次数的45%,音像数据库数据完全丢失,已无法访问。我们对黑龙江省另3个可访问的高校的抽查也得到近乎一样的结果,(另3个高校的访问登陆太慢,没有列出每次调查数据)许多高校图书馆数据库搭建后,后续建工作停滞,数据更新停止,数据库的维护工作长期以来处于一种相对滞后和缓慢的状态,很多数据库的数据长期处于不可用或不更换的状态。
2.4检索点设置与检索系统不完善
数据库最大的功用在于检索,以齐齐哈尔大学为例,该校使用TPI检索技术,只提供初级检索和二次检索途径,途径单一,我们发现数据库设置的检索点和数据所做的标引并不一致,比如“野生经济植物图片数据库”,数据标引的“形态分布”在检索点上没有设置,没有设计高级检索功能,有个别的自建数据库就根本没有检索功能。
2.5重建轻用现象普遍、数据库联网使用率低
高校图书馆的特色数据库虽然发展的很快,但调查得知,11所高校图书馆上网率不到36%,而实际联通率还要更低,多数高校进行IP网段封锁,外单位用户应用搜索引擎检索很难查询到高校的自建数据库,即使检索得到,绝大多数数据库也没有权限访问,特色数据库仅供校园网用户内部使用。
2.6共享和市场化理念亟待提高
高校图书馆自建特色数据库,其目的是为不具备本地资源的用户提供研究资料,实现资源共享。这是建立特色库的宗旨所在。而大多数图书馆是重藏轻用或者把资源封闭起来,不是积极宣传自己推销自己,投入偌大的人力物力建起的数据库,今供少数人使用,是违背建库初衷的,如何像清华大学的CNKI和中国人民大学的复印报刊资料那样,能够被98%的高校利用,走向市场化,是需要一定的促销手段。
3建议
3.1标准化、规范化
在数据库建设过程应制定和遵循有利于长远发展的标准,主要包括:通信标准(TCP/PI)、码标准、标准通信置标语言/可扩展置标语言(SGML/XML)、元数据(Met标准、检索语言标准、安全标准等。CALIS在特色数据库子项目建设中采用《我国数字图书馆标准规范研究》项目所推荐的一系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准;各高校在建设特色数据库时有必要参照使用。
3.2共建共享
特色数据库的建设不仅要考虑各部门、各系统和各地区的协调,还应该在全国范围内实现合理布局、合作共建。高校图书馆在特色库建设上像过去在合作共建联合采购外文数据库、集团采购CALIS方面那样,在特色数据库建设中的分工建设、统一共享、统一采购软件等。更深层合作共建应次,实现共享
3.3突出特色
高校图书馆在建设数据库中,要集中有重点地开发某一领域或某一品种的数据库,选题必须是在馆藏基础上充地域特色、学科特色、专题特色,表现出独一无二。
3.4深层次加工原始文献
对于有传统馆藏文献转换而来的数据,要在标引,链接上下功夫,让原生态的文献产生多处知网节,以便用户的检索使用。
3.5完善的检索工具
充分吸收成熟而先进的建库技术和完善的检索技术,能适应脱机、光盘、联机和网络检索,直接获取一次文献。多设置检索点,在检索途径上,应初级检索与含有布尔逻辑算符高级检索并行以充分挖掘数据库资源。
3.6适度宣传
特色数据库要立足用户市场,即发挥知识效益也要发挥经济效益,实现以文养文良性发展的数据库发展的道路,关键是做宣传和促销工作,具体的可以采取.网页广告、培训讲座、主动推介等方式推销自己。
3.7数据要及时更新、长期维护实现可持续发展
领导必须重视、统筹安排,全面部署,有一套专业力量队伍,先立项论证,一旦确立,便持之以恒,对于已建成的一定规模的特色数据库,要保证有可靠的数据资源,有专门的人员续建更新数据,也要专业人员后续维护,以保持数据库的正常运作和数据的不断更新,尽,实现特色库的可持续发展。
参考文献
[1]刘杰.对图书馆特色数据库建设的思考[J].牡丹江师范学学报,20xx(5).
[2]韦衣昶.特色馆藏资源的数字化建设[J].大学图书馆学报,20xx,(6).
[3]王盾,张红燕,袁宝财.等特色全文数据库的建立及其在网上的信息服务[J].图书馆理论与实践,20xx(4).
[4]邓晓辉.网络环境下的特色数据库建设[J].图书馆学研究,20xx,(1).
第3篇:图书馆数据库建设的现状浅议论文
图书馆数据库建设的现状浅议论文
【摘要】 文章通过网络调查方法,以详实的数据阐明目前黑龙江省高校图书馆特色库建设的现状、存在的问题、及相应的建设建议。
【关键词】 特色库现状问题建议
随着计算机、信息技术、文字识别技术、检索技术、扫描技术的发展,我国高校依托馆藏信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将本馆特色资源数字化,建立起特色数据库。具有自己鲜明的特色和独创性。所建特色库如果发布上网,形成网络资源,为更多的用户会快捷方便获取系统资源,这对形成资源共享的信息化和整体化无疑是有积极的促进作用的,然而就笔者对黑龙江省所属11个高校所建特色库的网上调查得知,实际的状况不是十分乐观,问题很多,感觉大多数学校的特色库反而不“特”。