知识依赖度约简的论文

精品范文 时间:2023-04-02 07:13:19 收藏本文下载本文

第1篇:关于知识依赖度约简的论文

关于知识依赖度约简的论文

基于知识依赖度约简的知识发现研究

摘要:粗糙集理论中的属性约简问题属于NP难问题。以教育技术学专业读者2013学年度图书借阅历史数据为原型,采用借阅类目的次数多少作为属性重要度进行启发式选择,利用粗糙集理论中的知识依赖度对类目约简,挖掘出本专业和各年级借阅类目的核心集,并经问卷调查证明其规律的正确性。通过与教育技术学专业学科知识体系结构的比较,能够发现学科知识体系结构建设的不足之处,以促进其更科学完善。

关键词:粗糙集;知识依赖度;数据挖掘;知识发现

0 引言

高校图书馆自动化建设经过多年发展,已经积累了大量历史数据,这些数据不但完整,而且质量高,充分反映了读者学习成长的过程。如何对其进行挖掘提炼并从中发现有价值的知识,是了解读者需要、开展知识推送服务的重要信息来源。前人研究主要是根据读者的借阅历史数据,利用关联规则算法发现某类书籍之间的关联规则[14],或利用聚类算法挖掘具有共同阅读兴趣的读者群体[5],以及通过时间流分析得到读者借阅时间的分布规律[6]等。

也可以利用粗糙集进行挖掘。例如,柳炳祥等[7]只是介绍有关理论,文章中并没有对粗造集挖掘进行深入阐述。这些挖掘结果往往只是反映读者已往的借阅规律,而不能反映其当前和今后一段时间的真实需要,因为这些读者还需要不断地进行知识更新和深化学习。本文通过对教育技术学专业读者群进行数据挖掘,利用知识依赖度约简方法发现其学科知识体系结构,并通过与相关专业的知识体系结构建设进行比较,以发现建设中的不足之处。如果利用所得的知识库进行推送服务,则能把读者真正需要的知识推送给他们。

1 粗造集有关理论

粗糙集理论认为“知识是一种对对象进行分类的能力”,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分[8]。

定义1(论域、知识):设U 是感兴趣的对象组成的非空有限集合,称为一个论域。论域U 上的任一子集XU,称为论域U 的一个概念或范畴。论域U 中的任何子集簇(概念簇)称为关于U 的抽象知识,简称知识[9]。在二维表中,知识是由某些列对所有行的划分构成的集合所表示。

定义2(知识库):给定一个论域U 和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U 的一个知识库或近似空间。因此,论域上的等价关系即代表着划分和知识。这样,知识库就表示了论域上由等价关系导出的各种知识,即划分或分类模式,同时代表了对论域的分类能力,并隐含着知识库中概念之间存在的各种关系[9]。

定义3(不可分辨关系):给定一个论域U 和U上的一簇等价关系S,若PS,且P≠,则∩P(P中所有等价关系的交集)仍然是论域U 上的一个等价关系,称为P上的一个不可分辨关系,记作IND(P)。IND(P)的等价类称为知识P的基本范畴[9]。

2 知识发现

2.1 样本数据选取

2.2 数据预处理

在进行数据挖掘之前,需要对数据进行去噪、补缺和转换等预处理操作。数据预处理步骤如下:①根据年级、专业代码和时间段获取读者借阅历史记录,并通过汇总获得借阅图书的人数、未借阅人数和总借阅册数;②去除借阅书目的.种次号,得到借阅类目,汇总后得到借阅类目数。由于中图法是通过标记符号代表各级类目和固定先后次序的分类体系,标记符号不同,其表示的知识类目也不同,故不能把相近类目合并为一类;③按类目进行汇总,求得各类目借阅册数和所有类目的平均借阅册数,并删除低于平均借阅册数的类目,因为其表现的只是某个学生的个人爱好,不是大家共同学习的知识,相当于噪音数据;④求出借过大于平均借阅册数类目的所有读者,这些读者即是进行知识约简的对象;⑤生成上述读者对象和其借阅类目的二维表,并对表中数据进行转换处理,如果此读者借过该类目书籍则为1,否则为0。类目列按类目总借阅册数降序添加到表中。

2.3 知识约简

经过上面的数据预处理后,得到了知识库的关系簇S 和论域U,即不小于平均借阅册数的类目和借阅这些类目的读者。然而,即使经过上述预处理后,其约简的类目数还有几十种;如果直接利用知识依赖度(定义5)来约简,其需要计算的次数为M*logM*2n(M是读者数,n是类目数),这是指数级时间复杂度,需要消耗大量计算时间。为了得到多项式时间算法,采用以类目借阅的册数多少作为属性重要度的启发式策略,应用知识依赖度来约简二维表,具体算法如下:

(1)置K={},R={};// K表示约简后得到的知识,R表示临时约简知识

//如果单个知识把论域全覆盖则作为约简知识放入K中

(2)For r0=1 to count(类目) do

取出count(r0)类目I,计算其划分。

如果I全覆盖论域U ,则把I并入K中;否则,退出循环。

(3)把I并入R中。

//计算剩下的类目依赖关系 (4)For r1=r0+1 to count(类目) do

取出count(r1)类目Q,根据类目Q求其对论域U 的划分。

根据R中的知识求其对论域U 的划分。

利用知识依赖度公式,求Q对R的知识依赖度γ;如果γ小于0.5,则把Q并入R中,否则认为知识Q归属于R而被约简掉。

(5)K=K∪R,并退出。 //即K就是所求的约简集合

2.4 结果分析

因此,通过对相关数据的分析,给出如下建议:①给大一、大二学生适当介绍本学科知识体系结构,使其开始就明确学习目标、方向和内容组成;②通过与教育学院教师交流发现,学院已开设《学科导论》课程,但效果不够理想。因此,对于开设《学科导论》课的院系,需要扎实推进本导制,发挥其引导作用;③深入研究小说等文学类与教育技术学专业之间的内在关系,将其纳入学科体系结构中,完善学科知识体系结构建设;④在低年级中适当开设“TP393.092 网络浏览器”课程,做好相关理论基础知识铺垫,使学科知识结构布局更加合理。

3 知识验证

4 结语

本文利用粗糙集理论中的知识依赖度约简方法对某专业读者群借阅历史数据进行挖掘,获得其学科体系结构知识,并通过比较,发现相应学科体系结构建设中的不足之处,促使学科结构体系建设更加合理、完善。如果利用所得的知识进行推送服务,则能够根据学生知识结构的变化进行预判,做到有的放矢,提高服务质量。当然,本文还有一些问题尚待解决,如表4类目顺序变化的真正原因是什么,蕴含了哪些知识?小说等文学类中哪些知识是教育技术学专业的本质需要,如何合理设计它在学科体系结构的布局等?相关问题有待进行下一步更深入的研究。

参考文献:

[3]张红燕. 关联规则挖掘在高校图书馆借阅流通中的应用[J]. 数字技术与应用,2012(5):76,78.

[4]薛琴荣,李响. 基于数据挖掘技术的图书馆个性化借阅服务研究[J]. 情报探索,2013(4):110113.

[7]柳炳祥. 基于数据挖掘的图书馆个性化服务系统[J]. 现代情报,2007(3):108109.

[9]苗夺谦,李道国. 粗糙集理论、算法与应用[M]. 北京:清华大学出版社,2008.

[14]中国图书馆分类法编辑委员会. 中国图书馆分类法[M]. 第4版. 北京: 书目文献出版社,1999.

第2篇:手机依赖度社会调查报告

调查课程名称: 在校大学生手机依赖状况调查

一、调查的原因及目的随着社会逐渐步入信息化时代,手机的使用已经越来越频繁,大学生拥有手机的比例亦相当之高,而且使用非常频繁,部分甚至对手机已经产生严重的依赖,在无法使用手机或忘记携带手机时,常会出现如烦燥不安、言语粗俗、情绪低落、抑郁寡欢等不良情绪,而这种现象实际上已经是手机依赖症的表现。这不禁让我们联想到网瘾初成时的情况,手机会不会成为继网瘾之后又一个对大学生产生巨大危害的现象呢?为了解大学生手机依赖症的发生现状及其不良影响,为今后开展相应的研究提供科学依据,我们对在。。大学学生使用手机情况进行了问卷调查。

二、调查时间、地点、方法

1.调查时间:2011年4月01日至2011年4月16日

2.调查地点。。。。大学

3.对象与方法调查对象:主要是。。。大学的在校大学生。研究方法:采用整群随机抽样方法进行调查,调查采用自行设计的问卷,内容包括手机使用的一般情况,个人生活状态和手机使用心理3个方面。发放问卷1000份,回收有效问卷955份,有效率为95.5%。问卷题型为等级性选择题。

三、调查内容及分析

(1)问卷一般情况:在955份有效问卷中,调查对象年龄在18~24岁,其中男性为370人,占39.7%,女性为585人,占61.3%。手机拥有率高达98.95%,近一半的受调查者(49.74%)是在进入大学后才开始使用手机的。

(2)手机使用基本情况上:57.59%的受调查者认为手机作用非常大,是离不开的;71.2%的受调查者认为手机最大的吸引力“方便与他人沟通”。受调查者认为手机最主要的三项作用分别是:通话(85.86%),短消息(85.34%),上网(52.36%)。

(3)在手机消费方面:大部分的受调查者表示(79.06%)从未换过手机或要用坏才换手机;而在选择手机方面53.93%的受调查者选择1000——1500价位的机型,62.83%的选择国产品牌;92.76%的受调查者每月话费在100元以下,仍有39.27%的受调查者觉得花费消费太多,占了生活费好一部分。

(4)在手机依赖症候的问题上,我们一共设计了13个相关问题,选项A-B-C-D的给分分别是4-3-2-1分,涉及了调查者手机使用情况、手机对生理、心理影响情况:受调查者中,平均每天使用手机3小时以上的占45.55%。有35.08%的受调

查者每月的短信量在200——400条,每月短信量在800条以上的有21.47%。

有65.45%的受调查者在教室里会将手机调成震动;在上课时收到短消息,有33.51%的受调查者会忍不住掏出来看看,有46.07%的选择视具体情况而定;当问及与人聊天时是否会因短信而打断聊天,有60.73%的受调查者选择视情况而定;被问及是否会有发短信发到手指发麻这个问题时,有6.81%的受调查者表示“经常有”,27.75%的表示“偶尔会;被问及是否存在长期使用手机后会出现头晕,恶心,精神不振等现象时,有6.81%的受调查者选择“经常会”;被问及是否手机没带在身上时就会出现缺乏安全感,焦虑,暴躁等情绪时,有47.12%的受调查者表示“会”,其中有10.99%的表示“感觉强烈”。

被问及是否一段时间手机没响就会感到不适,并下意识的查看手机时,只有30.37%的受调查者表示“无感受,无行为”,其余的69.63%均会表现出“有感受”或者“有行为”,而两者兼而有之的达到了23.56%;当问及是否会出现手机响了的错觉时,“有此错觉”的占到了55.5%,“经常有此错觉”的占到了11.52%。

有49.74%的受调查者偶尔会有写字时突然忘记了写法,需要用手机的拼音查了后才知道该如何写,经常有的占8.38%;46.07的受调查者表示自己只能记住5个以内的电话号码,记住10个以下的占到了72.77%;在被问及是否有发短信时可以侃侃而谈,但面对面时却无话可讲的情况时,60.21%的受调查者选择“有”。对手机依赖症了解情况:有40.31%的受调查者听说过“手机依赖症”,而被问及在大学生中是否存在手机依赖症时,有62.83%的受调查者表示“存在”。

在13个相关问题中,最高得分为46分,最低得分为14分,平均为31.8分。得分≥39分者,即每题的平均分达到3分,我们认为出现了较为明显的手机依赖症状,共有146人得分≥36分,占到受调查者的15.29%。在全部调查中,而各项超出平均分的分别有819人,即有519人有偶尔出现手机依赖相关症状的现象,占总数的85.76%。

四、今后的对策与建议

从分析结果可以看出,有相当一部分在校学生由于过度使用手机,而产生了一些心理和生理方面的问题,也就是我们所说的手机依赖症的表现。这必须充分引起学校的重视,手机依赖不但影响学生学习、生活,更有可能引起不良心理状态,甚至是心理疾病,所以必须进行干预和控制。我们看到,在手机使用的礼仪方面,比原来提高不少,说明学校制定的规章制度,还是起到了积极的引导作用,同时,在控制网络成瘾方面也有许多对校方而言行之有效的方法,可以参考借鉴。建议如

下:(1)制定相应的校纪校规控制手机过度使用。(2)通过第二课堂进行宣传、教育,让学生知晓“手机依赖”的危害,并养成良好的使用习惯。(3)鼓励学生与朋友联系多采用其他方式,如书信往来,直接见面等,逐步脱离对手机的依赖。(4)适当参加有益的身心活动,加强与人之间的直接交流,增强自己的自信心。(5)提供相应的心理咨询途径,并引入相关检测量表,为一些症状明显学生提供心理援助,当依赖症比较严重时,应当寻求心理医生的指导,及时到医院就诊,以免情况恶化;(6)提升学生自我保护意识,发现自身或者同学有相关依赖现象时,应及时求助于心理教师;(7)对于已经形成手机依赖的人,则应通过监督、治疗,逐步减少非必要的使用时间,尽量使自己有一个适应的过程,从而达到减少症状,摆脱依赖的目的。

第3篇:知识论文

知识·情感·价值观

赵鑫 广东省中山市东凤中学

“学海泛舟”,“天道筹勤”。教学之道取自知识的培养,知识之源在乎情感的砺练,如果一个人的认知能力、思想情感能够造就成熟、稳健、高瞻远瞩的价值观,那么不论是高雅的教学,还是高尚的人生,都将是一次丰富而远见的尝试。所以,掌握好知识、情感以及价值观三者之间的关系对于教学生涯、平日生活亦是重中之重。

现代社会高度发达,且竞争日趋激烈,借用达尔文的进化论“优胜劣汰”——这一严酷的词语,已然恰如其分。如今,伴随中国的“和平崛起”,迅速澎湃的市场经济浪潮令许多悠然的大学本科毕业生“望而生畏”。为什么呢?因为知识层次不够?因为情商过低?抑或是未能树立正确的价值观?都不是。真正的原因在于面对世态风云变幻的现代社会,未能为自己“量身定做”一个合适的角色。只有成为真正的“复

未完,继续阅读 >

第4篇:基于属性重要度约简算法在数据挖掘中的应用研究论文

摘 要:属性约简是粗糙集理论研究的核心内容之一,本文通过对属性重要度的计算,以核为基础计算条件属性集中除核以外其他属性的重要性来确定最小的约简,最后通过实例分析验证了算法的有效性与可行性。

关键词:数据挖掘 属性约简 重要度

数据挖掘是从海量的且不断动态变化的数据中,借助有效的方法挖掘出潜在、有价值的知识过程。而粗糙集理论它是一种刻画不完整性和不确定性的数学工具,能在保持分类能力不变的前提下,通过知识约简从中发现隐含的知识,揭示潜在的规律,是由波兰科学家Pawlak在1982年提出的。而属性约简是粗糙集理论研究的核心内容之一,它能保证在分类能力不变的情况下,消除重复、冗余的属性和属性值,减少数据挖掘要处理的信息量,提高数据挖掘的效率。本文提出了通过计算单个属性的重要性,以重要性大于零的属性为核,来

未完,继续阅读 >

下载知识依赖度约简的论文word格式文档
下载知识依赖度约简的论文.doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

相关专题
热门文章
点击下载本文