代做计算机毕业设计-基于数据挖掘的教学评估系统内容摘要:

最小时间内出现比率一直高于某一最小百分比(阈值)的规则。 这些规则会随着形式的变化做适当的调整。 聚类。 数据库中的数据可以划分一系列有意义的子集,即类。 在同一类别中,个体之间的距离较小,而不同类别上的个体之间的距离偏大。 代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 15314056906分类。 分类是数据挖掘中应用最多的功能。 分类是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。 该模式能把数据库中的元组映射到给定类别中的某一个。 偏差检测。 数据库中的数据存在着很多异常情况,从数据分析中发现这些异常情况也很重要,以引起人们对它更多的注意。 偏差检测的基本方法是寻找观察结果与参照之间的差别。 观察结果常常是某一个域的值或多个阈值的汇总。 参照是给定模型的预测、外界提供的标准或另一个观察。 预测。 预测是利用历史数据找出变化规律,建立模型,并用此模型来预测未来数据的种类,特征等。 典型的方法是回归分析,即利用大量的历史数据,以时间为变量建立线性或非线性回归方程 [6]。 数据挖掘的数据预处理步骤由于原始数据来源于多个不同的应用系统或数据库,信息庞杂,缺乏统一的分类标准和信息的编码方案,很难直接用于数据挖掘。 且同一事物在数据库中存在两条或多条完全相同的记录,或者相同的信息冗余地存在于多个数据源中。 实际应用系统中,由于系统设计的不合理或者使用过程中的某些因素,某些属性值可能会缺失或者值不确定。 噪声是指一个测量变量中的随机错误或偏离期望的孤立点值,产生噪声的原因很多,人为的、设备的和技术的等。 原始数据中通常记录事物的较为全面的属性,只需要一部分属性就可以得到希望知道的知识 [3]。 在数据预处理的初期,首先要对名称和取值含义含糊的属性进行处理,赋予它们具有明确含义的名称和取值。 要保证在各个数据源中对同一事物特征的描述是统一的。 一般的,原始数据中的关键属性或唯一属性对数据挖掘是无用的但通常要保留一个或多个必需的关键属性或唯一属性。 有时候,原始数据中会出现意义相同或者可以用于表示同一信息的多个属性,只要选取一个就可以了。 当然,在某次挖掘中可能同时需要这些重复属性,此时这两个属性就表示不同的信息了,应该同时保留。 若一个属性值缺失非常严重,只有极少数值保存下来的话,这样的属性应该去除。 如果属性 X 可以由另一个或多个属性推导或者计算出来,只选择其中之一。 记录中的某一个属性值缺失严重,则把该属性排除在挖掘数据集之外。 手工填写空缺值,不能用来处理较大的和值缺失较多的数据集。 对于离散值属性,用一个常数代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 15314056907取代空缺值,会导致挖掘得出无用的规律,应尽量少用此方法。 对于连续属性,计算所有记录该属性的平均值,用来填充空缺值。 计算同类样本记录的该属性平均值,用来填充空缺值。 根据其他完整的记录数据,使用一定的预测方法,得到最可能的预测值。 在测量一个变量时可能产生一些误差或者错误,使得测量值相对于真实值有一定的偏差,这种偏差称为噪声。 为了除去这些噪声,使数据接近真实值,可以采用分箱、聚类和回归这些方法。 数据挖掘所使用的数据通常是来自于多个数据存储,所以经常需要把多个数据存储合并起来,这个过程称为数据集成。 而为了使数据符合算法和挖掘目标的需要,如数据的取值范围、粒度等,还需要对数据进行变换。 数据集成是将多文件或者多数据库中的异构数据进行合并,然后存放在一个一致的数据存储中,解决语义模型问题,主要工作涉及数据的冲突问题和不一致数据的处理问题。 在数据集成过程中,通常需要考虑模式匹配、数据冗余和数据值冲突的问题。 通常,原始数据表中的数据不适合直接用于数据挖掘,需要对它们进行变换之后才能使用,数据变换涉及多个方面,主要包括数据变换的平滑、聚类、数据概化、规范化和属性构造等主要内容。 数据规约用于从原始数据中得到数据集的规约表示,数据规约的目的是为了获得比原始数据小得多的,但不破坏数据完整性的挖掘数据集,该数据集可以得到与原始数据相同的挖掘结果。 有多种方法用于数据规约,比如数据立方体聚集、维规约、数据压缩、数值规约和离散化和概念分层。 决策树算法分类算法是数据挖掘的一种非常重要的方法,是在已有数据的基础上学会一个分类函数或构造出一个分类模型,即通常所说的分类器。 该函数或模型能够把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于数据预测。 而预测的目的是从历史数据中自动推导出对给定数据的推广描述,从而对未来数据进行预测。 二者的区别是分类模型输出的是离散型的类别值,而预测通常建立连续值函数模型,输出的也是连续数值。 代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 15314056908决策树是一种常用于分类、预测模型的算法,它通过将大量数据有目的的分类,从而找到一些有价值的、潜在的信息。 它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。 当前国际上最具有影响的示例学习方法首推 的ID3(Interative Dicremiser versions3)。 它的前身是 CLS(Concept Learning System)。 CLS 的工作过程为,首先找出最有判别力的因素,然后把数据分成多个子集,每个子集又选择最有判别力的因素进行划分,一直进行到所有子集仅包含同一类型的数据为止。 最后得到一棵决策树,可以用它来对新的样例进行分类。 的工作主要是引进了信息论中的互信息,他将其称为信息增益(information gain),作为特征判别能力的度量,并且将建树的方法嵌在一个迭代的外壳之中。 一般来说,决策树是一个类似于流程图的树结构,通过根节点到叶节点的顺序对实例进行分类。 其中每个节点表示在一个属性上的测试,每个分支代表一个测试输出,每个树叶节点代表类或类分布。 决策树的最顶层节点是根节点。 在决策树中,一个实例的分类是从树的根节点开始,测试该节点所代表的属性,然后沿属性取值的某个分支向下移动。 不断重复这个过程,直至到达叶节点,即得到该实例所属的类。 决策树方法能够生成可以理解的规则。 由于系统的最终用户是教师或教学管理者,他们往往不具备数据挖掘的知识,因此挖掘方法的可解释性十分重要。 而决策树是以树型结构表示最终分类结果的,而且还可以生成 ifthen 形式的规则,这样接近于人们对现实世界事物的认知和表示方式。 决策树可以清晰的显示出属性的重要程度。 决策树是通过计算信息嫡选择分裂属性的,而信息嫡正是该属性重要性的度量标量。 从直观上看,决策树节点所在的层次越高,该节点所代表的属性就越重要,相反节点所代表的属性对此次分类的作用就越小。 那么,同一层次节点的作用基本相同,没有明显的大小之分。 在影响教师教学质量的因素中,我们可以很明显地分清影响因素的主次,从而制定更符合实际的管理决策。 教学评估系统的需求分析现有的信息管理系统中的数据分析工具处理方式都是对指定的数据进行简单的数字处理,而不能对这些数据所包含的内在信息进行提取与挖掘,也就不能发现隐含的知识。 随着信息管理系统的广泛应用和数据量激增,人们希望更高层次的数据分析功代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 15314056909能,在海量的数据资源中提取出隐藏的有用信息,从而更好地对决策或科研工作提供支持。 本系统所研究的就是对教学评估内容的挖掘。 各个学校都要对教师的教学情况进行评估,由于教师数目很大,而且每个教师教好几门课程,因此生成的数据是非常惊人的。 如果学校部门想从中抽取某些有用信息,其工作量是可想而知的。 该系统的开发的目标是为了从这些大量的数据中抽取一定的有用信息,从而能让学校有关领导从研究大量数据的任务中解脱出来,提高学校的工作效率,从而达到提高教学水平的目的。 系统所完成的功能:系统连接数据库;用户需要密码才可以登陆系统;在系统内,用户可以修改自己的密码,添加或删除用户名及密码;可以查看教师的信息资料,以及添加、删除和修改信息;可以通过对教师个别信息进行数据挖掘得出有用信息,从而向决策者提供可参考信息。 教学评估指标体系的构建 层次分析法层次分析法(简称 AHP 法)是美国运筹学家 T 教授在 20 世纪 70 年代初期提出的一种简便、灵活而又实用的多准则决策的系统分析方法,其原理是把一个复杂问题分解、转化为定量分析的方法。 它需要建立关于系统属性的各因素多级递阶结构,然后对每一层次上的因素逐一进行比较,得到判断矩阵,通过计算判断矩阵的特征值和特征向量,得到其关于上一层因素的相对权重,并可自上而下地用上一层次因素的相对权重加权求和,求出各层次因素关于系统整体属性(总目标层)的综合重要度。 构建教师教学评估体系模型由于对教师教学质量的评估是一个多层次、多指标的问题,在实际评估操作中,既要全面考虑各种影响因素,又要对各因素进行适当的取舍,对有相似影响的因素要进行整合,对因素的分布广度和代表性也要进行适当考虑。 在以上分析的基础上,结合评估操作的实际情况,建立指标体系,其结构如图 所示;并应用层次分析法(AHP)对教师教学评估体系模型进行科学的验证,最终逐一选出最佳评估指标 [11]。 代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 153140569010 图 教师教学评估指标体系图 中,B l 代表的是教学态度,其下又分为: Cl 代表的为教学态度端正,不迟到不缺课;C 2代表的重视辅导与批改作业;C 3代表的重视教学信息反馈;C 4代表的授课认真,教材熟悉。 B 2代表教学设计,分为:C 5代表的教学目标明确;C 6代表的教学策略设计;C 7代表的教学过程设计;C 8代表的知识的科学性。 B 3指教学内容,其中分为:C9代表的先进与实用性;C 10代表的学习能力的培养;C 11代表的情感态度与价值观的渗透。 B 4是教学方法,其下层有:学习方法指导性(C 12) ;教育方法的启发性(C 13) ;组织教学的针对性(C 14) ;多媒体教学的应用(C 15)。 B 5为教学能力,包含了:讲述概念准确,分析问题透彻(C 16) ;板书设计合理、规范(C 17) ;实验操作准确(C 18)。 B5(教学能力)C1C8C5 C6 C7 C12 C13 C14 C15C18教师教学评估指标体系(A)B1(教学态度)B2{教学设计}B3(教学内容)B4{教学方法}C3 C4C2 C9 C10 C11 C17C16代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 153140569011 教师教学评估模型的求解过程构造判断矩阵在建立递阶层次结构体系后,对同一层次的各元素关于上一层次中某一准则的重要性进行两两比较,构造判断矩阵,即针对每层中每项的各下属因素,如评估准则层B,各下层因素子准则层 B1B 12,评估者要反复回答一个问题:每两个因素针对它们所属的上一层因素哪个重要,重要多少。 比较教师教学质量中的 n 个因素B={B1B2B3B4…BN},分别判断各指标对教师教学质量评估相对重要性,每次取因素 Bi和 Bj(1,2,3,…, n),以 Bij 表示指标 Bi 和 Bj 对教师教学质量评估体系的影响比值,从而得到判断矩阵:B=(b ij)nn其中 bij 0,b ij=1/ bij,(i j),bij=1(i,j=1 ,2,,n);确定 b 需要采用 l~9 及其倒数的方法。 表 判断矩阵各因素重要程度分值Bi/Bj 同样重要 稍微重要 明显重要 很重要 极端重要Bij 1 3 5 7 9上述相邻判断的中间值 bij 分别取 8。 得到矩阵如下: 153142153142A 1543123B142513B 135B15271374B 12345B代做计算机毕业设计 Android毕业设计、JAVA 毕业设计 : 153140569012计算判断矩阵中最大特征根的近似值的步骤(1)将矩阵的每一行各元素相乘并开 n 次方:i= aij1/n, i=1,2,n ()1j(2)将近似特征量=( 1, 2,, n) T 做归一化处理:。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。