基于ictclas50智能答疑系统设计与实现毕业论文(编辑修改稿)内容摘要:

模型。 用一阶逻辑构造了形式化的集成模型,包含企业设计本体、项目本体、调度本体或服务本体。 图 3 TOVE 流程图 (刘仁宁等, 20xx) 7 (4)Methontology 方法 : Mariano Fernandez amp。 GOMEZPEREZ 等的 Methontology 方 法是由西班牙 Madrid 理工大学 AI 实验室提出的。 该方法是在结合了骨架法和GOMEZPEREZ 方法后,提出的一种更为通用的本体建设方法。 这个本体开发方法更接近软件工程开发方法。 它将本体开发进程和本体生命周期两个方面区别开来,并使用不同的技术予以支持。 Methontology 法,专用于创建化学本体 (有关化学元素周期表的本体 ),该方法已被 马德里大学理工分校人工智能图书馆采用。 它的流程包括: :这一阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题。 :分为规范说明、概念化、形式化、执行以及维护五个步骤。 :包括知识获取、系统集成、评价、文档说明、配置管 理五个步骤。 (5)循环获取法 :Alexander Maedche 等的 Cyclic Acquisition Process, 是一种环状的结构。 基本流程如下: :这是环形的起点,是一个通用的核心本体的选择。 任何大型的通用本体(像 Cyc、 Dahlgren 的本体 )、词汇 语义网 (像 WordNet,GermaNet)、或者领域相关的本体(像 TOVE)都可以作为这个过程的开始。 选定基础本体后,用户必须确定用于抽取领域相关实体的文本。 :从选择的文本中获取领域相关的概念,并建立概念之间的分类关系。 :除去领域无关的概念,只留下和领域相关的。 这时,建立起了目标本体的概念结构。 :除了从基础本体中继承的一些关系,其它的关系需要通过学习的方法从文本中抽取。 :对得到的领域相关的本体进行评价,接着还可以进一步地重复上述过程。 8 图 4 循环获取法 (张囡囡 ,20xx) (6)七步法 :斯坦福大学医学院开发的七步法 ,主要用于领域本体的构建。 七个步骤分别是 : ① 确定本体的专业领域和范畴; ② 考查复用现有本体的可能性 ;③ 列出本体中的重要术语; ④ 定义类和类的等级体系 (完善等级体系可行的方法有 : 自顶向下法、自低向上法和综合法 [7]);⑤ 定义类的属性 ;⑥ 定义属性的分面 ;⑦ 创建实例 (刘仁宁 等 ,20xx)。 建领域本体的步骤 本体的开发和完善是一个反反复复不断补充的迭代过程。 领域本体中的概念应该贴近于要研究的专业领域中的客观实体和关系法则。 综合上节几种本体构建的工程思想,归纳并总结出构建领域本体的几个步骤: 确定领域本体的专业领域和范畴 领域知识往往十分庞大的,本体不可能包括所有的概念,因此,在建立本体前必须先确定本体将覆盖的专业领域、范围和应用目标,本体应该在哪些方面发挥作用以及它的系统维护者与应用对象。 不同的应用领域,领域概念肯定是不同的,即使是同一个领域,由于应用的不同,本体表示的概念的侧重点肯定也会有所不同。 因此,建立本体之前一定要明确本体建立的领域和应用目标。 本体是一个复杂的知识体系,确定每个阶段的范围和目标有助于对本体模型的范围作一个限定,有利于复杂系统的实现。 考虑复用现有的本体 本体的主要作用就是解决知识的共享和重用问题。 所 以在设计和建立自己的领域本体之前,应该考虑重用已经存在的本体。 如果系统需要和其它的应用平台进行互操作,而这个应用平台又与特定的领域本体或相关概念联系在一起,那么复用现有的本体是行之有效的方法。 例如 Ontolingua 的本体文库可以导入到本体开发系统中,并且本体的格9 式转换也并不困难。 列出本体涉及领域中的重要术语 领域本体是描述概念以及概念与概念之间的关系,首先要列举出该领域中的所有概念以及对该概念的详细解释。 在特定领域,这些概念就是与领域相关的专业术语。 把领域中一些重要术语列举出来,有利于知识工程师更好地理 解本体建立的目标,明确方向。 除此之外,针对每个概念,要列出它所有可能的属性,每个属性都有对应的属性值。 定义分类概念和概念分类层次 概念分类层次将领域概念进行分类组织,用于描述领域概念间的类属关系,并将本体中的概念模块化。 建立一个分类概念的层次结构有 3 种可行的方法 : 自顶向下法、自底向上法和综合法。 一般领域概念分类层次对应着一棵树,树中的节点体现了领域概念间的层次结构关系。 树有四类元素组成:根节点,枝节点,树枝,叶节点。 建立领域概念的分类关系后,将分类概念的属性值添加到分类概念中,这样就把领域概念通过树形结构形象地描述出来,并且通过树结构清晰地体现了领域概念间的类属关系。 每一个子树都对应着领域中独立的、模块化的知识模型。 领域分类概念应该包括 :概念名称,语义描述,该概念可能的同义词、缩略语。 定义分类概念,就是对这些信息进行描述。 同时,要对所建立的概念分类层次进行检验,保证没有重复的概念,防止冗余定义。 定义概念之间的关系 概念的分类层次结构体现了分类概念之间的一种继承关系 (kindof),但是在领域本体中,概念和概念之间 通过关系来交互,除了继承关系,在我们构建的领域本体中还可以根据需要,定义其他的关系。 protege 工具建立本体 Prot233。 g233。 软件是斯坦福大学医学院生物信息研究中心基于 Java语言开发的本体编辑和知识获取软件,或者说是 本体 开发工具,也是基于知识的编辑器,属于 开放源代码软件。 这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具,现在的最新版本为 版本。 Prot233。 g233。 提供了本体概念类,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建。 Prot233。 g233。 使用 JAVA 和 Open Source 作为操作平台,可用于编制本体和知识库10 (Knowledge Base), prot233。 g233。 可以根据使用者的需要进行定制,通过定制用户的界面以更好地适应新语言的使用;有可自行设置的数据输入模式,可以将 prot233。 g233。 的内部表示转制成多种形式的文本表示格式,如 : XML、 RDF(S)、 OIL、 DAML、 DAML+OIL、 OWL 等系统语言。 Prot233。 g233。 工具本身没有嵌入推理工具,不能实现推理,但它具有很强的可扩展性,可以插入 插件 来扩展一些特殊的功能如推理、提问、 XML 转换等。 Prot233。 g233。 提供可扩展的独立平台环境,用于构建和编辑本体以及知识库。 Prot233。 g233。 开放源码 ,运行 多重继承 ,提供本体建设的基本功能,而且它采用图形化界面,界面风格与 OilEd一样,都与 WINDOWS操作系统的风格一致,模块划分清晰。 另外, prot233。 g233。 本体结构和 OntoEdit 一样,也是以树形的等级体系结构来显示,用户可以通过点击相应的项目来增加或编辑类、子类、实例等,所以用户使用 prot233。 g233。 不需要掌握具体的本体表示语言,是用户比较容易学习 、 使用的本体开发工具。 由于其优秀的设计和众多的 插件 , 其已经成为目前最广泛的 本体论编辑器 之一,它已成为国内外众多本体研究机构的首选工具。 Prot233。 g233。 的特点 Prot233。 g233。 是一组自由开源的工具软件,用于构建 域模型 与基于知识的本体化应用程序。 Prot233。 g233。 提供了大量的知识模型架构与动作,用于创建、可视化、操纵各种表现形式的本体。 可以通过用户定制实现域 友好 (领域相关 )的支持,用于创建知识模型并填充数据。 Prot233。 g233。 可以通过两种方式进行扩展: 插件 和基于 java 的 API。 相比与其他的本体构建工具而言, Prot233。 g233。 最大的好处在于支持中文,在 插件 上,用Graphviz 可是实现中文关系的显示。 Prot233。 g233。 的用途 prot233。 g233。 可用于: 类模拟 (Class modeling): prot233。 g233。 提供了一个图形化用户界面来模拟类 (领域概念 )和它们的属性及关系。 实例编辑 (Instance editing): 从这些类中, prot233。 g233。 自动产生交互式的形式,全用户或领域专家进入的有效实例成为可能。 模型处理 (Model processing): prot233。 g233。 有一个插件库,可以定义语义、解答询问以及定义逻辑行为。 模型交换 (Model exchange): 最终的模型 (类和实例 )能以各种各样的格式被装载和保存,包括 XML、 UML 和资源描述框架 RDF。 七步法 荔枝本体知识库的构建 11 知识库是作为整个答疑系统的核心,知识的表示和存储方式是系统实现的关键,面对传统的知识库在知识获取、重用、共享和表示等方面存在不足,借助本体技术构建知识库可以很好地解决这些问题。 本章 借鉴七步法的构建原则和方法, 详细介绍了荔枝本体知识库的构建过程,为开发荔枝智能答疑系统奠定基础。 确定本体的领域和范畴 在确定本前要明确本体对象,对象范围,应用目的,用户。 本论文中的本体对象为荔枝 , 荔枝原产于我国,是我国的特产。 最早的海南岛和廉江的野生荔枝林,可作为我国是原产地的明证。 荔枝的栽培,迄今为止,已长达两千多年的历史 , 我国 幅员 广阔,不同地区有不同的 特产。 荔枝的属性包括形态特质,地理分布,荔枝的品种,使用价值,栽培技术,荔枝的病害、虫害,及其防治。 对于荔枝领域本体的构建,由于人力,资源和时间的限制,只能选取各个方面的一部分的知识,如果系统有机会被使用到,再补充完善。 领域分析 荔枝在国内很多的地方多有种植,主要集中在越南部分,荔枝也有多个品种,我将列出荔枝几个主要的品种作为研究,各个品种的荔枝的 产地和价值不尽相 同,荔枝作为一种乔木植物,本身具有植物的属性,根茎叶及生长周期等 ,荔枝是“南国四大果品”之一,具有其食用价值与药用的价值,荔枝在我国的历史悠久,栽培 技术不断地发展,各个区域和各个品种的栽培技术各有差异 ,能生长就会有生病,本文将列出几种病害和虫害以及其对应的防治方法。 查找可复用的本体 将本体作为智能答疑的对象的好处之一就在于本体的可重复利用 ,虽然没能找到网络上已经建立好的荔枝本体库,但可以找到其他像柑橘害虫,猕猴桃病虫害等本题库作为参考,通过抽取其中的通用的类,来对自己的本题库进行扩充。 领域中的重要术语 荔枝的本体覆盖了荔枝在生存,形态, 医药,害虫等所有学科范围 ,例如虫害范围相关的领域包括昆虫形态学、生物分类学、昆虫生理学、昆虫生态学、农业昆虫学、昆虫毒理学、昆虫病理学、昆虫技术等。 同时没有雨本体的应用目的是为智能答疑系统提供基础,因此本体还应包括害虫等的生存环境、防治策略等相关知识,获取相关知识,可以从书籍、手册、实验数据、学术论文、表格、字典等,也可以是专家和网络。 从收集到的信息中提取荔枝的相关知识,按照 中国图书分类法 进行分类,得到的部分12 核心概念集有 如下。 荔枝的品种:三月红,元红,兰竹,园枝,妃子笑,挂绿,桂味,淮枝,白糖罂,糯米滋,陈紫,黑叶 ; 微量元素:碘,钙,钠,钾,铁,铜,锌,锰,镁 ...; 营养物质:尼克酸,核黄素,硫胺素,碳水化合物,维生素 A,维生素 C,胡萝卜素,脂肪,膳食纤维,蛋白质 ...; 市区:东莞,中山,广州,揭阳,深圳,潮州,茂名 ...; 省份:台湾,广东,广西,海南,福建 ...; 行政区:从化,北流,增城,容县,惠来,新兴街道,桂平,横县,浦北,电白,藤县,贵县,饶平,高州 ...; 丽金龟科:古背异丽金龟,红脚异丽金龟 ; 卷叶蛾科:圆翅卷叶蛾,拟小黄卷叶蛾,白点褐卷叶蛾 ; 天牛科:荔枝龟背天牛 ; 小卷叶蛾科:灰 白卷叶蛾,褐带长卷叶蛾,黄三角黑卷叶蛾,黑点褐卷叶蛾 ; 拟木蠹蛾科:相思拟木蠹蛾,荔枝拟木蠹蛾 ; 木蠹蛾科:咖啡木蠹蛾 ; 灰蝶科:荔枝小灰蝶 ; 瘿蚊科:荔枝叶瘿蚊 ; 瘿螨科:荔枝瘿螨 ; 细蛾科:爻蚊细蛾,荔枝细蛾,荔枝蒂蛀虫 ; 蓟马科:茶黄蓟马 ; 叶:叶脉,嫩叶,嫩芽,成叶,老叶 ...; 果:果实,果柄,果核,果皮,果肉 ...; 枝条:枝,嫩梢 ; 病害:易逝杯伞葡,荔枝丛枝病,荔枝扁枝槲寄生,荔枝桑寄生,荔枝炭疽病,荔枝藻斑病 ...; 防治方法:化学防治,生物防治,物理防治; ...; ..。 描述 类与类之间的等级体系 13 完善类间的层级体系通常可以采用三种方法 (Uschold and Gruninger,1996),自顶向下,自底向上,综合法,三者的不同在于建立等级层次的过程中是从哪里开始着手的,自顶向下是从领域中最顶级的概念开始,再将概念逐层细化,自底向上则相反,综合发是将前两者的方法结合在一起使用,先定义最重要的概念,再通过适当的归纳演绎,将其他的概念关联起来。 本研究中荔枝相关的知识范围 很广,包括植物自身的领域和昆虫等其他领域,这样如果单单使用自顶向下或者自下向上 会比较难概括多方面的内容,所以,使用综合法的构建方法来建立荔枝的本体。 另外,由于 荔枝的生。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。