同类网站查询接口的集成系统设计与实现_毕业论文设计(编辑修改稿)内容摘要:
构建工具构建核心本体: 1)领域术语抽取。 确定领域类型,从特定领域深网查询接口表单中对领域术语进行抽取。 2)领域概念抽取。 领域核心本体要求领域概念必须是语义明确的,所以需要用领域内最通用的语义来描述该类术语。 3)概念间层次关系获取。 捕获术语间的语义关系,例如同义( Synonymy)关系、继承( IS- A)关系、包含( partof)关系等。 4)领域本体精炼。 本体工程师以本体工程学标准对已获取的领域本体概念及概念间的语义关系进行修正。 5)领域本体描述。 采用本体描述语言(如 RDF, XML, OWL 等)描述领域本体,本体描述语言提供了机器对文档内容可处理的机制。 Step如果某个术语不存在于核心本体中,那么通过匹配方法确定术语和本体概念之间的语义关系。 Step如果相匹配,那么将匹配的概念加入到核心本体适当位置,以完成本体的自动扩展。 完成本体构建后,本体可以形式化地表示为概念层次结构,用户的查询以及相关数据可以映射到概念空间,它可以看作是一个保存概念和概念之间关系的知识系统。 定义 3 :领域本体概念模型( domain ontology concept model, DOCM)。 描述了特淮南师范学院 20xx 届本科毕业论文 8 定 领域实体的术语组织以及术语之间的关系,每个概念可以形式化为 Class={ Ai, DTi,{ Si},{ CIi},{ CAi},{ SCi},{ nI1, nI2,„ nIk}, Ni},表示与该概念相关的数据信息,其中: Ai表示概念主类,它是特定领域下通用的、人们易于理解的词汇,该词汇表示一类概念,可以看作描述这类概念的关键字; DTi表示概念所属的数据类型; { Si}表示概念主类的同义词集合,即概念别名; { CIi}表示概念主类的实例集合; { CAi}表示与概念相关的条件属性集合,主类与条件属性表示包含关系; { SCi}表示概念主类的子类集合,主类与子类表示继承关系; { nI1, nI2,„, nIk}表示概念主类的 k 个实例的计数器; Ni表示概念主类的计数器。 DOCM 具有良好的组织结构,能够清晰地描述概念及概念之间的关系。 本体构建采用 Prot233。 g233。 (是一个史丹佛大学开发的本体编辑和知识获取软件 ,开发语言采用 Java,属于开放源码软件 )作为本体编辑工具,并以 OWL 作为本体描述语言。 通过对 OWL 文件的操作,可以很容易地实现对 DOCM 的调用。 基于本体的模式匹配 基于本体的 网站 查询接口模式匹配方式 有 属性级和实例级 2 种 匹 配: 定义 4:本体的属性级匹配。 假设 A*表示 Web数据库查询接口的属性, Ai表示 DOCM中概念节点Ci的概念主类,{ Si}表示 Ai 的同义词集合, CAi 表示 Ai 的条件属性,SCi 表示 Ai 的子类, Sim( A*, Ai)表示应用基于本体的短语相似度算法。 计算 A*与Ai 的相似度值,σ表示相似度阈值, Ni表示 Ai 的计数器。 属性级匹配存在以下几种情况: 1)如果 A*∈{ Si}或者 A*= Ai,那么表示 A*与 Ai 是 1: 1 的属性匹配, Ai 的计数器加1,即Ni=Ni+1; 2)如 果 A*{ Si}, A*≠ Ai,且 Sim( A*, Ai)≥σ,那么表示 A*与 Ai 是 1:1的属性匹配,同时,将 A*作为 Ai的一个同义词加入同义词集合{ Si}中, Ai的计数器加 1,即 Ni= Ni+ 1; 3)如果 A*∈{ CAi}∪{ SCi},那么表示 A*与 Ai 是 M: 1 的属性匹配, Ai的计同类网站查询接口的集成系统设计与实现 9 数器加1,即 Ni= Ni+ 1; 4)如果 A*DOCM Ai, Sim( A*, Ai)<σ,表示 A*与 Ai 不存在匹配关系,那么创建一个新类 Class,将 A*作为 Class 的主类加入 DOCM 中,并设置 A*的计数器为1。 定义 5:基于本体的短语相似度算法。 给定短语 P1 和短语 P2,通过预处理将 短语P1 和短语 P2 分别表示为词集 P1={ c1, c2,„, cm}和 P2={ cl1, cl2,„, cln},对于短语 P1 中的每个词汇 ci( 1≤ i≤ m,借助通用本体 WordNet 分别计算其与短语 P2中每个词汇 clj( 1≤ j≤ n)的相似度,其计算如式( 1)所示: 其中, overlap(ci,clj)表示词汇 ci与词汇 clj 的语义重合度,即在 WordNet 概念树中,词汇 ci与词汇 clj 之间包含相同上位概念的个数。 Depth(ci)表示词汇 ci的概念深度,即词汇 ci 在 WordNet 概念树中到达根节点的层次深度,同理, depth(clj)表示词汇 clj 在WordNet 概念树中到达根节点的层次深度。 如果短语 P1 中词汇 ci 与短语 P2 中词汇 clj相同,那么 Sim(ci, clj)= 1。 然后,在短语 P2 中找到与短语 P1 中词汇 ci相似度最大的值作为短语 P1 相似度值集中的一个值 Si,从而获得短语 P1 的相似度值集 Sim1={ S1,S2,„, Sm},采样同样方法获得短语 P2 的相似度值集 Sim2={ sl1, sl2,„, sln}。 短语 P1 和 P2 的最后相似度通过每个短语中词汇各自的相似度占总单词个数的比例获得,其计算如式 (2)所示: 假设给 定短语 P3,δ为相似度阈值。 如果 Sim(P1, P2)= Sim(P1, P3)≥δ成立,那么可以推测短语 P2 和短语 P3 是语义相似的,都应记录于匹配对应关系集中。 通过 关键字 属性级匹配方法,可以准确识别 DOCM 中类或属性与来自不同查询接口属性之间的匹配关系,不仅能够识别简单匹配,而且能够识别复杂匹配。 相比于传统模式匹配方法,大大提高了匹配精度并降低了模式匹配过程的复杂性。 假设属性e来自查询接口 QI1,属性f来自查询接口 QI2,即 e∈ QI1, f∈ QI2,同时,在 DOCM 中存在主类 g,该主类 g 包含 2 个同义词汇 e 和 f,那么,在比较查询接口 QI1 中属性 e 和查询接口 QI2 中属性 f 时,首先比较查询接口 QI1 中属性 e 与 DOCM淮南师范学院 20xx 届本科毕业论文 10 中主类的相似度。 通过比较,如果发现查询接口 QI1 中属性 e 与 DOCM 中主类 g 相似,并且在 g 的同义词集合中包括同义词 f,那么 DOCM 中的主类 g 可以看作“桥接”,进而推出查询接口 QI1 中属性 e 和查询接口 QI2 中属性 f 是相似的,此时查询接口 QI1 中属性 e 和查询接口 QI2 中属性 f 为 1:1 的简单匹配。 对于 M:N 匹配,首先将其转换为 M∶ 1 匹配和 1: N 匹配,进而获得 M: N 匹配。 例如:某个源查询接口中存在属性“ 公共属性 ”,它包含 2 个条件属性“ date from”和“ date to”,当查找 DOCM 时, DOCM 中包含类属性“ from”和“ to”,并且类属性“ from”和“ tp”在 DOCM 中的概念主类为“ 出版日期 ,那么通过比较可知源查询接口属性“ publication”与 DOCM 中主类“ 出版日期 ”是相似的,进而可以推知“ publication”与“ from”和“ to”为 1:M 匹配,“ date from”与“ publication date”为 M∶ 1 匹配,“ from”和“ to”与“ date from”和“ date to”为 M: N 匹配。 定义 6:基于本体的实例级匹配。 假设 A*表示 Web 数据库查询接口的属性, Ai表示DOCM 中概念节点 Ci 的概念主类,{ CI*}表示 A*的实例集合,{ CIi}表示 Ai 的实例集合,{ NI1, NI2,„, Nik}表示 Ai 的 k 个实例计数器集合。 如果 A*与 Ai 相似,那么 SiM(A*, Ai)≥σ成立,其中σ表示 A*和 Ai 的相似度阈值。 对于查询接口属性 A*的实例 Ins*j, Ins*j∈{ CI*},存在以下几种情况: 1)如果 INs *j∈{ CIi},那么 Nih\j= Nij+ 1; 2)如果 INs*j{ CIi},{ CIi}={ INS1,„ INsk}, SiM(Ins*j, INsM)= Max{ SiM(Ins*j,INS1), SiM(Ins*j, INS2),„, SiM(INs *j, INsk)}≥σ, 1≤ M≤ k,那么 NiM= NiM+ 1,否则表示实例 INs*j 的概念不存在于 Ai 的实例中,那么将 INs*j 作为一个新实例加入 DOCM 中类 Ai 的{ CIi}中,同时,将新实例的初始计数器设置为 1。 例3、假设源查询接口包含属性“ category”,其实例空间为{“ architecture and photo。同类网站查询接口的集成系统设计与实现_毕业论文设计(编辑修改稿)
相关推荐
5 三、项目 SWOT 分析 项目地块优势: 地理位置优越,项目位于宁晋县中心,毗邻 308 国道及汽车站,路线四通八达出行方便。 紧邻商业街及休闲娱乐广场,项目三百米处北方医院,方便就医。 金融,工行、 农行、建行、 餐饮、购物一应俱全。 户型从 110~139 平米不等,三室两厅,楼间距在 60 米以上。 项目地块的劣势 地块较小不利于规划,其次 地价高本项目是宁晋的地王
种,年总蕴藏在 12876吨以上,其中植物药材在 11291吨以上,可供开发利用。 永州 野生 黄柏 在历史上就畅销全国二十多个省市和东南亚各国。 近年来不少北美、西欧国家对中国中药倍加青睐,投入巨资研究中药药理、药性,引进大批中国药材, 黄柏 市场 销 路前景看好。 三、项目业态构成 万亩黄柏药材及套种基地 黄柏深加工企业 中药材交 易市场 四 、 项目 产业开发规划 建好 原料 基地。
age。 这个对象要完成的任务之一就是生成 HTML 流,这些 HTML 流可以返回到 IIS,再从 IIS 返回到客户。 无锡太湖学院 学士学位论文 4 简言之, 首先有一个 HTTP 请求发送到 web 服务器要求访问一个 web 网页。 Web 服务器通过分析客户的 HTTP请求来定位所请求网页的位置。 如果所请求的网页的 后缀是 ASPX,那么就把这个进行处理,然后把 代码交给 CRL。
式升降脚手架属于大型建筑施工设备,它与所有设备一样,需要定期维修保养,其保养的好坏程序直接影响着架子的提升情况和升降脚手架的使用寿命,必须按照制度严格执行。 每次升 降作业五层或间隔一个月,需检查所有扣件是否有松动,机构联结是否可靠,翔云 施工新技术 专项施工方案 导轨式升降脚手架 15 并填写定期检查表。 ,损坏应立即更换。 ,螺纹定期润滑(每周一次)。 ,防水。 链条定期抹防锈油(每月一次)
水,节约用水的原则,结合灌区用水情况渠系配套工程实施后灌区灌溉水利用系数达到,实现灌面 2042亩。 计算灌区水平年用水单位需水量见下表。 同盟水库灌区各月需水量表 单位:万 m3 1 2 3 4 5 6 7 8 9 定额 上旬 中旬 下旬 上旬 中旬 下旬 上旬 中旬 下旬 合计 频率 立夏 小满 芒种 夏至 小暑 大署 m3/亩 P=75% 田 土 P=50% 田 土 同盟水库有效库容
可靠 F23 正 北端 NE0176。 ~ 15176。 E 70 55 8000 可靠 F33 正 NE16176。 SE 70 40 4300 可靠 F35 正 NW18176。 NE 70 25 1500 可靠 F36 正 NE2176。 NW 70 20 960 参考 F37 正 NE42176。 NW 70 15 900 参考 F43 正 NE11176。 NW 70 20 850