双语语料库段落重组对齐方法研究内容摘要:
tence Number in English TextSe n ten ce Nu m b e r in Ch in e se Te xt BInformation Retrieval Lab HIT 20 段落重组对齐 总体思想 篇章定位 句长搭配 词典校对 Information Retrieval Lab HIT 21 形式对齐评价函数 P[i,j] = a(Pu[i,j]P0)178。 + (Pl[i,j] P0)178。 + a(Pd[i,j] P0)178。 P0为对应文本长度之比; Pu[i,j]为对应上文部分长度之比; Pl[i,j]为对应句长度之比; Pd[i,j]对应下文部分长度之比; a为加权系数 Information Retrieval Lab HIT 22 第 150句 第 50句 第 12句 英语文本 第 120句 第 40句 第 10句 汉语文本 重组段落对齐思想 P0 锚点句对 Pu[i,j] Pl[i,j] Pd[i,j] Information Retrieval Lab HIT 23 锚点句对的校验 词典检验 L| |表示全部元素的字符长度和; Match(S)表示译文出现在汉语句中英语单词; Match(T)表示成为英文单词译文的汉语单词 ; | ( ) | | ( ) || | | |L M a tc h S L M a tc h THL S L TInformation Retrieval Lab HIT 24 主要内容 引言 方法 结果 讨论 Information Retrieval Lab HIT 25 试验结果 (1) 召回率 = (返回段落总数 – 错误段落总数)/ 双语文本中 (1:1)型正确句珠总数; 准确率 = (返回段落总数 – 错误段落总数)/ 返回段落总数; Information Retrieval Lab HIT 26 试验结果 (2) 文本 1 文本 2 (1:1)型句珠总数 158 169 提取锚点总数 108 121 准确率 % 100% 召回率 % % 重组分段的结果一般每一段落的句子数在10句以内。 Information Retrieval Lab HIT 27 重组分段的实例 (1)original Around 30 people have staged a naked protest against GM food. The protesters spelled out no GM with their bodies in a meadow at Forest Row, East Sussex. Organiser Mike Grenville said he hoped it would send a message to the Government of people39。 s concern, particularly over mercial planting of GM crops. Mr Grenvil。双语语料库段落重组对齐方法研究
相关推荐
竞争力的提升 人才素质的提升和优秀人才引进 发展中企业的信息化与管理 企业 IT是企业竞争力的基础 信息化的本质是管理,是基于 IT平台的先进理念与方法的构建 管理不可能在一夜之间飞跃,需要思想、方法、企业文化与素质、工具的不断互动 信息化的目的是支持业务和管理,不能本末倒置 在发展中改进管理,在 IT支持下发展管理 IT建设的“最近发展区”理论 “
题 – 但是, 会阻碍创新性公司的参与和“专利”技术的使用 • 公平、合理非歧视 的益处 (允许收取专利费的情况下) – 促进创新型公司的参与和“专利” 技术的应用 – 专利所有者并非一直都收取专利使用费 – 但 这需要 披露政策,并且很难设定“合理”的 司法 标准 7 专利权使用政策 • 非歧视性并不意味 对所有人 收取 同样的费用 –不应歧视“ 状态相似 ” 专利品 –不同种 专利品
并指导把回忆的资料整理出来,为学习本版块打下情感的基础,以便更好地实现与文本的对话。 依据的理论 1.阅读教学以读为本,在读中理解感悟。 2.根据 《 语文课程标准 》 中的“阅读是学生个性化的行为,不应该以教师的分析代替学生的阅读实践。 ”这一要求,结合本版块的特点及学生的实际情况 信息技术应用分析 知识点 学习水平 媒体内容与形式 使用方式 使用效果 认识消化文中重点句子 深入感悟 多媒体
50% lesion in the right coronary artery . One month later the patient underwent CABG. Case 4 GTB A 58yearold man presented with mild congestive heart failure 1 year. He had often experienced a chest
xc tgxtg 22 45 0,0)2,0( c t gxt gxx 9225 c tg xtg x当且仅当 号时取即 2,22 2 t g xxtgc t g xt g x返回 3322234322,0,0 babaababa333 223,212,21,2,2 取最小值时即当即于是当 babababa 法一: