中科院自动化所评测技术报告systemii内容摘要:
g r a m L M双 语 语 料G I Z A + +C A S I A 短 语 抽 取与 概 率 计 算作 为 I n i t i a l P h r a s e分 层 短 语 系统 , 抽 取 带 变量 短 语 与 概 率计 算转 换 数 据 结构 , 二 进 制 存储转 换 数 据 结构 , 二 进 制 存储多 个 1 b e s t 结果 以 替 代 N b e s t 结 果多 个 1 b e s t 结果生 成 1 b e s t构 建 混 淆 网 络M B R 解 码 器调 序模 型融合模块短语系统分层短语系统数 据 过 滤依存树到串系统转 换 数 据 结构 , 二 进 制 存储采 用 和 分 层 短语 相 同 的 文 法解 码 算 法 输 入是 树 , 线 图按 照 树 节 点 来索 引多 个 1 b e s t 结果 以 替 代 N b e s t 结 果源 语 言 依 存 句法 分 析Institute of Automation, Chinese Academy of Sciences 中国科学院自动化所 评测环境概要 软硬件环境 运行时间 (约 4000句测试集 ) 运行平台 操作系统 数量 CPU RAM PC机 Windows 2020 2 Pentium 4, 服务器 Linux (Ubuntu) 1 Xeon 2 系统 新闻领域 (小时) 科技领域 (小时) 短语系统 16 分层短语 20 18 依存树到串 18 16 Institute of Automation, Chinese Academy of Sciences 中国科学院自动化所 数据 开发数据: 新闻 2020 SSMT英中翻译测试集 科技 CWMT08提供的 Special语料中随机挑选 200句 翻译模型训练数据: 新闻 CWMT08提供的 Common,约 85万句对和;NIST MT08评测提供语料,大约 670万句对 科技 CWMT08提供的 Spec。中科院自动化所评测技术报告systemii
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。