专利名称:基于共享编码器的汉越无监督神经机器翻译方法专利类型:发明专利
发明人:余正涛,薛振宇,文永华,郭军军,王振晗,相艳申请号:CN202010985908.8申请日:20200918公开号:CN112287694A公开日:20210129
摘要:本发明涉及基于共享编码器的汉越无监督神经机器翻译方法。本发明只使用汉语和越南语的单语语料,用无监督的方式进行训练。首先使用数字对齐作为种子词典训练汉越双语词嵌入。然后再将该双语词嵌入应用到共享编码器模型中,将汉语和越南语映射到同一语义空间,然后再分别使用解码器对越南语和汉语分别解码,实现基于共享编码器的汉越无监督神经机器翻译。本发明在极低资源下汉越无监督神经机器翻译模型相较于GNMT和Transformer有很大的优势,并且在该无监督模型基础上加入少量平行语料后训练的半监督的翻译模型超过了直接使用相同量的平行语料训练的有监督翻译模型。
申请人:昆明理工大学
地址:650093 云南省昆明市五华区学府路253号
国籍:CN
代理机构:昆明人从众知识产权代理有限公司
代理人:何娇
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务