登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 软件工程 > 正文

面向中文-阿拉伯语机器翻译的分词与词对齐技术研究开题报告

 2021-02-25 01:02  

1. 研究目的与意义(文献综述)

数年前,搜索引擎公司先后上线了机器翻译业务,并凭借其强大的数据挖掘和机器学习能力,不断扩充语言数量、提高翻译质量,提升整体的机器翻译水平。以百度翻译为例,目前已扩充至16种语言,186个语言方向,并支持对文本和网页的翻译,某些场景准确率已经达到实用水平。

机器翻译一个新的趋势是正在“实用化”,被应用到生活场景中。过去机器翻译像是一个“更智能的词典”,帮助人们阅读外文网页内容。现在随着语音和图像识别技术的进步,机器翻译可以更多地与生活场景结合。比如人们出国时可用百度翻译了解菜单、店名、商品信息,看美剧时可以用电脑进行字幕翻译,通过拍照直接翻译出一朵花的名字,再比如开头提到的机器人进行多语翻译采访等等。

相比人工翻译,机器翻译可以大幅节约翻译时间,提高翻译效率,满足诸如资讯等时效性要求较高或者海量文本的翻译需求,极大地降低了人力成本。而更重要的是,它让跨语言交流变成每个人都可以拥有的能力:出国、工作、学习很多时候不再求助于人,语言不通不再是人们获取信息和服务的障碍。

近些年来,随着大数据的涌现,机器翻译取得的进展有目共睹。通过对海量数据的汇聚、分析、组合,当数据无限多时,机器翻译也许根本不需要再去了解一个句子的意思,也可以翻译得相当漂亮。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

设计的基本内容及目标:

1、 研究阿拉伯语与中文语料库,寻找现有高质量可以用于阿拉伯语与中文的语料库;

2、 研究不同预处理技术,特别是分词技术对机器翻译性能的影响;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1. 第1周至第2周:查阅有关的参考资料并完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。(2017.3.2)

2. 第3周至第6周:熟悉所选用的开发平台,运用所学的软件设计理论,完成整个系统的前期设计工作。(2017.4.10)

3. 第7周至第13周:进行系统的编码、调试、集成、测试工作。(2017.5.29)其中第10周左右(2017.5.4-7.8)进行毕业设计中期检查,需要提交论文前三章和毕业设计框架。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

参考文献:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图