中文垃圾短文本的识别方法研究任务书

 2020-02-11 12:02
设计(论文)主要内容

所谓短文本主要是指手机短信、微博、商品评论、论坛帖子等一类长度较短,字数有限的文本。在该类短文本中,往往存在着大量的违反信息交互平台使用规定的违法的垃圾类文本,例如垃圾短信、广告微博、虚假评论等。本课题要求研究短文本中文分词及特征提取方法,研究基于人工智能识别垃圾短文本的方法,并设计识别算法,编程验证。

完成的主要任务及要求
  1. 调研,了解人工智能以及垃圾短文本识别的国内外研究现状,明确研究内容、技术路线,完成开题报告。阅读的参考文献不少于15篇(其中近五年外文文献不少于3篇)。
  2. 研究短文本中文分词及特征提取;
  3. 学习人工智能知识,掌握Python编程语言及人工智能平台的应用;
  4. 设计实现识别垃圾短文本的神经网络模型;
  5. 编程实现垃圾短文本识别并完成测试;
  6. 翻译不少于5000汉字(或20000英文印刷符)的与课题相关的英文资料。
您需要先支付 5元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,微信号:bysjorg 、QQ号:3236353895;