登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 任务书 > 计算机类 > 计算机科学与技术 > 正文

基于机器学习的Stack Overflow问答平台自动标记的设计与实现任务书

 2020-04-17 07:04  

1. 毕业设计(论文)的内容和要求

本课题的目标旨在建立一个简单的模型来预测stack overflow问答平台上问题的标签。

使用”关键字”或”标签”标记问题对于分类问题和帮助用户高效,快速地查找自己想要寻找的问题非常有用。

stack overflow问答网站还使用标签对问题进行分类,以帮助确保用户了解与其专业领域或兴趣相关的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 参考文献

[1] 周志华.机器学习[M].北京:清华大学出版社,2016:121-171. [2] 何宇健.Python与机器学习实战:决策树、集成学习、支持向量机与神经网络算法详解及编程实现[M].北京:电子工业出版社,2017. [3] 裔隽,张译檬.python 机器学习实战[M].上海:科学技术文献出版社,2018:259-268. [4] 闫龙川,高德荃译.python文本分析[M].北京:机械工业出版社,2018:124-158. [5] 丰成平.中文文本分类算法的设计与实现[D].西安:西安交通大学,2013:21-24. [6] 王懿. 基于自然语言处理和机器学习的文本分类及其应用研究[D].中国科学院研究生院(成都计算机应用研究所),2006. [7] 周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005(02):85-86. [8] 刁倩,王永成,张惠惠,何骥.文本自动分类中的词权重与分类算法[J].中文信息学报,2000,(03):24-29. [9] 张东礼,汪东升,郑纬民.基于VSM的中文文本分类系统的设计与实现[J].清华大学学报(自然科学版),2003(09):1288-1291. [10] 申红,吕宝粮,内山将夫,井佐原均.文本分类的特征提取方法比较与改进[J].计算机仿真,2006(03):222-224. [11] 崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013,30(02):299-302 368. [12] 黄承慧,印鉴,侯昉.一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J].计算机学报,2011,34(05):856-864. [13] 平源.基于支持向量机的聚类及文本分类研究[D].北京:北京邮电大学,2012. [14] 王小林,杨林,王东,镇丽华. 改进的TF-IDF关键词提取方法[J]. 计算机科学与应用,2013,03(01). [15] 殷功俊.基于词向量的向量空间模型的改进[J].现代计算机(专业版),2018(36):32-35 41. [16] 施聪莺,徐朝军,杨晓江.TF-IDF算法研究综述[J].计算机应用,2009,29(S1):167-170 180. [17] 王之鹏. Web文本分类系统中文本预处理技术的研究与实现[D].南京理工大学,2009. [18] 秦玉平. 基于支持向量机的文本分类算法研究[D].大连理工大学,2008. [19] Mostafa Ali,Yasser Mohamed. A method for clustering unlabeled BIM objects using entropy and TF-IDF with RDF encoding[J]. Advanced Engineering Informatics,2017,33. [20] Mazhar Ali Dootio,Asim Imdad Wagan. Development of Sindhi text corpus[J]. Journal of King Saud University - Computer and Information Sciences,2019. [21] Goertzel, B., Venuto, J.. Accurate SVM Text Classification for Highly Skewed Data Using Threshold Tuning and Query-Expansion-Based Feature Selection[P]. Neural Networks, 2006. IJCNN '06. International Joint Conference on,2006. [22] Kinto, E.A., Del-Moral-Hernandez, E.. SVM - Neighbor based candidate working set selection applied on text-categorization[P]. Neural Networks (IJCNN), The 2010 International Joint Conference on,2010. [23] Gayathri, K.,Marimuthu, A.. Text document pre-processing with the KNN for classification using the SVM[P]. ,2013. [24] Gultyaeva, T.A.,Korotenko, D.Y.,Popov, A.A.. Application of the hidden Markov models, KNN and SVM for a classification problem modes of power supply system[P]. ,2012.

3. 毕业设计(论文)进程安排

2019-1-1~2019-1-18 搜集相关资料,分析题目需求,完成开题报告 2019-1-19~2019-2-20 研究和学习相关理论和技术,阅读相关论文 2019-2-21~2019-3-25 分析需求,收集数据,提出大致思路 2019-3-26~2019-3-30 不同模型训练并分析,选择合适模型 2019-3-31~2019-4-5 完成详细开发方案,完成模型的训练和测试 2019-4-6~2019-5-6 环境搭建和系统的开发与部署 2019-5-7~2019-5-31 论文撰写 2019-6-1~2019-6-10 论文修改与答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图