基于机器学习的验证码识别算法及实现开题报告
2020-02-18 07:02
1. 研究目的与意义(文献综述)
1.1研究目的及意义
验证码(captcha)是“completely automated public turingtest to tell computers and humans apart”(全自动区分计算机和人类的图灵测试)的缩写,验证码在设计之初只是一个用来区分人和计算机程序的图灵测试,随着互联网的发展,现在的验证码主要作为维护互联网安全的工具。验证码广泛应用在互联网各个领域,也称为互联网安全防火墙,本质上验证码是为了区分人与机器人,防止网络机器人的攻击。一般会出现在用户登录网站、网站的注册、信息的查询、网站发帖等场景。在这些场景中我们希望用户是一个真正的人,而不是计算机程序。图片字符识别对人类来说是很简单的,然而对计算机程序来说却比较难。因此验证码的存在能一定程度的维护一个良好的网络环境。
全球通行的字母、数字验证码是目前最为广泛使用的一种算法较为简单,相对访客而言比较人性化的简单设计之一。随着验证码的普及与发展,最初设计的文本验证码演变出一些新的形式,较为本土化且相对较难的有基于汉字的验证码,目前主要出现在国内,由于中国人的母语是汉语,且汉字的可识别率不是很高,这使得汉字顺利成章的被应用到验证码中,然而由于汉字的局限性,面向全球互通的互联网网站,大多数可以采用的素材还是基于字母和数字的文本验证码。
2. 研究的基本内容与方案
2.1 基本内容
基于机器学习的验证码识别算法及实现:
1、学习并掌握python编程;
3. 研究计划与安排
第1周—第3周 查阅相关资料,明确研究内容,撰写开题报告;
第4周—第5周 学习并掌握python编程;
第6周—第8周 学习机器学习的相关算法原理,撰写论文初稿;
4. 参考文献(12篇以上)
[1] vapnik v n.统计学习理论的本质[m].北京:清华大学出版社,2000.
[2] cristianini n,shawe-taylor j.an introduction to support vector
machines and other kernel-based learning methods[m].us:cambridge university press,2003.
[3] 朱树先,张仁杰.支持向量机核函数选择的研究[j].科学技术与工