登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 理工学类 > 信息与计算科学 > 正文

基于SVM实现并优化文字识别开题报告

 2022-01-07 10:01  

全文总字数:2230字

1. 研究目的与意义及国内外研究现状

近年来,随着计算机的迅速发展,模式识别技术不断取得新的进展,大大改善了人机之间的信息交互能力。计算机文字识别是模式识别的一个重要分支,它包括 数字字符识别、西方文字字符识别、东方文字字符识别。数字字符识别和英文字符 识别研究最充分,识别方法比较成熟,识别率也比较高;而东方文字字符识别比较困难,其中汉字字符识别是文字识别中最困难的部分。

汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模 式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式 语言与自动机、模糊数学、组合数学、信息论、中文信息处理等学科,也涉及到语言文字学、心理学、仿生学等,是一门综合性技术。 计算机文字识别是使汉字和其它字符高速自动输入计算机,解决了汉字信息处 理系统中手动输入效率低这一关键问题的理想途径,是办公自动化不可缺少的文字 自动输入手段,是智能计算机智能接口的重要组成部分。同时联机手写汉字识别是 一种很方便的汉字输入方式,而且字符图像经识别后形成的代码,在信息量上减少了百分之九十九以上,对信息压缩和传输有重要意义。

汉字识别是一种难度非常大的模式识别。这是因为:从客观上讲,汉字是一种特殊的模式集合,其模式种类很多,结构非常复杂,有的模式又十分相似,加上印刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等原因,都使得汉字字符的识别十分困难。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

1.静态图像不同文字提取的处理流程:

(1) 人工文字:

人工添加的文字一般来说有以下几个特点,文字大小固定,色调单一并且相对于背景色更为鲜明,分布较为集中,排列方式一般为横向或纵向。针对以上几个特点设计相应方法。具体实现:图片预处理,包括灰度化,二值化,实现基于二值化聚类的图像文字提取。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

进度安排:

1-3周 选定研究方向,确定论文题目,完成任务书填写

4-5周 明确研究方向,研究内容,完成开题报告

6-8周 查阅相关文献,学习该课题相关专业知识

9-10周 对完成该课题制定初步设计方案和详细计划

11-12周 完成绪论与基础知识介绍部分

13-15周 进行详细实验设计,得出结果,完成初稿

16周 与导师沟通对初稿进行全面修改整理

17周 论文答辩

预期效果:

在保证对于纯汉字识别正确率不低于90%的情况下,提高汉字识别速度,尽可能达到实时识别

4. 参考文献

[1]姚聪.自然图像中文字检测与识别研究[d].华中科技大学,2014

[2] 张进猛,张进秋.基于opencv的图像采集和处理[j]. 软件导刊. 2010(01)

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图