登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

基于循环神经网络的文本识别研究与应用毕业论文

 2021-11-01 09:11  

摘 要

在图片数据越来越多的今天,如何精确的识别图像中的文本内容,成为了行业中的热门话题。对于有字典的图像文本识别来说,其可以看作一个多分类问题。在深度学习领域,目前有很多可以运用在图像文本识别中的方案。本文针对图像中的文本识别问题,研究了基于循环神经网络下的相关知识并构建了文本识别模型。

本文主要工作:

  1. 学习了深度学习中的相关知识,了解了神经网络的基础概念及几种主流的神经网络形式;针对循环神经网络进行了深度研究,理解其模型结构和数据的流转规则,同时针对循环神经网络中LSTM和GRU两种主流模型,研究了其隐藏层的结构和相关数据计算过程。
  2. 利用循环神经网络构建了图像文本识别模型;使用HWDB1.1数据作为训练集。首先对数据集进行了处理,提取出了数据集的图片数据并分类存储,同时将图像数据进行规范化处理,构建了由图像-标签组成的中文字符图像训练集,最后分别构建了以LSTM和GRU网络作为主要结构的图像文本识别模型。
  3. 测试构建的两种模型,同时利用以CNN网络构建的文本识别模型作为对照组,得到了三者的训练数据;对数据进行了相关分析,提出了影响准确率的几种因素,进行了根据几种因素所构建的优化实验,并对后续基于循环神经网络的文本识别研究提出展望。

关键词:深度学习、循环神经网络、文本识别

Abstract

Today, with more and more image data, how to accurately identify the text content in the image, has become a hot topic in the industry. For image text recognition with dictionaries, it can be regarded as a multi-classification problem. In the field of deep learning, there are many programs that can be used in image text recognition. With the aim of solving the problem of text recognition in images, this paper examines the relevant knowledge, which is based on recurrent neural network, and builds up a text recognition model.

The main work of this paper:

1) This article examines the relevant knowledge about deep learning, understands the basic concepts of the neural network and several mainstream neural network forms, examines the recurrent neural network, understands its model structure and data flow rules, and investigates the structure of its hidden location and data calculation process for the two mainstream models of LSTM and GRU in the recurrent neural network.

2 The recurrent neural network is used to construct the image text recognition model, and the HWDB1.1 data is used as a training set.

First, the record is processed and the image data of the record is extracted and classified.

At the same time, the image data is standardized and the Chinese drawing image training is built from image label.

Finally, the image text recognition models are set up with LSTM and GRU network as the main structure or structure..

3) The training data of the three models are determined as a control group using the CNN network based text recognition model, the correlation analysis of the data is carried out, several factors that influence accuracy, the optimization experiments are carried out on several factors and the prospect of subsequent text recognition research based on recurrent neural networks is provided.

Key Words: Deep learning, Recurrent neural network, text recognition

目录

第1章 绪论 6

1.1 研究背景及意义 6

1.2 国内外研究现状 7

1.2.1 图像文本识别研究现状 7

1.2.2 循环神经网络研究现状 7

1.3 数据集介绍 8

1.4 论文的主要研究内容和工作 10

1.5 论文的组织结构 11

第2章 基于循环神经网络的文本识别研究 12

2.1 深度学习相关概念 12

2.2 几种神经网络的主要模型介绍 13

2.2.1 前馈神经网络(Feedforward Neural Network,FNN) 14

2.2.2 卷积神经网络(Convolutional Neural Networks,CNN) 15

2.2.3 循环神经网络(Recurrent Neural Network, RNN) 16

2.3 循环神经网络的两种变体介绍 17

2.3.1 LSTM模型 17

2.3.2 GRU模型 19

第3章 基于循环神经网络的文字识别模型 20

3.1 实验设置 20

3.1.1 实验平台介绍 20

3.1.2 实验环境 21

3.2 数据预处理相关操作 21

3.2.1 HWDB数据解析 21

3.2.2 图像数据预处理 23

3.3 基于LSTM、GRU的文字识别模型搭建 25

3.3.1基于LSTM的文字识别模型搭建 25

3.3.2 基于GRU的文字识别模型搭建 28

第4章 实验结果及数据分析 30

4.1 实验结果展示 30

4.2 实验数据分析 32

4.3 实验优化 32

第5章 总结与展望 35

5.1 总结 35

5.2 展望 35

致谢 37

参考文献 38

第1章 绪论

在这个信息爆炸的时代,文字信息不仅仅是以单纯的文本形式出现在人们的视野中,图片、视频中也包含着非常多的文本信息。随着深度学习理论和相关技术的不断发展,如何将这些技术应用在现实生活的场景中,尤其是识别各种形态下包含的文本信息,将深度学习的相关技术真正转化为可以解决实际问题的方案,成为了学术界和各种公司所关注的热点方向。

研究背景及意义

图像识别是近些年来各行各业尤其是互联网行业高度关注的方向之一。其中图像识别又包括了图像特征识别和图像内容识别,在图像内容识别领域,图像中的文本识别又是最为重要也是被应用得最为广泛的一种技术。早期的图像文本识别主要依赖于人工,人们从需要被提取的图像数据中找到有效的文本内容,识别出具体的含义然后通过手动的方式完成自动化上传,由于早期的图像文本识别主要是运用在一些领域需要将图片上的内容数字化,因此这样的人工完成尚且能够胜任;随着数字化的发展,各个领域尤其是个人对于图像文本识别的需求开始迅速增长,需要被处理的图像量级也开始疯长,这已经不是人工可以完成的规模了。随着深度学习在图像领域的发展,如何把这种技术运用在图像文本识别中成为了很多人的研究方向。

随着近些年来计算机算力的不断增长,以及涌现了一大批人工难以高效处理的需求,机器学习的相关理论被越来越广泛的提及和运用到实际场景中,在单层神经网络的基础上,涌现了很多具有更复杂神经网络结构的神经网络模型,其中循环神经网络(RNN)由于其拥有着能够根据上一个时序输出来对当前时序进行影响的特殊网络结构,相比于卷积神经网络等其他神经网络模型,其能够根据之前的训练结果对后续的学习产生影响,能够更好的处理包含序列的信息。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图