登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

基于计算机视觉的物流信息采集系统文献综述

 2020-04-24 11:17:41  

文 献 综 述
一﹑系统开发的背景及意义
互联网技术的快速发展,给人们带来丰富的信息资源和便利。伴随着信息时代的到来,社会的各个行业,领域都发生了巨大的变化,物流业也在时代大背景的影响之下朝着信息化方向发展。随着信息技术的发展,企业间的竞争已突破了地域的限制。企业竞争优势的建立和保持必须以可靠,高效的物流运作为保证,采取高效的物流运作模式来增强竞争实力、提高经济效益。随着信息技术特别是计算机的不断发展,国际互联网的全球化热潮使人类社会进入了一个新的信息时代,因此通过计算机来获取物流信息已经是信息时代到来必然要发生的结果。物流信息识别系统,为企业提供了高效识别物流信息的途径,辅助企业进行现代化的管理,降低了原始的人力时间成本,提高企业的经济效益以及社会效益。
本次毕业设计旨在通过研究学习python,opencv,光学符号识别等技术,用来设计基于python语言编写的物流信息采集系统。本文采用了python语言来进行编写图像识别程序,图像识别程序可以对输入图片进行预处理规范输入图片,切割输入图片,将其分为不同区域,对不同区域进行图片的处理,进一步提高图片质量,确保图片识别精度,最终完成对快递单图片的信息采集。利用了opencv,可以对图片进行各种处理,以确保获得高质量图片,对图像区域切割,缩小识别范围,提高识别精度。本系统使用Tesseract-OCR来进行光学符号识别,对快递单字体进行训练,可自行识别快递单上的中文字体,并提高识别精度,达到收集物流信息的目的。
各方面研究报道表明,城市物流产业正处于快速发展阶段,其带来的如何快速高效的收集物流信息已经是板上钉钉的事情,其研究内容和应用领域已经成为当今大数据背景下的必备属性,因此研究物流信息收集系统很有必要。

二﹑课题设计技术
1.python语言
Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。
简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。
易学:Python极其容易上手,因为Python有极其简单的说明文档 [6] 。
速度快:Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。
免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。
高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。
可移植性:由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。这些平台包括Linux、Windows、FreeBSD、Macintosh、Solaris、OS/2、Amiga、AROS、AS/400、BeOS、OS/390、z/OS、Palm OS、QNX、VMS、Psion、Acom RISC OS、VxWorks、PlayStation、Sharp Zaurus、Windows CE、PocketPC、Symbian以及Google基于linux开发的android平台。
解释性:一个用编译性语言比如C或C 写的程序可以从源文件(即C或C 语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程通过编译器和不同的标记、选项完成。
运行程序的时候,连接/转载器软件把你的程序从硬盘复制到内存中并且运行。而Python语言写的程序不需要编译成二进制代码。你可以直接从源代码运行 程序。
在计算机内部,Python解释器把源代码转换成称为字节码的中间形式,然后再把它翻译成计算机使用的机器语言并运行。这使得使用Python更加简单。也使得Python程序更加易于移植。
面向对象:Python既支持面向过程的编程也支持面向对象的编程。在”面向过程”的语言中,程序是由过程或仅仅是可重用代码的函数构建起来的。在”面向对象”的语言中,程序是由数据和功能组合而成的对象构建起来的。
可扩展性:如果需要一段关键代码运行得更快或者希望某些算法不公开,可以部分程序用C或C 编写,然后在Python程序中使用它们。
可嵌入性:可以把Python嵌入C/C 程序,从而向程序用户提供脚本功能。
丰富的库:Python标准库确实很庞大。它可以帮助处理各种工作,包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器、CGI、FTP、电子邮件、XML、XML-RPC、HTML、WAV文件、密码系统、GUI(图形用户界面)、Tk和其他与系统有关的操作。这被称作Python的”功能齐全”理念。除了标准库以外,还有许多其他高质量的库,如wxPython、Twisted和Python图像库等等。
规范的代码:Python采用强制缩进的方式使得代码具有较好可读性。而Python语言写的程序不需要编译成二进制代码。

2. PyCharm集成开发环境
PyCharm是由JetBrains打造的一款Python IDE,VS2010的重构插件Resharper就是出自JetBrains之手。
同时支持Google App Engine,PyCharm支持IronPython。这些功能在先进代码分析程序的支持下,使 PyCharm 成为 Python 专业开发人员和刚起步人员使用的有力工具。
首先,PyCharm拥有一般IDE具备的功能,比如, 调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制
另外,PyCharm还提供了一些很好的功能用于Django开发,同时支持Google App Engine,更酷的是,PyCharm支持IronPython。
编码协助
其提供了一个带编码补全,代码片段,支持代码折叠和分割窗口的智能、可配置的编辑器,可帮助用户更快更轻松的完成编码工作。

项目代码导航
该IDE可帮助用户即时从一个文件导航至另一个,从一个方法至其申明或者用法甚至可以穿过类的层次。若用户学会使用其提供的快捷键的话甚至能更快。
代码分析
用户可使用其编码语法,错误高亮,智能检测以及一键式代码快速补全建议,使得编码更优化。
Python重构
有了该功能,用户便能在项目范围内轻松进行重命名,提取方法/超类,导入域/变量/常量,移动和前推/后退重构。
支持Django
有了它自带的HTML,CSS和 JavaScript编辑器 ,用户可以更快速的通过Django框架进行Web开发。此外,其还能支持CoffeeScript, Mako 和 Jinja2。
支持Google App引擎
用户可选择使用Python 2.5或者2.7运行环境,为Google App引擎进行应用程序的开发,并执行例行程序部署工作。
集成版本控制
登入,录出,视图拆分与合并--所有这些功能都能在其统一的VCS用户界面(可用于Mercurial, Subversion, Git, Perforce 和其他的 SCM)中得到。
图形页面调试器
用户可以用其自带的功能全面的调试器对Python或者Django应用程序以及测试单元进行调整,该调试器带断点,步进,多画面视图,窗口以及评估表达式。
集成的单元测试
用户可以在一个文件夹运行一个测试文件,单个测试类,一个方法或者所有测试项目。

3.opencv
OpenCV于1999年由Intel建立,如今由Willow Garage提供支持。OpenCV是一个基于BSD许可 (开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效#8212;#8212;由一系列 C 函数和少量 C 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。 最新版本是3.4 ,2017年12月23日发布 。
OpenCV 拥有包括 500 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库#8212;#8212;尽管也可以使用某些外部库。
OpenCV 为Intelreg; Integrated Performance Primitives(IPP)提供了透明接口。这意味着如果有为特定处理器优化的 IPP 库,OpenCV 将在运行时自动加载这些库。主要运用于人机互动,物体识别,图像分割,人脸识别,动作识别,运动跟踪,机器人,运动分析,机器视觉,结构分析,汽车安全驾驶等方面


4. Tesseract-OCR
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
这个包包含一个OCR引擎-libteseract和一个命令行程序-tesseract。Tesseract 4添加了一个新的基于神经网络(LSTM)的OCR引擎,它专注于行识别,但仍然支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式工作。通过使用旧的OCR引擎模式(--oem 0),可以启用与Tesseract 3的兼容性。它还需要支持遗留引擎的培训数据文件,例如来自TessData存储库的文件。支持多种输出格式,如:普通文本、html、pdf等。为了获得更好的OCR结果,您需要提高提供给Tesseract的图像的质量。Tesseract可以被训练识别其他语言

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图