登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

基于图像识别的垃圾分类app毕业论文

 2021-11-27 10:11  

论文总字数:19787字

摘 要

随着我国生活水平的不断提高,人民物质生活越来越丰富。但与此同时,垃圾产生量的不断增长带来了前所未有的环境压力。为了缓解此压力,我国多地开始实施垃圾分类政策。本人针对垃圾分类的难点,开发了一款基于图像识别的垃圾分类app。

本文主要进行了基于图像识别的垃圾分类的研究,通过使用迁移学习的方法对结构为ResNet-50网络 SoftMax分类器的模型进行训练;同时采用参数调整、数据增强等手段对模型进行调优。对于训练后的模型,则基于Flask框架将其预测功能封装为垃圾图像分类API。最后,采用API调用 数据解析的策略进行安卓app的开发,实现了垃圾图像的识别与分类。

本文开发的这款app,能够大大降低垃圾分类的难度,为用户提供多种搜索方式,并可用于快速确定垃圾类别,在保证垃圾分类准确率的同时,提高了垃圾分类的效率,推动我国垃圾分类事业的发展。

关键词:垃圾分类;ResNet-50;数据扩充;迁移学习;安卓

Abstract

With the improvement of living standards in China, people's material life is richer and richer. But at the same time, the growing amount of garbage has brought unprecedented environmental pressure. In order to alleviate this pressure, the waste classification policy has been implemented in many places in China. Aiming at the difficulty of garbage classification, I developed a garbage classification app based on image recognition.

This paper mainly studies the garbage classification based on image recognition, and trains the model with the structure of ResNet-50 Network SoftMax classifier by using the method of transfer learning, and optimizes the model by means of parameter adjustment and Data Augmentation.With the trained model, the prediction function is encapsulated as garbage image classification API based on the Flask framework. Finally, the strategy of API call data analysis is used to develop an android app which realizes the recognition and classification of garbage images.

The app developed in this paper can greatly reduce the difficulty of garbage classification, provide users with a variety of search methods to determine garbage categories. While ensuring the accuracy of garbage classification, it improves the efficiency of garbage classification and promotes the development of garbage classification in China.

Key Words:garbage classification;ResNet-50;Data Augmentation;transfer learning;Android

目 录

第1章 绪论 1

1.1 研究背景及意义 1

1.2 研究现状 1

1.3 研究内容及结构安排 2

第2章 模型训练 3

2.1 深度学习 3

2.1.1 神经网络 3

2.1.2 卷积神经网络 5

2.1.3 ResNet 8

2.2模型准备 10

2.2.1 开发环境 10

2.2.2 数据集 10

2.2.3 模型设计 12

2.2.4 参数设定 12

2.3 模型搭建 13

2.3.1 初始模型 13

2.3.2 模型调优 14

2.4 模型预测 15

第3章 App的设计与实现 18

3.1 App名称与图标 18

3.2 App UI设计 18

3.3 App功能设计与实现 20

3.3.1 图像搜 20

3.3.2 文字搜 21

3.3.3 语音搜 23

3.3.4 常见分类指南 24

第4章 结论 26

参考文献 27

致 谢 28

第1章 绪论

1.1 研究背景及意义

随着我国人民物质生活不断丰富,生活垃圾产生量不断增长。根据《2019年全国大中城市固体废物污染环境防治年报》提供的数据,2018年城市生活垃圾产生量为21147.3万吨,较2017年有所提高。如果不能合理处置生活垃圾,将带来一系列问题,包括污染环境,占用土地资源,造成疾病传播等,因此垃圾分类就显得尤为重要。将垃圾进行分类,然后根据分类的不同性质对垃圾进行区别处理,不但能减少环境污染,还将大大提高资源利用效率。

2019年,上海作为试点城市开始施行垃圾分类。2020年,全国将新增46个城市实施垃圾分类,垃圾分类正在成为一项全民运动。通过居民调查,7成居民表示知道垃圾可分为4大类,但是对于所给垃圾能够完全正确分类的居民仅不足4成,分类标准过于复杂或将成为全民垃圾分类的最大障碍。为了更好地解决群众对于垃圾分类经验不足的问题,本研究主要内容是设计并开发基于图像识别的垃圾分类app,该app可通过多种搜索方式帮助使用者快速确定垃圾类别,从而提高垃圾分类的效率,推动我国垃圾分类事业的发展。

1.2 研究现状

卷积神经网络常用于图像识别,它对提升计算机视觉的研究水平和实际性能起到了举足轻重的作用。1998年,Y.Lecun等人将卷积层和下采样层相结合,建立了卷积神经网络的现代雏形——LeNet[1]。2012年,Alex Krizhevsky团队提出了一种非常重要的卷积神经网络模型AlexNet[2],AlexNet通过运算能力更强的GPU和运算速度更快的激活函数ReLu极大的提高了模型的训练速度,并在2012年的ILSVRC图像分类的竞赛中获得冠军,吸引了学术界和工业界的广泛关注。随着卷积神经网络研究的推进,网络结构开始不断纵深化发展,为了解决因层数增加带来的正确率退化问题,科学家们开始研究深层残差网络。微软团队开发的ResNet[3]是深层残差网络的出色代表,该网络通过导入以多个卷积层为间隔的跳跃式 “快捷结构”来加深层,从而达到性能随着层的加深不断提高的目的,最终在2015年的ILSVRC竞赛中获得了图像分类、检测和定位的三项第一。

卷积神经网络应用于图像识别领域成效显著,图像识别技术的发展带给了机器“认识世界”的全新方式。一些科研团队致力于将图像识别技术运用于垃圾分类,TechCrunch Disrupt Hackathon团队进行了一项名为“自动垃圾箱”的研究[4],该研究通过使用树莓派和摄像头模块以确定垃圾是否适合进行回收,但是该项目的只能对垃圾是否可回收进行分类,不符合实际生活的需要。Tung团队利用scratch-CNN结构对图像进行了一系列特征提取,并利用支持向量机对垃圾进行分类[5],垃圾类别中包括玻璃、纸张、金属、塑料、纸板和其他垃圾,但是该项目识别的准确率较低,支持分类的垃圾类别也较少。Yinghao Chu团队不仅利用深度学习对垃圾的图像特征进行提取,还利用传感器对垃圾的其他物理特征进行提取[6],多层感知器通过整合所有特征对垃圾进行分类,可完成50种分类,准确度也比较高,但这无疑会增加硬件成本。

科技公司顺应时代潮流,纷纷推出了垃圾分类工具。CleanRobotics公司开发了一款智能垃圾箱TrashBot,当垃圾被放入回收处后,相机和传感器会快速分析被丢弃物品的类型,然后将其送到相应的垃圾箱中,该垃圾箱响应速度快,准确率高,但是昂贵的价格显然不能被广大用户所接受。国内互联网公司纷纷上线了垃圾分类应用,微信上出现了“垃圾分类管家”“垃圾分类”等小程序;支付宝上提供了“蚂上回收”,“易代扔”等上门回收或代扔服务;除此之外,如“什么垃圾”,“垃圾分类达人”等手机app也相继出现。基于检索垃圾数据库,用户可以通过文字查询获取垃圾类别,但是操作复杂、搜索方式单一等缺点直接影响了这类应用的交互体验,不利于用户使用和产品推广。

1.3 研究内容及结构安排

本研究主要内容是开发基于图像识别的垃圾分类app,该应用包含图像搜、文字搜、语音搜、常见分类指南等主要功能。

  1. “图像搜”核心功能使用垃圾图像分类API实现。具体来说,基于Flask框架将模型封装为垃圾图像分类API,使用随机裁剪方法进行预处理,使用ResNet-50网络结构进行特征提取,使用SoftMax分类器进行垃圾分类。用户调用手机的相机功能拍照,上传垃圾图片后,API返回垃圾类别。
  2. “文字搜”核心功能使用天行数据提供的垃圾分类API实现。用户搜索关键词后,API返回垃圾类别。
  3. “语音搜”核心功能使用讯飞语音提供的语音转写API实现。用户以语音方式输入后,语音被API转写为关键词,然后搜索关键词返回垃圾类别。
  4. “常见分类指南”核心功能使用爬虫实现。用户下拉刷新后,爬虫获取常见分类,并返回显示,常见分类数据来自垃圾分类网站。

本论文的结构如下:第一章为绪论;第二章介绍了模型的结构,模型的训练过程与调优方法,以及模型的预测功能;第三章描述了app的设计与实现,即应用开发过程;第四章则对整个毕业设计进行总结。

第2章 模型训练

2.1 深度学习

2.1.1 神经网络

神经网络是深度学习的基本计算模型。该模型包含输入层、隐藏层和输出层三种层次结构,如图2.1所示。它能够从输入数据中自动学习参数,从而应用于分类,回归等问题。

图2.1 神经网络

神经网络的每一层都由神经元构成,输入层的神经元用于提供输入;隐藏层和输出层的神经元接收来自上一层的输入,经过线性函数和激活函数计算后输出。如图2.2所示。

图2.2 神经元单元

请支付后下载全文,论文总字数:19787字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图