基于人工智能的商品图像识别与分类的研究毕业论文
2021-04-05 00:35:52
摘 要
随着物联网的兴起,网上购物已经成为人们日常生活中必不可少的一部份,根据图像的一些特征对商品进行分类具有重要的研究价值。淘宝、京东等各大网络购物平台也纷纷加大了在人工智能领域方面的研究与投资,特别是在商品图片自动识别方面。然而传统商品图像分类方法无法对商品的整体特征进行描述且费时费力,针对这一现状,于是有了本文的研究。
本文对如今商品图像分类技术进行了简要研究,并对商品图像识别分类的研究背景及意义进行了介绍,也对国内外研究现状进行了分析。最后经过比较,选用了卷积神经网络(CNN)对图像进行识别与分类。文中对卷积神经网络进行了详细的分析,比如卷积层、池化层、激活函数等,并通过调整相关参数等,得到了分类效果较好的神经网络模型,达到了较高的识别率。
关键词:CNN;商品图像分类;人工智能;深度学习
Abstract
With the rise of the Internet of Things, online shopping has become an indispensable part of people's daily life. It has important research value to classify goods according to some characteristics of images. Taobao, Jingdong and other major online shopping platforms have also increased their research and investment in the field of artificial intelligence, especially in the area of automatic identification of commodity pictures. However, traditional commodity image classification methods can not describe the overall characteristics of commodities and take time and effort. In view of this situation, this paper has studied.
In this paper, the classification technology of commodity image is briefly studied, and the research background and significance of commodity image recognition and classification are introduced. The research status at home and abroad is also analyzed. Finally, after comparison, convolution neural network (CNN) is selected to recognize and classify images. In this paper, the convolution neural network is introduced in detail, such as convolution layer, pooling layer, activation function and so on. By adjusting the relevant parameters, the neural network model with better classification effect is obtained, and the recognition rate is high.
Key words: CNN;commodity image classification;artificial intelligence;in-depth learning
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 1
1.3 图像识别技术的探究 2
1.3.1 图像识别系统 2
1.3.2 图像特征的提取 3
1.4本文研究内容 3
第2章 深度学习技术基础 4
2.1 引言 4
2.2 人工神经网络 5
2.3 BP算法 6
2.4 卷积神经网络 7
2.4.1 卷积层 7
2.4.2 卷积运算过程 8
2.5 池化层 8
2.6 激活函数 9
2.6.1 Sigmoid函数 9
2.6.2 ReLU函数 10
2.7 损失函数 10
2.8 Dropout技术 11
第3章 开发工具及数据集准备 12
3.1 Keras 介绍 12
3.1.1 Keras与TensorFlow之间的关系 12
3.1.2 Keras设计原则 12
3.2 Fashion-Minist数据集的准备 13
第4章 系统设计与实现 15
4.1 卷积神经网络的形成流程 15
4.2 卷积神经网络的具体构建 15
4.2.1 模型创建 16
4.2.2 模型设置 16
4.2.3 模型可视化 17
4.2.4 模型搭建 17
4.2.5 训练与测试 18
4.3 训练结果与分析 18
4.4 识别结果与分析 20
第5章 总结与展望 22
5.1 总结 22
5.2 展望 22
参考文献 24
致谢 25
第1章 绪论
1.1 研究背景及意义
随着物联网时代的到来,电子商务在国内乃至世界范围内快速发展,越来越多的人们习惯与在网络上购物,且这一比例逐年攀升。网络购物给我们的生活带来了方便之处,大家无论在哪里,无论什么时候,都可以通过网络购买到自己想要的商品。因此各种网络购物平台应运而生,比如京东、淘宝、亚马逊等。然而这些购物网站很大一部分是依靠关键字词搜索系统进行商品搜索的。这可能会造成两方面的问题:一方面是这种系统需要商家事先对商品图像进行分类,再将其增添上相应的文字标注,但仅仅靠这些标注不能完全反映商品的视觉特征。并且随着商品图像数量的飞速增长,人工标注必定会消耗很大的人力物力与财力,使商家的工作效率低下。另一方面是当用户按照自己的需求搜索商品关键词时,往往会带有主观性,这有可能会导致检索出来的商品图像结果与用户期望大相径庭,从而使购买者购买商品的效率大大降低。怎样能将购物平台的商品检索效率提升上去越来越成为大家关注的问题,利用图片数据进行商品的检索,可以减少检索时对文字数据的依赖性。
深度学习在图像处理方面发挥了重大的作用,卷积神经网络作为其中的一种的简便高效算法,并不需要像其它一些网络结构进行繁琐的预处理与特征提取,所以在图像识别、分类、分割等相关领域得到了广泛应用,如何更好地利用卷积神经网络进行商品图像的识别和分类成为我们研究的问题。
1.2 国内外研究现状
关于商品图像分类的研究一直都是学术界的热点,近些年来很多学者提出了一些商品图像分类方法,其中就包含基于内容,也就是基于图像特征的商品图像分类方法,例如图像的颜色、形状、纹理等特征。应用较为普遍的特征有全局描述符(GIST)[1]、尺度不变特征(Scale-invariant Feature Transform, SIFT)和加速稳健特征(Speed Up Robust Features,SURE)[2]、塔式关键字直方图(Pyramid Histogram of Words, PHOW)[3]、局部二值模式(Local Binary Pattern, LBP)[4]、塔式边缘方向直方图(Pyramid Histogram of Edge Orientation Gradients,PHOG)[5]、词包(Bog of Words, BOW)[6]。LBP、SURE、SIFT等为局部特征,而GIST、PHOG、PHOW为全局特征,在实现商品图像分类时,通常需要这些特征与支持向量机(Support Vector Machines,SVM)和AdaBoost等机器学习方法相结合。但是使用这些方法提取出的图形特征是低层视觉的,与图像的深层语义特征有着较大的语义鸿沟,所以整体的识别精度不是很高。单纯的通过细微的差别达到良好的分类效果也是一项有挑战性的工作。目前在精细分类领域,已经有相对较多的针对花、鸟、车以及人的动作等分类的研究。其中有的用的是机器学习的方法,也有的用的是非机器学习方法的,或者是利用特征法,如文献[7]就是利用BOW等特征实现对花的精细分类。相对来说应用深度学习的实现商品图片分类的方法不是很多。
在2006年,“深度学习”这一概念由机器学习领域的专家Hinton提出[8]。它通过建立数个隐蔽层的深度神经网络来对人脑结构进行模仿,并对大规模的输入数据中的深层次、抽象的特征进行学习。与传统的方法相比,利用深度学习可对输入图像数据有着更本质的分析与描述。因为深度学习方法可以具体化人类大脑神经网络的“抽象概念”,所以人们希望最后可以利用这种法让计算机去做一些只有人才能完成的工作。
1.3 图像识别技术的探究
1.3.1 图像识别系统
图像作为一种人类直接获取的信息来源,已经随着计算机等技术的发展而被应用到交通安全、工业生产销售等各个行业。而实现商品的自动化识别的核心就是图形识别,它的主要过程是:首先将经过预处理的商品图像进行特征提取;再选定某种特定的判别准则如词袋模型、神经网络等对图像的商品进行分类,实现商品识别。