登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 电子信息工程 > 正文

基于人工智能的商品图像识别与分类的研究开题报告

 2020-02-18 06:02  

1. 研究目的与意义(文献综述)

物联网时代到来后,电子商务在世界范围内急速发展,占有极大比例的人群越来越习惯于网络购物。网络购物带来了极大的便利,使得人们足不出户就可以购买商品,因此国内外出现了非常多的网上购物平台,如天猫、京东、亚马逊等。但这些购物网站大多数是基于关键字的商品搜索系统。一方面,该系统要求商家首先对商品图像进行分类,然后添加对应的文字标注,但这些标注很难全面反映商品的视觉特征,并且由于商品图像数量的急剧增加,人工标注会耗费极大人力物力,大大降低了商家的工作效率。另一方面,用户根据自己的商品需求输入关键字进行搜索时带有主观性,这会大概率出现不同的用户需求却输入了相同的关键字,或者是相同的用户需求输入了不同的关键字,这两种情况都会导致网站检索出现的商品图像结果与用户期望不一致,也会大大降低用户购买期望商品的效率。如何能够提高购物网站的商品检索效率已经成为了人们广泛关注的问题,利用图像数据在网站上进行搜索可以减少检索对于文字的依赖性,是值得研宄的一种解决方案。
深度学习在图像处理方面取得了引人瞩目的成果,而卷积神经网络作为深度学习领域中的一种应用普遍的高效算法,不需要像其它网络进行复杂的预处理和特征提取,因此在图像分类、图像识别、图像分割等方面得到了广泛的应用。卷积神经网络的图像处理区别于传统的图像处理模型,它的网络拓扑结构能够更好的契合于用户输入的图像。卷积神经网络在进行图像处理时能够在进行特征提取的同时进行图像分类。此外,由于卷积神经网络具有权值共享的理念,所以在图像处理的网络训练过程中可以在很大程度上减少训练参数,用户利用卷积神经网络的模型可以直接输入二维图像,在图像分类过程中,卷积神经网络模型可以通过不断地学习输入和输出之间的关系,在分类器输出端得到满意结果。
图像分类技术是将不同类别不同属性的目标区别分类的技术,它依据的是图像中包含的不同特征。处理过程是利用机器对图像进行定量的评估与分析,从而代替人类的视觉判读。
随着互联网电子商务技术的迅猛发展,网上商品的数据量也急剧增加。传统的基于关键词或文本的商品分类方式,由于其耗时多、受主观影响大,所以使用频率日趋下降。而基于商品图像内容的图像处理方式可以直观展现商品信息,无需人工标注文本,简单高效,应用极为广泛。
商品图像具有代表性的特征主要包括图像的颜色特征、纹理特征和形状特征等传统的基于图像内容的分类方式多是基于这些特征的。形状特征的描述方式主要包括区域特征的描述和轮廓特征的描述,前者主要描述目标的整个形状域,而后者主要是描述目标的边缘信息。纹理特征主要体现在所描绘目标的粗糙程度,对比性以及平滑性等方面。对于颜色特征而言,它是指图像对应区域的表面性质,描述方式是对全局特征的描述,且这种描述方式是对于图像自身而言的,它对方向,尺寸等依赖较小,具有非常高的鲁棒性。针对商品图像的分类,最近许多研究者提出了如下的商品图像分类与检索略:针对单一特征描述及浅层结构分类算法精确度低的问题,曾志等人采用了一种基于图像内容特征的深度置信网络(DBN)商品图像分类算法,通过构建5层DBN分类器来进行特征的训练和分类,通过验证,在时效性和精确度上效果好于单一特征分类算法。在对灰度共生矩阵算法与和差统计法改进之后,谢菲等人采用改进的纹理特征提取算法,然后利用支持向量机对图像进行分类,其优势就是特征提取耗时少,图像分类效果较好。为了提高图像分类能力,王强等人提出了基于He-Iet的卷积神经网络的图像分类方法,该方法是基于Caffe深度学习框架和首层卷积层取反操作,采用高效GPU运算实现卷积操作。在早期,王松等人提出了采用多种底层MPEG-7视觉描述符融合的方式对基于内容的图像分类技术进行验证。王冰提出了一种基于词袋模型语言建模的图像分类算法丌晓振等人采用了基于稀疏编码方式的多核学习的图像分类算法。Agnelli等人提出了一种演变的方法来进行图像分类,进化遗传编程可替代标准监督学习方法.
上述学者提出的分类方法都是基于商品图像特征的,且学习策略多是有监督学习。有监督学习通过已知的训练样本训练获得最优模型,在利用此模型将测试数据映射为对应的输出结果。目前常用的有监督图像分类算法主要包括随机森林,K近邻分类器,人工神经网络,支持向量机,朴素贝叶斯,卷积神经网络,条件随机场等。

2. 研究的基本内容与方案

2.1基本内容

本次毕业设计内容是研究如何使用人工智能相关技术对图像进行分类,提出两种基于卷积神经网络的分类商品图像分类方法。

本人要具体研究下面的内容来完成本次毕业设计。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1~3周:调研,完成开题报告。

4~5周:熟悉基本python编程语言和编程基本技能。

6~7周:了解人工神经网络与深度学习的相关知识。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)


[1] datta r, joshi d, li j, et al, image retrieval: influences, and trends of the new age[j]. acm computing surveys(csur), 2008, 40(2): 5-6.

[2] 董俊杰.基于hog和svm的服装图像检索系统的设计与实现[d].中山大学,2014

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图