登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 软件工程 > 正文

基于信息度量的特征选择方法及应用开题报告

 2022-01-14 09:01  

全文总字数:5250字

1. 研究目的与意义及国内外研究现状

在现代计算机和数据库技术的飞速发展下,数据积累的速度是人类数据处理能力所无法比拟的。

数据挖掘是数据库、机器学习和统计的多学科合作成果,它支持将海量数据转化为宝贵数据。

研究人员和实践者认识到,为了有效地使用数据挖掘工具,数据预处理对于成功的数据挖掘是必不可少的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

FCBF是评估变量中一种具有代表性的方法,它使用对称不确定性评估标准。SU是一种非线性评估标准,被广泛的用于衡量特征与类之间的相关性,或者是特征和特征之间的相关性。使用SU在比较特征的相关性时比使用信息增益更合理,更公平,因为它对互信息归一化处理,并且补偿了所选特征中的信息增益偏差。SU的值介于0和1之间,当值为1时,表示这两个变量完全相关,也就是说一个变量可以完全预测另一个变量;当值为0时,就意味着这两个变量完全独立。

FCBF分两步选择有效功能。首先,根据SU标准去除不相关特征,之后,应删除冗余功能。为了找到冗余特征,首先,根据其SU值对特征进行排序,使得具有最高SU的特征位于队列的第一位置。此功能称为Fp并被选中。然后选择和分析其他功能,如果它们被识别为冗余功能Fp,他们将被删除; 否则,他们将留下来。当检查队列中的所有特征时,获得许多特征,这些特征相对于第一特征不是多余的。现在,是时候选择队列中的第二个功能并分析它的冗余条件。同样,删除了具有此功能的冗余功能。此过程将继续,直到选择最后一个功能为止Fp并且没有其他特征需要分析。剩下的功能是FCBF选择的功能。

3. 实施方案、进度安排及预期效果

2019年1月2日至2019年1月15日完成特征选择基本概念理解,并完成相应文档。

至1月21日完成信息度量基本概念以及方法理解,并完成相应文档。

至2月25日完成fcbf算法基本概念,并完成相应文档。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]刘海燕. 基于信息论的特征选择算法研究 [d]; 复旦大学, 2012.

[2]shannon c e. a mathematical theory of communication [j]. bell system technical journal, 1948, 27(3): 379-423.

[3]姚旭, 王晓丹, 张玉玺, et al. 特征选择方法综述 [j]. 控制与决策, 2012, 27(02): 161-6 92.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图