登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

幸福感预测算法设计与实现毕业论文

 2021-11-09 09:11  

摘 要

在当今中国社会,幸福已得到了越来越多的关注。但是,从大数据的角度探讨幸福的研究还不多。尽管在心理学研究中,大数据方法的应用并不广泛,甚至是刚刚开始起步,但机器学习、深度学习等大数据技术,为传统心理学研究提供了全新的研究方法,带来了新的思路。

本文基于中国人民大学中国调查与数据中心主持的《中国综合社会调查(CGSS)》项目的数据,通过使用数据挖掘的技术来进行幸福感预测的研究,分析幸福感的影响因素。研究按照单因子分析、多因子分析、特征工程、模型建立和评估四个阶段,系统地利用数据科学的方法进行幸福感影响因子的分析和幸福感预测模型的设计。研究发现:社会态度(公平)、家庭变量(家庭资本)、个体变量(心理健康、社会经济地位、社会等级)对幸福感影响较大,且通过这五个特征建立的幸福感预测模型中,基于Boosting算法的模型和模型融合的效果较优。

通过大数据的分析,幸福研究最终体现为一种社会政策的参与性,通过对整体生活满意度的测量,为社会政策制定和调整提出建设性意见。

关键词:幸福感预测;数据挖掘;机器学习;模型融合

Abstract

In today's Chinese society, happiness has attracted more and more attention. However, there are not many studies on happiness from the perspective of big data. Although in psychology research, the application of big data methods is not widespread, or even just started, but big data technologies such as machine learning and deep learning provide new research methods for traditional psychology research and bring new ideas.

This paper is based on the data of the " Chinese General Social Survey (CGSS)" project hosted by National Survey Research Center at Renmin University of China. It uses data mining technology to study the prediction of happiness and analyze the influencing factors of happiness. According to the four stages of single-factor analysis, multi-factor analysis, feature engineering, model establishment and evaluation, the research systematically uses data science methods to analyze the influencing factors of happiness and design the prediction model of happiness. The study found that: social attitudes (fairness), family variables (family capital), and individual variables (mental health, socioeconomic status, and social rank) have a greater impact on happiness, and among the happiness prediction models established by these five features, the effect of the model based on Boosting algorithm and model fusion is better.

Through the analysis of big data, happiness research is finally reflected in the participation of a social policy. Through the measurement of overall life satisfaction, it provides constructive opinions for the formulation and adjustment of social policies.

Key Words:happiness prediction;data mining;machine learning;model fusion

目 录

第1章 绪论 1

1.1 研究背景、目的与意义 1

1.1.1 研究背景 1

1.1.2 研究目的 1

1.1.3 研究意义 1

1.2 国内外研究现状分析 2

1.3 研究内容 2

1.3.1 研究目标 2

1.3.2 论文组织结构 3

第2章 单因子分析 4

2.1 数据案例介绍 4

2.1.1 采集数据 4

2.1.2 导入数据并查看数据集信息 4

2.2 基础理论准备 6

2.2.1 集中趋势和离中趋势 6

2.2.2 数据分布—偏态与峰态 6

2.2.3 抽样理论 7

2.2.4 数据分类 7

2.2.5 异常值分析 7

2.2.6 对比分析 9

2.2.7 结构分析 9

2.2.8 分布分析 9

2.3 全数据单因子分析 10

2.4 本章小结 10

第3章 多因子复合分析 12

3.1 基础统计学理论准备 12

3.1.1 假设检验 12

3.1.2 卡方检验 12

3.1.3 方差检验 13

3.1.4 相关系数 13

3.1.5 线性回归 14

3.1.6 主成分分析 15

3.2 基于幸福感预测的多因子分析 15

3.2.1 交叉分析方法与实现 15

3.2.2 分组分析方法与实现 16

3.2.3 相关分析与实现 17

3.3 本章小结 18

第4章 特征工程处理 19

4.1 特征工程概述 19

4.2 数据清洗 19

4.2.1 数据样本采集 19

4.2.2 异常值处理和标签 19

4.3 数据特征预处理 20

4.3.1 特性选择 20

4.3.2 特征变换 21

4.3.3 特征降维 22

4.3.4 特征衍生 23

4.3.5 特征工程结果 23

4.4 本章小结 24

第5章 幸福感预测模型 25

5.1 基于分类的幸福感预测模型 25

5.1.1 分类-KNN 25

5.1.2 分类-朴素贝叶斯 25

5.1.3 分类-决策树 26

5.1.4 分类-SVM 26

5.1.5 分类-集成-随机森林 27

5.2 基于回归的幸福感预测模型 28

5.2.1 回归-线性回归 28

5.2.2 回归-分类-逻辑回归 29

5.2.3 回归-分类-人工神经网络 29

5.3 基于Boosting算法的幸福感预测模型 31

5.4 模型融合 32

5.4.1 平均融合XGBoost LightGBM GBDT的预测模型 32

5.4.2 线性回归融合XGBoost LightGBM GBDT的预测模型 32

5.4.3 加权融合XGBoost LightGBM GBDT的预测模型 32

5.4.4 神经网络融合XGBoost LightGBM GBDT的预测模型 32

5.5 实验结果与分析 35

5.5.1 实验方案与评价指标 35

5.5.2 实验结果 36

5.6 本章小结 39

第6章 总结 40

参考文献 41

致谢 42

第1章 绪论

1.1 研究背景、目的与意义

1.1.1 研究背景

从2011年起,“大数据”开始进入我们的视野,各媒体对这一新词汇的相关报道层出不穷。2013年开始,其更是成为科学界最炙手可热的话题之一。短短几年时间,随着其应用的推广,它不仅在技术、商业、文化、社会等领域发挥着重要作用,也给学术研究带来了新思路。[4]

主观幸福感是积极心理学中重要的研究内容,它主要是指人们对其生活质量所作的情感性和认知性的整体评价,即每个人将自己现有的生活质量与自己的预期相比做出的评价(Diener,1985)。[2] 定量研究是心理学研究的基础,许多重要的心理学理论都是在实证研究的基础上发展起来的。在传统的心理学定量研究中,在收集数据时,往往采用问卷调查的方法。这种方式一般需要消耗大量的资源。另外,有时研究还会由于缺乏有效的试验样品,导致无法进行。而大数据的出现,无疑提供了一种有效的解决方法。[3]

在当今中国社会,幸福已得到了越来越多的关注。但是,从大数据的角度探讨幸福的研究还不多。尽管在心理学研究中,大数据方法的应用并不广泛,甚至是刚刚开始起步,但机器学习、深度学习等大数据技术,为传统心理学研究提供了全新的研究方法,带来了新的思路。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图