登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 经济学类 > 电子商务 > 正文

基于联邦学习的用户画像研究毕业论文

 2021-10-21 05:10  

摘 要

Abstract II

第一章 绪论 1

1.1 选题背景 1

1.1.1 用户数据利用现状 1

1.1.2 用户数据构建用户画像面临的问题 1

1.2 研究方法与研究思路 2

1.3文献综述 2

第二章 相关技术描述 3

2.1 联邦学习技术 3

2.1.1 联邦学习技术概述 3

2.1.2 联邦学习的分类 4

2.1.3 联邦学习的优势 4

2.1.4 同态加密技术 5

2.2 用户画像 5

2.2.1 用户画像概述 5

2.2.2 用户画像的作用 6

2.2.3 构建用户画像的步骤 6

第三章 用户画像模型构建 8

3.1 传统的多个参与方构建用户画像的方法 8

3.2 基于联邦学习的用户画像构建 9

3.2.1 基于纵向联邦学习的用户画像模型 9

3.2.2 基于横向联邦学习的用户画像模型 11

3.3 两种方法构建模型对比分析 13

第四章 应用场景举例 14

4.1 纵向联邦学习案例 14

4.2 横向联邦学习案例 16

第五章 结论与展望 18

参考文献 19

致谢 21

摘 要

在现如今很多的行业内的数据都是小数据,而且很多的数据得质量都很差,同时这些数据往往属于不同的企业,这样这些数据就没有被综合到一起来利用。这些企业虽然是参与规模庞大的团体作战,但缺乏有效的互通和协作,因此效率较低。本文首先用传统的简单的数据集合在一起的方法对于多方参与构建用户画像模型进行介绍指出他的不足。然后运用联邦学习技术,在保证各个参与方的数据不被泄露的前提下,实现数据互通,运用联邦学习的相关方法构建一个用户画像模型。并将两种构建用户画像模型的方法对比指出传统的方法涉及的隐私问题。最后对基于联邦学习的用户画像应用场景进行举例并对结果进行分析与展望。

关键词:联邦学习,用户画像

Abstract

Nowadays, the data in many industries are small data, and the quality of many data is poor. At the same time, these data often belong to different enterprises, so these data are not integrated and utilized. Although these enterprises are involved in large-scale group operations, they lack effective communication and cooperation, so their efficiency is low. In this paper, the traditional simple data collection method is used to introduce the multi-party participation in the construction of user portrait model. Then, using the federal learning technology, under the premise of ensuring that the data of all participants are not leaked, data exchange is realized, and a user profile model is constructed by using the related methods of federal learning. In addition, this paper compares the two methods of constructing user portrait model and points out the privacy issues involved in the traditional methods. Finally, the application scenario of user portrait based on Federated learning is exemplified and the results are analyzed and prospected.

Key words: Federal learning, user portrait

第一章 绪论

1.1 选题背景

1.1.1 用户数据利用现状

近几年来,人工智能技术飞速发展,金融领域行业内的数据和金融领域的场景状态都是十分好的,它的结构化数据相对完善,特别适合率先引入人工智能技术。例如在金融特定的营销和风控环节,机器学习可以处理上千维度特征,为新老用户分别构建不同的响应率预测模型;在资产管理领域,可以帮助原本无法享受专属理财顾问的客户,实现个性化理财推荐。在现阶段有很多用户的相关数据不是由同一个公司掌握。例如,A公司有某行业一些用户的相关数据但不全面,同时B公司也有同一行业的一些数据,它的数据也不是很全面,所以这两个公司想把数据合在一起训练模型。但是现在各国都有对数据的隐私法案保护,这两个公司想一起训练模型就会面对隐私的相关问题,可能会违反法律。这样的现实情况就对构建一个更为全面的用户画像造成了困难。现在许多公司对于用户的研究所依赖的数据都是自己业务内的数据,很难收集到其他的用户相关的数据,或者是想办法利用其他公司的数据时会涉及到隐私问题,违反相关的法律将受到制裁。因此如何在不侵犯他人隐私的情况下利用更多方的数据进行模型训练,获得相对全面的用户信息成为了新的挑战。近几年来人工智能飞速的发展,在人工智能飞速发展的同时也带来了隐私泄露的问题,隐私泄漏的问题越来越严峻。近一段时间包括脸书在内的许多公司都出现了用户隐私被泄露的情况,而且现在用来训练的数据的来源很多都不明确,这其中可能也包括隐私问题。有些相关媒体报道,在网上有人公开收阿弥用户的信息价格还很便宜。当然国家对这些情况也有管控,对于那些侵犯用户隐私的商户采取了相应的管制措施。由于用户隐私问题越来越受到关注,近几年很多国家出席了相关的政策,如欧盟出台了《通用数据保护条例》来保护数据隐私,美国旧金山则是采用禁止使用人脸识别,来从源头上断绝侵犯隐私的问题,同时我国也出席了很多关于数据隐私保护的法案。

1.1.2 用户数据构建用户画像面临的问题

(1)收集来的各种数据往往质量很差,有很多噪音难以去很好的利用

(2)用户数据标签存在问题,现实生活中很多用户的数据是没有标签的。

(3)用户数据分散,现实中很多企业所掌握的用户数据只有他这一个行业的数据,数据是不全面的,例如银行掌握信用数据,电商平台掌握购买消费数据。

(4)在企业之间想进行数据互通来合作构建模型时,企业会面临数据被泄露的风险,或者是面对不公平不对等的交易,导致合作不容易进行。

1.2 研究方法与研究思路

本文主要运用文献研究法通过搜索并阅读相关文献,经过归纳整理、分析鉴别,对近几年用户画像相关的的研究成果和进展进行系统、全面的叙述和评论。之后提出自己的见解与研究方向。通过对相关文献的学习来完成整个论文内容。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图