基于深度学习的写作风格分类与识别开题报告

 2020-02-10 11:02

1. 研究目的与意义(文献综述)

1 课题来源、目的、意义以及国内外研究现状

1.1 课题来源

随着移动互联网技术快速发展,人类依赖计算机从事的工作越来越多,也越需要计算机能够智能地理解和处理海量的自然语言信息。在自然语言处理中,作品风格分析是计算语言学的经典的研究工作。不同的作家具有各自不同的写作特点,这些特点体现在使用的词语、句子结构、修辞方法等许多方面。目前关于作者写作风格的研究还主要依靠作者主观判断、利用语感进行人工分析[1],而更深入的利用计算机进行语言风格的研究依旧比较困难。

1.2 研究目的及意义

1.2.1 研究目的

针对不同作者在作品中体现出的不同语言特征,如句类、虚词、词语、句子长度等特点,我们对于作者作品中的句子进行分词和句子成分的划分,通过使用计算机的方法对这些特征进行进行收取与统计,并对收集到的数据进行预处理,去除掉其中出现次数较小的可能对分类结果产生不良影响的项;使用数学符号形式定义文章的写作风格,结合之前收集到的特征,扩展了如何使用机器学习算法对文章尽行定义;根据训练出的特征或已经拥有的数据集,从整体的风格和单独的作品出发,结合二者的各项特征,构建出文章风格分类模型,并进一步对作者的写作风格进行定义。最后提出整体总体的建模方案。

1.2.2 研究意义

近年来,随着互联网技术的发展和移动网络的兴起,网络上产生了越来越多的文本信息,如网络小说、新闻等等;而一些经典的优秀文学作品的数字化也在紧锣密鼓的进行中。这些不断积累的文本知识,是人类文化的宝贵财富,同时,也为许多的应用领域提供了进行探索的原始材料。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

研究内容与方法

2.1 研究内容

本文主要构建基于作者写作风格特征,如标点使用频率,虚词词频等的作者写作风格描述系统。使用深度学习的方法,对于分类过程进行建模,对分类方法进行训练。研究的主要内容主要包括以下几点:

(1)数据的收集与预处理

当前,针对文章和作家写作风格的语料库的资料相对较少。因此这一收集过程可能会较为繁琐:首先需要对作家的作品进行爬取,并对这篇文章的写作风格进行分类。然后对于爬取的文章进行分词、去掉稀疏项等操作。当前,国内比较通用的中文分词的服务是由科大讯飞提供的,它的api操作比较方便,对于句子各个成分、词语的词性分类详细,且准确率高,收到了相关从业人员的欢迎。

(2)写作风格特征提取

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;

(2)2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善;

(3)2019/5/1—2019/5/25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 张运良.基于句类特征的作者写作风格分类研究[j]. journal6, 2006,45(22):129-131.

[2] 黎运汉. 汉语风格学[m]. 广东教育出版社, 2000.

[3] (写作风格)百度百科https://baike.baidu.com/item/文学风格/3375154?fr=aladdin

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。