登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 通信工程 > 正文

基于Android的语义识别的应用程序开发毕业论文

 2020-02-17 09:02  

摘 要

语音技术是从键盘到多点触控继而到交互语音,已普遍地运用到了市场上的应用产品中。为了能让大家体会到语音助手的优势和便利性,Siri应运而生。查找应用、发送信息、通话等等一系列的功能,全部都只需要一个简单的语音命令就能够解决了。

科大讯飞开放平台是一个能够给开发人员提供各式各样Service的智能互动技术的服务平台,其中就包含了语音基础能力类的识别与综合。开放统计类中的移动应用分析技术还有用于语音定制服务类中的开放语音、语音唤醒和语音云等一系列技术。讯飞作为智能语音互动技术邻域内的全球首个服务平台,使得大多数开发人员都从开发过程中受益良多。

该应用程序是建立在科大讯飞的开放平台上,提供给广大企业使用,运用其移动语音终端(MSC,Mobile Speech Client,)安卓版的软件开发环境(SDK,Software Development Kit)进行开发的。为了将用户的语音信息发送到云端,它采用语音合成和开放语义服务的Interface。又为了给出相应的回答而解析语音的意图。然后将所得到的回答以JSON的方式发送回安卓手机设备,通过在手机设备上分析获取得的JSON数据,再采用SDK中的在线语音合成这一服务功能将语音的分析结果表达出来。以此来实现人机交互、释放双手并完成垂直查询、智能问答、语音识别等一系列功能的目标。

关键词:科大讯飞;人机交互;开放语义

Abstract

Voice technology, from keyboard to multi-touch and then to interactive voice, has been widely used in market applications. In order to let you realize the advantages and convenience of voice assistant, Siri came into being. Finding applications, sending information, calling and so on are all functions that can be solved with a simple voice command.

The IFLYTEK Open Platform is a service platform that can provide developers with a variety of intelligent interactive technologies for services, including the recognition and synthesis of basic voice capabilities. For example, face recognition technology in pattern recognition class; mobile application analysis technology in open statistics class; open voice, voice wake-up and voice cloud technology in voice customization service class. As the world's first service platform in the neighbourhood of intelligent voice interaction technology, Xunfei has benefited most developers from the development process.

The application program is built on the open platform of the IFLYTEK, and is developed using the Android version of the SDK (Software Development Kit) of its MSC (Mobile Speech Client, Mobile Voice Terminal). In order to send users'voice information to the cloud, it uses voice synthesis and open semantic service interface. The purpose of speech analysis is to give corresponding answers. Then the answers are sent back to Android mobile devices in the form of JSON. The JSON data obtained through analysis on mobile devices are then expressed by using the online voice synthesis service in SDK. In order to achieve human-computer interaction, release hands and complete a series of functions such as vertical query, intelligent question and answer, speech recognition and so on.

Keywords:  iFLYTEK ;  human-computer interaction ; open semantic 

目录

摘 要 I

Abstract II

1绪论 1

1.1课题背景及研究意义 1

1.2研究现状 3

1.3目前仍存在的问题 4

2设计的相关原理 5

2.1开发环境介绍 5

2.1.1 eclipse介绍 5

2.1.2 JDK开发环境介绍 5

2.1.3安卓平台介绍 6

2.1.4安卓开发环境搭建 7

2.2软件开发需求分析 11

2.2.1软件开发目标 11

2.2.2需求分析 11

2.2.3可行性分析 11

3系统的设计与实现。 13

3.1软件概要设计 13

3.2软件设计流程 14

3.2.1创建应用并获取AppId 14

3.2.2创建Android项目 15

3.2.3包与类视图 16

3.3用户界面(UI)设计 19

3.3.1安卓虚拟设备 19

3.3.2安卓真机测试 20

3.4语义识别应用软件测试 22

4结论与展望 24

参考文献 25

致 谢 26

1绪论

语音识别是人类语言技术的一次技术革新,它是从语音到本机的一种特殊处理方式,也有它自己独特的特点。语音识别技术作为人机语音通话的关键技术,对社会发展起到促进作用,同时,它也是智能计算机钻研的主攻方向,是最新科技的前沿,而且已经在全世界获得了大量的关注。目前,由于语音识别技术发展得十分迅速,在业界进一步取得了成功,科学界地位也不断增大,它在计算机的发展和社会生活中变得越来越重要了[1]。语音技术的发展,使得开发语音识别技术产品显得十分重要,例如医疗服务、地图服务、手机服务、旅游服务、驾车服务、语音电话、假期服务、酒店服务、信息网络查询等等,不仅如此,它还会涉及到各行各业[1]

根据所需处理的语音信息的不同,可以将语音技术分为以下几个方向:首先就是用于识别语音的语音识别技术,其次就是用于识别关键字的关键字检测、最后就是起唤醒功能的语音唤醒技术[1]。关键字检测技术已经被用在了对一些专业术语进行检测,用途十分广泛。语音识别技术是用来识别用户发出的语音信息,而且适用于多种语言环境,包括方言。本文对此进行的讨论正是它四个方面最重要和最普遍的研究方向之一[2]

语音识别技术(ASR)主要是工作过程是对人类发出的语音信息进行识别,再将识别的能容转换成计算机可识别的内容并进行输入。ASR技术给人们带来了很大的方便,它的的问世使我们有可能实现希望机器能够“理解”人类语言的愿望[2]。语义识别技术和自然语言处理技术的结合,使得语音技术用途更加广泛,例如机器转换和语音信息交换与识别。也可像语音到语音的翻译来创造更加复杂的应用程序[2]

1.1课题背景及研究意义

(1)课题背景

由于科学技术的进步,使得移动互联网飞速的发展,被越来越多的人所熟知,近年来已经成为世界上市场前景最广的新兴产业。直到2018年12月,统计得出一组数据,那就是中国的网民已经达到了8.3亿[3],增长得十分迅速。基于数量巨大的网民,各式各样的基于安卓平台的应用软件应运而生[4]。但是,因现有移动终端设备还不够成熟,依然存在许许多多的局限性,比如常见的界面键盘可能有点过小,从而导致文字输入十分的不方便。并且不能够解决特定情况下的交互,例如走路、逛街和开车等等。因此,人类需要更自然得交流方式来与机器进行交流,也会带来更多的乐趣。而恰恰语言是人们最常见、、最方便最重要、最有效、最重要的互动交流方式[5]。由于我们人可以制造各式各样的机器,人类就有一种让各种机器都能“理解”人类的声音,如此,使得人类很容易就想到他们是否可以用自然语言取代人机交互(例如鼠标、键盘等)[6]

随着语音识别技术的发展,越来越多的人对其有了更新的认识,尤其是独立的语音识别系统的精度已超过百分之87,增长十分迅速,甚至高于人类特定地语音识别系统准确性[7]。而且已有的那些技术大多其实已经很丰富了,对于日常的应用需求足够使用了。如地图查询、旅游查询,移动查询等等,而且还具有语义合成和语义识别功能来进一步提升[8]。一项基于Android系统的语义识别软件开发调查表明,高达85%的信息查询服务系统都满足了语音识别性能[9]。在已经过去的六年间,具有吸引人的发展前景的语义识别技术也越来越多地出现在手动邮件分类中。它能够克服仅仅是依赖人工分类的记忆力不足、以解决这一过度劳动力成本的难题。语义识别技术在日常教育中最明显的用处就是能够协助用户更好地练习语言技能[10]

语义识别技术发展的另一个方向是移动电话语义识别技术,这个技术对技术发展起了很关键的作用。移动电话语义识别技术将使得主动布线、手机搜索、旅游信息、驾车信息等专业的服务等等获得很便捷的运营,给人们提供了极大的便利[11]。语义识别技术,即将实现全天候手机银行金融服务和银行应用语音搜寻系统,进一步方便了用户[12]。在证券这一行业中,假如你是使用手机语义识别的语音系统,则客户会很满意而且愿意使用自己可以直接通话的股票代码或名字,同时系统会根据实际情况又会确认用客户的需求,进而表示出最近的股票价格和走势,这样可以说使得用户方便了很多很多,用户也会非常满意[12]。114咨询台拥有大量的人工语音技术,使得手机可以自动进行回复,也能够使电脑自动响应用户的各种想法和要求,并且反应也是非常迅速。紧接着会自动播放电话号码,因此为相关部门节省了许多人力资源,进而获得更多的利润[12]

  1. 研究意义

语义识别技术是一个跨界的学科,对于科学的进步有着很大的作用。因此这是一门十分重要的学科。由于技术是社会发展的第一生产力,语义识别也正因此渐渐成为了交互人机的重要技术,对人们来说十分的重要。语义合成技术和语义识别技术的结合,会有什么更强大的功能呢?它可以使得语音技术更加的有活力,使用更有趣,功能更加复杂,使用更加的方便,开辟了一个崭新的时代,那就是人机交互[13]。语音技术的应用在现在已经有了很大的成功,而且是一个新起的极具竞争力的高科技产业,在未来也有着广大的前景。可想而知,语音操作将会带来一场革命性的进步,也是未来长时间键盘触摸操作和智能终端的必然趋势,给人类带来更加丰富的科技感[13]

1.2研究现状

(1)国内研究现状

2011年9月17日,科大讯飞( IFLYTEK)将会有一个新产品问世,那就是语音云正式发布,这是一个历史性的时刻。因为全球首个同时提供语音听写、开放语义、语义理解、语音评测、语音唤醒等等语音功能,并且十分智能的智能移动互联网交互平台即将要正式发布,此时万众期待,那就是“讯飞语音云”,造成了一定的影响[14]。通俗的说,这将带来一个技术性的突破。智能语音交互非常具有前沿感,也代表了前沿科学技术。它是一个基于互联网的设备,功能十分的强大,使用起来也十分有趣,它能够提供像人一样“能听会说”的服务,实现人机交互,信息传递。也能够实现人与机器的交流,让科技改变人类的生活。同时智能语音交互还可以实现很多事情,比如能够痛过语音听写功能将我们说的话中的信息转换成相对应的文字,使信息更好的传递。也能够使用在线语音合成功能将文字转化成清楚流畅的语音,并可以在机器上读出来。与此同时,科大讯飞还发布了这个平台的代表应用——“讯飞语音输入法”[14],虽然是体验版,但在手机上安装后,依然可以通过说话来进行日常使用的微信、QQ、微博等应用的内容输入,这样不仅使得我们在使用应用时更加便捷,也使得输入繁琐的对话和在线聊天更加有趣,也更加充满科技感和新鲜感[14]

  1. 国外研究现状

语音技术是谷歌在安卓1.5版本中新增添的一个十分实用且重要的新功能。非常有利于日常简单的查询,十分方便。飞利浦在1997年推出的Genie 727b语言拨号的电话,是世界上首次将语音识别技术植入到嵌入式设备中[15]。由于当时的语音拨号还不够成熟,比较原始,因此只能够辨认出英语发音,并且成功率也是相当的低。现如今,最新的语音识别技术已经在移动电话应用方面取得了相当大的进展,对语音技术的发展起了重大的作用[15]。在2008年年末,即谷歌在诺基亚S59平台进行了各种试验,并正式发布了一项叫做“中文语音搜索”的服务后,得到了广大群众的喜爱。随后谷歌官方又正式发布了一个应用,当时还听轰动的,该应用名叫“Voice Action”。从名字中可以看出这是一个有着语音控制功能的应用。这是专门为安卓开发的,而且这个语音控制系统功能十分强大,看起来科技感十足,科技迷估计非常有兴趣,而且给用户带来极好的使用体验,也带来了极大的方便,深受大家的赞美。

1.3目前仍存在的问题

如今,21世纪是一个“语音的世纪”,将会有很多新兴产业出现,正因如此这里不仅蕴含了无限的商机,还表现出他们有无限的发展空间。概括地讲,有如下几个问题还需要解决:

  1. 语音识别的方言和口音问题

中文有八大方言区,十分的复杂。虽然目前有许许多多的语音识别系统,而且里面对标准普通话的识别性能表现良好的也不少。由于有口音和方言的存在,因此语音中一旦出现了方言或者口音,对于语音的识别性能就会立马降低,这是个十分严重的缺陷。但如果解决好了这个问题,不仅使技术得到了证明,也将极大地拓展该技术的使用范围和使用方式,推动技术的发展与进步。因此解决这个问题是很有意义的,也必须要解决[15]

  1. 信道问题

据我们的了解,在无线互联网的使用中,可能会涉及到多种类型的信道,例如IP地址、互联网、固定电话、移动电话、车载系统等等,而这些信道又有着互不相同的特性。因此我们需要面对一个不得不面对的问题,那就是声纹识别、语音理解以及语音识别这些功能可能会与信道不兼容,所以我们该怎样来适应不同的信道所带来的差异,又该怎样来解决呢?因此我们需要解决这些问题,具体是指以下两个,即跨信道的问题与多信道的问题。

  1. 背景噪音问题

当存在背景噪音的时后,诸如语音理解、声纹识别以及语音识别之类的系统可能就不会正常的工作了。这里面的原因有很多种,比如说可能是将原始语音的某些内容全部掩盖在噪音之中,就可能会有错误,也有可能是让背景噪音将最初的原始语音的频谱给破坏了,从而出现错误,因此也就不能够进行正确地分离。

  1. 自然语音理解领域

人们必须要有良好的技巧与思想去解决口语语言问题,譬如口语中的插叙、拖音、改正、强调、重复、韵律、省略、倒叙以及插叙等等。

2设计的相关原理

2.1开发环境介绍

2.1.1 eclipse介绍

Eclipse一个常见的java开发的应用,使用的十分广泛。它是一个可扩展开发平台,任何公司都可以使用,底层是基于Java的而且是开源的,功能十分的强大。但对于它自己来说,它只是一个用于通过插件组件构建开发环境的框架,非常的实用。然而凑巧的是,Eclipse附带了一个标准的插件集,种类多种多样,里面有很多插件供开发使用,给开发者提供了很大的方便。同时其中也包含了包括开发Java的工具,即Java开发环境(JDK,Java Development Kit)[16]

Eclipse是一个Java IDE工具,具有很高的市场份额,很受大众喜爱。它是一个具有高品质的工业平台,能够稳定的开发各种大型集成项目。它主要由三个部分组成,三个部分都非常使用且重要,它们分别是Eclipse项目、Eclipse技术项目以及Eclipse工具项目,这三个项目在软件开发中使用得非常频繁。Eclipse 平台则是一个开放的可扩展IDE,它能够给用户提供一个通用的开发平台,带来很好的开发体验[16]

安卓向我们推荐使用Eclipse,并且将它用来集成开发安卓应用软件。但这里需要一些插件,我们为它提供了一个专有的ADT(Android Development Tools)插件[16]

2.1.2 JDK开发环境介绍

Java运行环境(JDK)是Sun公司发布的一个免费软件开发工具包(SDK,Software Development Kit),目的是为了给那些使用Java语言来进行软件开发的人,一是提高公司知名度,二是提高程序员的软件开发效率。自从Java引入以来,JDK已经成为了最受欢迎且使用最普遍的Java SDK[16]。它是一款十分简便的工具,适合广大的人群。而且,当我们在使用Java语言的SDK的时后,Java用户有时候并不需要安装JDK就可以来运行Java程序代码,这是非常特殊的。那么,什么时候必须安装JDK呢? 那就是当我们需要编译和调试程序的时候,这时就必须安装了。JDK中还包含了如基类库rt.jar以及用于开发人员的补充库,如IDL库以及国际化和本地化类库等用于产品环境的各种类库。

JDK包含了Java工具、Java基础类库以及Java运行环境,因此,可以看出JDK对于开发者来说是一个十分重要的工具了。同时,它也是整个Java的核心,必须要深刻的理解它。没事多查查资料,多看看源代码。因为学好JDK是你想学好Java的第一步所以必须要花时间和精力好好学习。正因为JDK那么重要,所以有许多企业与组织也发布了自己相应的JDK,不过其中最受欢迎还是由Sun公司开发出来的JDK,因为它更符合广大群众,使用起来也更方便。其中,这里面有很多著名的公司,他们都是国际上名声丹鹤起的大厂,像我们所熟知的IBM公司,BEA公司等等,都有开发过JDK[16]。从Sun公司的JDK6.0开始,它给我们提供了许多非常实用的功能,给我们带来了极大的便利,例如反射,文件流等等。而且也在不断地创新,版本也在不断地更新着。正是这种不断地创新,在提升新鲜感的同时也极大的提升了它的运行效率。

2.1.3安卓平台介绍

安卓是一个基于Linux开发的操作系统,使用得十分广泛。我们知道,安卓它是开放的,同时也是开源的,可以给广大的企业使用,当然个人也可以使用。目前它主要使用在如平板电脑以及智能手机之类的移动设备上[16],。后来也用到了数字电视,智能穿戴上。使用范围十分广泛。安卓操作系统是由软件工程师Andy Rubin开发的。2006年07月被谷歌公司收购并注资,这是安卓的发展的一个转折点。两年后的2008年09月,谷歌同76家软件开发商、硬件制造商及电信运营商联合,形成了一个强大的联合组织,有着极大的国际影响力,并且一起组建了一个开放手机联盟,目的是用于共同研发并改进安卓操作系统,为后面安卓系统得到广泛的应用做好了铺垫[16]。在此之后,谷歌通过某种方式使得安卓的源代码得到了发布。因此就有了后续的利用开源的源代码,经过其他公司的共同开发,安卓操作系统的业务也越来越广泛了,他的产品扩展到了手机,平板电脑及其他领域上,而且还有很家庭上的使用。譬如手表,电视,游戏机,数码相机等等,极大的方便了人们。

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图