计算机科学与技术学院 毕业设计,论文,开题报告
设计(论文)题目: 基于Android的语音识别App设计与开发 学生姓名: 蒋 炜 学 号: 081213288
系(部): 计算机科学与技术 专 业: 计算机科学与技术 指导教师: 刘 晋 2016 年 3 月 18 日 开题报告填写要求
1(开题报告作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。此报告应在指导教师指导下,由学生在毕业设计(论文)工作前期内完成,经指导教师签署意见及系(部)审查后生效;
2(开题报告内容必须用黑墨水笔工整书写或按统一设计的电子文档标准格式打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教师签署意见;
3(学生查阅资料的参考文献应不少于3篇(不包括辞典、手册);
4(有关年月日等日期的填写,应当按照国标GB/T 7408—94《数据元和交换格式、信息交换、日期和时间表示法》规定的要求,一律用阿拉伯数字书写。如“2005年3月26日”或“2005-03-26”。
毕 业 设 计(论文)开 题 报 告 1(本课题的研究意义,国内外研究现状、水平和发展趋势
( 1 )本课题的研究意义
语音是人的自然属性之一,由于发音器官的生理差异以及后天所形成的发音习惯的行为差异,不同说话人的语音具有鲜明的个人特征,这使得通过分析语音信号来识别说话人成为可能。说话人确认属于说话人识别中的一类,通过提取说话人语音中的个人特征来确认一个人的身份。说话人识别所使用的语音是人体所固有的生物特征,不容易被冒充或窃取,可以随时使用,并且可以利用电话网络实现远距离服务,相对于传统的密码、钥匙等身份识别方法更安全、更有效、更可靠,因此具有广泛的应用领域,越来越受到人们的重视。
自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动呢,从而实现人机的语言交流。随着科学技术的不断发展,语音识别技术的出现,使人类的这一理想得以实现,语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术,让计算机能理解和运用人类的自然语言,实现人机之间的自然语音通信。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
本次毕业设计主要是基于android系统之上,利用百度语音技术服务平台制作一款语音识别软件,旨在改变传统的人机交互方式,是人们能够采用更为直接便利的方式与手机对话,获得更好的人机交互,改善用户的使用感受。
( 2 )国内外研究状况、水平和发展趋势
语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的
突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服
务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。
20世纪90年代,许多著名的大公司如IBM、苹果、NTT都对语音识别系统的实用化研究投以巨资。Microsoft的whisper,Sun的VoiceTone等。在进入21世纪,语音技术的研究更进一步,苹果公司和Google分别在移动终端上发布了Siri和Voice Action,自此语音识别技术在移动互联网应用开启了发展热潮。 我国的语音识别研究一直紧跟国际水平,国家也很重视。国内中科院的自动化所、声学所以及清华大学等科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项,并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其准确率和系统、均可达90%以上。
语音作为当前通信系统中最自然的通信媒介,语音识别技术是非常重要的人机交互技术。随着计算机和语音处理技术的发展,语音识别系统的实用性将进一步提高。应用语音的自动理解和翻译,可消除人类相互交往的语言障碍,国外已有多种基于语音识别产品的应用,如声控拨号电话、语音记事本等,基于特定任务和环境的听写机也已经进入应用阶段。这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大地便利,其应用和经济、社会效益前景非常良好。
参考文献:
1.吴朝晖,杨莹春.说话人识别模型与方法[M]. 北京:清华大学出版社,2009. 2.刘幺和. 语音识别与控制应用技术 [M]. 科学出版社, 2008年02月. 3.HINTON G, LI D, DONG Y, et al. Deep Neural Networks for Acoustic Modeling in Speech
Recognition: The Shared Views of Four Research Groups [J]. Signal Processing Magazine,
IEEE, 2012, 29(6): 82-97.
毕 业 设 计(论文)开 题 报 告 2(本课题的基本内容,预计可能遇到的困难,提出解决问题的方
法和措施 ( 1 )基本内容:
1.Android开发环境的搭建。 2.UI的设计。
3.调用百度语音API实现语音识别。在通过识别返回的数据进行判断以达到语音控制
( 2 )主要问题:
本课题研究的主要困难在于如何利用百度语音识别技术API的开放设计一款手机语音识别软件,实现语音识别功能,实现声音文件存储,文本文件存储。
( 3 )方法和措施
[1]1.熟练android 开发技术技巧;
[2-10]2.了解语音识别算法原理以及近些年出现的相关api; 3.实现语音识别功能
语音识别的工作原理是:
第一步,把帧识别成状态(难点)。 第二步,把状态组成音素。 第三步,把音素组成单词。
图中,每个小竖条代表一帧,若干帧语音对应一个状态,没三个状态组合成一个音素,若干音素组成一个单词。看某帧对应哪个状态的概率最大,那这帧就属于哪个状态,如下图,此帧对应S3状态的概率最大,因此就属于S3状态。
下面是讯飞的语音识别app界面
3(本课题拟采用的研究手段(途径)和可行性分析 (1)首先在网上和图书馆查询并阅读相关资料,了解相关国内外发展状况,掌握语音识别的基本原理,确定基本思路。 (2)通过学习Android书籍和相关教程,熟悉并掌握Android开发的基本技能。
(3)通过阅读百度语音开发手册,熟悉百度语音技术API,掌握百度语音识别技术的基本通信方式。
(4)利用百度语音服务编写程序,并进行基本调试,设计出一款语音助手。 相关的书籍和教程比较多也比较全面,实现起来应该并不难。 4(论文工作计划(阶段工作内容及计划完成指标)
第1—4周:查阅相关资料。熟悉课题基本内容,确定基本设计思路。 第5—8周:Android开发的学习,编写基本程序。 第9—12周:系统功能基本实现。
第12—17周:优化毕业设计,课程总结、书写论文并进行答辩准备。 毕 业 设 计(论文)开 题 报 告 指导教师意见:(对本课题的深度、广度及工作量的意见和对设计结果的预测)
指导教师(签名):
年 月 日 选题报告会专家对选题提出的意见: 参加选题报告会的专家(签名): 系(部)审查意见: 系(部)负责人(签名): 年 月 日
因篇幅问题不能全部显示,请点此查看更多更全内容