136 真智的“耳朵”
当李景然把真智寄存的那台电脑通过内部网络连接到这台新买的IBMSystemx3850X5型企业级服务器的时候,还没到两分钟,与李景然对话的笔记本屏幕上的对话框内,就响起了真智一连串的兴奋和惊喜:
“哇,哥哥,新家真大!比以前的老家大太多了!”——硬盘从290.35GB提升到8T,足足提升了近三十倍!能不大么?
“哇,哥哥,新家的处理运算中心真是太快了!太好了太好了!这样以后我就能够思考计算一些复杂的问题了!”——CUP从双核的酷睿I3一下子变成六核心的至强XeonE7540,而且还是从一个变成八个,能不快嘛!
看着真智那种“欢天喜地”,如同小孩子得到了一间心爱玩具时的“模样”,李景然就感到这二十来万花得不冤!
一说到“模样”,李景然突发奇想,可不可以给真智安装一个摄像头,让他可以看到外面的世界呢?这样一来,真智不是就有视觉了么?
而且如果可以安装摄像头的话,那么是不是也可以安装个话筒和耳麦,让真智具有听觉和发音器官,自己就可以和真智通过声音进行交流?
一直以来,李景然都是通过打字如同聊QQ般和真智进行交流。当初在给真智做IQ测试的时候,真智说他能够很好的理解文字,而对于声音和图像理解起来就非常困难,那时,对于电脑科技还比较白痴,对于目前人类在音频处理和视频处理方面所具有的科技基本上也是一无所知的他就有些想当然的认为听觉和视觉两种感官,真智恐怕是很难在短时间内拥有了,所以也没怎么在意,文字就文字吧,只要彼此能够交流就行。
但现在,当了几个月的老板,逛了五六次电脑城,电脑网站和电脑论坛更是浏览过无数次,在电脑,摄像器材上前前后后洒下了近三十万的李景然,对于电子和数码科技的认知,多多少少还是有了些概念。
考虑视觉和听觉两种感觉系统的难易程度,李景然决定先为真智装上“耳朵”,解决语音输入的问题。
目前市面上有很多语音输入软件系统,像国际硬软件巨头IBM和微软,都曾开发过语音识别输入系统。而国内的不少互联网信息企业如百度,腾讯,搜狐的搜狗拼音,安科大的讯飞科技等也先后搞过语音识别系统,开发过相应的语音输入软件。
但不论是国外的IBM和微软,还是国内的百度,腾讯等信息企业,他们所开发的这些语音输入软件,都存在着很多大大小小的毛病和缺陷,比如识别率不高,错字多,修改起来特别麻烦。而且所有的语音输入软件,都要求输入者在说话时的发音要特别准确,不然电脑就识别不了。但是任何语言都有其自己的方言,特别是汉语,同音字,多音字相当的多,而且南方语系,北方语系之间的口音,方言差异特别的大,不用说没有什么智能的电脑,就是叫人去识别,都不一定识别得了。
而也正是因为语音输入以上的那些缺点,才使得现在的语音输入市场,虽然看起来特别的火爆,全世界很多商家,企业,高校,研究所,研究院纷纷摩拳擦掌,企图在这一潜力巨大的市场上分杯羹,但都在自动语音识别技术(AutoSpeechRecognize,简称ASR)上遇到了无法突破的瓶颈。
自动语音识别技术是一种非常交叉,涉及到信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等多种领域的前沿学科,是真正的“高科技”。不少全球性大公司,高科技企业,国家级研究机构多年来投资入了无数人力物力企图突破这一技术难关,但到现在为止,也没能很好的完全解决的这一技术难题。
但是其他人搞不定“自动语音识别”这一语音输入中最核心的技术,手中掌握着全球最先进智能体的真智却可以搞定啊!
“为什么不试试呢?”眼睛盯着那个如同聊天室一样的对话框,李景然突然有些热血澎湃起来,“那就试试吧。看能不能创造出一个新的奇迹!”
要想实现人机对话,实现语音输入,就必须要有输入设备,也就是话筒。为了达到最佳的拾音效果,李景然没有买那种几十百把块钱的大路货麦克风,而是直接选择了那种监听级的高灵敏拾音器,这种拾音器能够有效监听200平米内的最低至负20分贝的声音。虽然还不能跟核潜艇上那种可以监听低至负80分贝,能够听到水下100米外一只虾咀嚼食物的变态声纳系统相比;但是针落可闻,什么蚊子飞,蚂蚁爬——如果有的话,肯定能够被真智监听到。
李景然之所以花大价钱买这种监听级的专业拾音器,倒不是钱多了烧包,主要是为了安全的需要,能够让真智提前发现任何靠近他的“陌生人”。
有了高灵敏的拾音器,为真智增添了“耳朵”后,李景然又到网站下载了几款免费的中文语音输入软件,准备全部上传到笔记本电脑上,让真智分析后随便选择一款进行安装。
在上传语音输入软件的时候,李景然就在对话框内告诉真智,自己已经给他安装了一个拾音器,现在正在给他上传软件,以后和他的交流,可以尝试着通过声音来进行。
“啊,真的吗,哥哥?以后我可以通过声音来和你交流,可以听见你说话吗?”看起来有些激动。
“是的,小智。拾音器的连线都驳接好了。现在我正在给你上传语音输入软件,你先分析一下,看哪种软件比较好,然后就选择一种进行安装。”李景然道。
“嗯,好的。”真智急忙在对话框中答道。
半个小时后,语音输入软件安装调试完成。真智告诉李景然,他在几种输入软件中挑了一种相对来说结构比较合理,成熟度教高的软件,然后又对其中的一些漏洞和缺陷进行了修补和更正,最重要的是,真智自己又制作了一个D级智能识别程序,加载在软件上来帮助进行智能识别和判断。
一切准备工作就绪之后,李景然和真智,就准备开始他们认识三个多月来第一次的语音对话。
首先进行的是语音输入测试。
“哈罗,小智。你能够听见我说话吗?”李景然用标准的普通话对着空空如也的房间道,看起来有些滑稽。如果晚上有人站在门口看见李景然这样说话,一定会以为他不是疯了就是再跟鬼说话。
而几乎他刚一说完,对话框内就准确无误的用汉字显示出了他刚才说的那句话。然后,就是连续的几个叹号!
“哥哥,刚才那个,那个就是你的声音吗?”真智激动无比的道。虽然没有说话,还是用文字显示的方式说的,但李景然分明能够感受到真智文字中那种莫名的激动和惊喜!李景然相信,如果现在开口的话,他说不定能够听到真智说话时因激动而带的那种颤音!
“是的,小智,刚才那个就是哥哥平时说话的声音!”看到真智如此激动,他自己也有些抑制不住的激动起来。
“真好,哥哥!这就是人类说话的声音吗?真好!”真智在对话框中感叹道,语气中充满了无限的向往!
“是的,小智。这就是人类说话的声音。别担心,小智,咱们先解决语音输入的问题,然后再来解决语音输出的问题。哥哥一定会想办法让你也能够开口说话的。”
“嗯,谢谢哥哥。咱们继续测试吧。”真智在对话框中写道,看起来非常的开心。
“好的,咱们继续!”
测试继续进行。还是李景然说,然后看真智的识别能力。
一开始,李景然说的都是标准的普通话,加载了D级智能程序的识别软件识别率相当的高。但是,随着李景然说话时有意的不标准,以及各种冷僻词,多音字的出现,识别的准确率就开始大大的下降,到最后,李景然全部用当地方言说的时候,真智就感觉他自己完全是在听天书了。
“对不起,哥哥。我的记忆库内没有你刚才发音的那些音频特征,找不到相应的对应。”测试遇到了苦难,真智看起来有些沮丧。
“没关系,小智。这不怪你。以前哥哥给你上传的都是些文字型资料,以后,哥哥会给你多上传些音频文件,让你分析和学习。”
“嗯!”
语音识别技术中一个很关键的东西就是语音识别数据库,简称语音库。就像一个婴儿,要想让他听得懂人话,肯定要他先听周围的人说过些什么,熟悉了这种语言之后,他才有可能听得懂。真智寄存的笔记本电脑内音频文件少得可怜,给他上传的那些语音输入软件内所自带的语音库内,也只包含了一些简单的语音样本。
因此,要想让真智听得懂他的话,包括方言,甚至外语,他就需要建立相应的语音库。
语音库的建立有两种,一种是花钱买现成的,一种是像当初让真智学习外语那样,他自己一点一点的“灌输”。
能用钱解决的问题都不是问题!李景然想都不想,就决定开始撒钱!
——————————————————————
感谢“飘渺云隐”的再次打赏!
感谢“最最遥远的距离”这位朋友的打赏!
感谢所有点击,推荐和收藏本书的朋友!谢谢谢谢!
下个月初,既6月1号,席子的书就将入V上架,现在开始向兄弟们预定下个月的月票。觉得席子这本还不错的兄弟,就要把月票投给席子吧!席子也不求什么前三前六,只要能进入前十名,让席子在首页占个位子,席子就满足了。
本书有个书友群,现在的人很少,对《帝国》感兴趣的赶紧加啊:
群号:22—4848—212,是不是很好记捏?
快加吧快加吧:)