170 对语音数据库的测试
170对语音数据库的测试
肖兴国是一个年岁不大,看起来最多三十出头的青年人。身材瘦削,极其精干,脸上随时带着一副亲切的笑容,一看就是那种随时都能和你称兄道弟的人。
除他之外,与他同来的还有一个更年轻的,看起来只有二十四五岁的年轻人,拧着一个笔记本,带着一个黑框眼镜,看起来有些木讷,大概是技术性人员。
李景然一开始出现在大厅的时候,坐在大堂一角一张双人沙发上的两人并没意识到从电梯口出现的这个男孩儿就是他们这次要来会见的“贵客”,因为李景然实在是太年轻,让人难以想到他就是要跟自己合作的客户。
直到李景然朝两人走去,站到两人的面前,试探的叫了声“肖先生”,肖兴国才恍然大悟的站了起来,急忙握住李景然递过来的手,一边连说“抱歉”,一边嘴里不停感叹李景然的年少,什么“青年才俊,年少有为”,见面就是一通赞叹。
类似的话,李景然已经听过多次,早就具有了免疫能力,他只是淡淡的笑了笑,心中并无多少波澜。
肖兴国先是向李景然介绍了一下他身边的那个叫小彭的技术人员,然后就提议说现在差不多已经快中午了,是不是先吃了中午饭大家再坐下来谈。李景然就说没关系,他先看看样品再说。
肖兴国对于李景然的提议自然没什么异议,对他来说早一点谈妥生意更好,于是自然的一边点头,一边又开始对李景然这种“敬业精神”大肆夸赞,一枚枚不要钱的精神糖衣炮弹朝李景然身上猛砸!
“你妈,要不是老子定力好,恐怕一见面,就被你个***夸得上天入地,无所不能,连方向都找不到了。”对于肖兴国这个自来熟的夸赞,李景然心头腹诽,敬谢不敏。
看样品自然不方便在大庭广众之下,于是李景然向二人提议去自己的房间,肖兴国欣然同意了。
肖兴国和彭智勇跟着李景然进入了位于大厦二十三层的豪华行政房,却见里面还有两个十五六岁的半大孩子正坐在坐在床上津津有味的看电视。两个半大孩子见有人进来后,就把电视关了,也不出去,却只是坐在床边,时不时的朝自己这边瞟一下。他见李景然并没有介绍这两个小孩儿,就以为是跟着他一起来广州玩耍的亲戚,于是也就不以为意。
李景然把肖兴国和他的技术员小彭让到茶几对面的一张长条沙发坐下,他自己则坐在与其相对的一个单人沙发上。
“雷山生,您上次说对我司所有有关中文的语音数据库都感兴趣,因此,这次我们所带的样品之中,就包含了以标准普通话为主,以北方话,广东话,江浙话,福建话,湖南话,.江西话和客家话中国七大地域方言为辅的语音数据库。每种方言,我们截取了2-5的语音样本。小彭,你先给雷山生演示一下。”说道正事,肖兴国也不像刚才那样轻松随意,神情也变得有些严肃。
听到肖兴国的吩咐后,李景然就见叫小彭的技术员从随身携带的电脑包内掏出一个戴尔笔记本电脑,开机后从中调出一个音频软件,开始播放,然后过了两三秒,李景然就从笔记本自带的扬声器中听见一个个被人读出来的语音,都是单个的字词或词组,有男声,有女声,有小孩的声音,也有青年人和老年人的声音。
李景然在听的同时,肖兴国用眼睛朝技术员小彭示意了一下,于是,李景然就听到旁边的年轻人咳嗽两声,清了下嗓子,然后用一种略带紧张的声音,向李景然道:
“李先生,对于普通话,我们的每个语素,都同时采集了孩子,青年,中年和老年四个年龄层次的声音,每个年龄层次,都有男声和女声,因此,对于单个语素,我们采集了多达八种不同类型的声音。
“而针对其他方言的采集,虽然没有像普通话那样多达八种,但目前最低的,我们也已经完成了包括男声,女声,小孩,中年共计四种类型的语音。而像其他有些比较热门的有影响力的方言,如广东话和江浙话,我们差不多完成了六种语音采集。
“而对于所有采集的语音,我们都会根据每个字词的不同发音,进行标注,检查,整理,分离,然后形成一个系统的,容易查找的语音数据库。”
人机互动,人机交流中最关键的两项核心技术就是“语音合成”和“语音识别”。语音合成是为了让“机器说话”,人能够听得懂机器的语言;而语音识别则是为了让机器听得懂人话,明白人说的是什么。
而不管是语音合成还是语音识别,有一个必不可少的最基础的一项工作,那就是语音数据库,这是实现以上两种核心技术的“原材料”。虽然有了语音数据库,一般人也很难搞定,或者说到目前为止世界上就没人哪个人或哪个机构真正搞定过语音合成和语音识别,特别是语音识别,这一混合了信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等多种领域的前沿学科,对于所有想攻克这一技术的机构来说,真的非常非常困难!
但是,其他人搞不定自动语音识别技术,对于拥有全世界最先进智能体的李景然来说,却不是那么高不可攀,反而像“语音数据库”这种没有任何技术含量,需要大量人力物力才能搞得定的“累活”对李景然来说倒成了一个让人头疼的麻烦,逼得他只得求助于他人。
老实讲,深圳智冠提供的语音数据库,到底好不好,优秀不优秀,对于在这方面只是了解了一些皮毛的他来说根本就无法判断。要判断深圳智冠的东西有没有用,或者说好不好用,方法只有一个,那就是传给真智,让真智自己去研究,这就是李景然为什么要冒天大的奇险,不远千里,把真智从蓉城搬到广州,为此,还请了真武真情这两个被蒙在鼓里的超级保镖“一路保驾”。
若非如此,李景然是万万不会冒险让真智离开家中一步的。
听完了小彭的介绍后,几个简短片段的演示也告一段落。这时,肖兴国便一脸期待的看着李景然的脸,道:
“雷山生,您觉得我们的产品怎么样?
“嗯,肖先生,对于贵司提供的语音样品,我现在还不能完全的准确判断。你能不能拷一两个片段给我,让我放到我的识别程序上去识别一下?”李景然向肖兴国提出了一个请求,没说好,也没说不好,即使对方的产品真的好,他也不会马上就说好。
“没问题。小彭,你用u盘拷两个样本让雷山生测试测试。”肖兴国爽快的同意。当初在电话中,李景然就告诉他他们公司准备开发一款智能语音输入系统,现在人家要亲自测试,那也无可厚非。
“不用,肖先生,用我自己的u盘就行了。”李景然从兜内摸出一个崭新的usb,递给小彭。
对于这个小细节,肖兴国自然也没在意。
当小彭把载有两个语音库片段的usp递回给李景然的时候,两人就见李景然将其插入了手中的一台联想thinkpad笔记本电脑的usb接口,在上载的同时,还摸出一个黑色的耳机,插入电脑的耳机接孔。
之后,坐在李景然对面的肖兴国和彭智勇,就见李景然把笔记本搁在自己的腿上,开始噼里啪啦,速度极快的打起字来。
在等待李景然“测试”自己语音片段的过程中,有好几次,肖兴国都好奇的想站起身,绕过去看看这个年龄小得和自己那个正在上高中的侄子差不多的“雷山生”,到底是如何仅用一台笔记本电脑和一副耳机就能够测试出自己语音库的优劣。因为他贩卖语音库也不是一次两次了,每次顾客都会叫上一群语言学,语汇学和声音学方面的专家,要么到自己公司专业级的声学实验室去测试,那么就是拿着拷贝给他们的片段,到哪家高校的声学实验室去测试,几乎没有像李景然这么简单草率的。
但到最后,他还是忍住了。觉得那毕竟是人家的商业机密,如果因为自己的好奇,犯了人家的忌讳,最后弄砸了生意,那才真的鸡飞蛋打,得不偿失。
不能窥见“雷山生”测试自己语音片段的方法,肖兴国便把注意力集中在李景然的脸上,妄图从起面部表情从窥见些端倪,比如满不满意啊,高不高兴啊,之类的。但这次,还是让他失望了。因为李景然在整个测试过程中,或者说打字过程中,脸上一直都是一副云淡风轻,没有任何表情的样子。
“这个家伙,真的是有些奇怪啊!”最后,肖兴国只得在心中无奈的给李景然贴了一张“怪人”的标签。
然后,有一件事却是他永远也无法得知的,那就是他曾经离史上最强大的非人智能体仅仅一步之遥!
*