137 语音识别数据库
第二天一上班,李景然就叫自己的新秘书江小柔进自己的办公室。
“李总!”江小柔来到李景然的办公桌前,恭恭敬敬的站在前面,一双修长的小手相互交织,看起来有些紧张。
“嗯,小柔,放松一点,不要紧张。这两天还习惯吧?”李景然把手放在桌上,笑眯眯的看着眼前这个有些羞涩的女孩儿。
江小柔是昨天开始正式上班的。这两天,李景然也没给她安排什么具体的工作,就是让她熟悉下环境,认识一下公司的几个同事,然后每天给自己的办公室打扫一下清洁,干些端茶倒水的杂事。
江小柔倒也勤快,不仅把自己的办公室打扫得一尘不染,井井有条,今天景然来的时候,发现她还帮着打扫外面的公共办公区,擦灰拖地,干得是极为利索。
由于公司很小,只有几个人,李景然也没有请专门的清洁工,办公室的清洁,都是由几个员工分着做。
“嗯,还习惯。健哥,妍姐,子恩姐以及佳宜姐都挺照顾我的。”江小柔柔柔的道。
“呵呵,那就好。你是新人,有什么不懂的,你要多向他们请教,不要因为不好意思而害怕开口。”
“嗯。谢谢李总。我,我会的。”江小柔点了点头,轻声道。
“这样,我现在有一件事要你去办。你去找一下哪里有中文的语音识别数据库,不管是免费下载也好,还是需要花钱购买,也不管是普通话的数据库,还是各地方言的数据库,都行。然后把你了解的情况告诉我,好吧?”和江小柔一阵寒暄,表达完自己的“关心”之后,李景然就开始进入正题,准备让自己的秘书为自己办第一件事。
“语音……数据库?”江小柔皱起玄黑色的,细细的柳叶眉,显然是第一次听说这个新名词。
“嗯,语音识别数据库,简称语音库。好吧,你先去了解一番吧。”说完,没给江小柔继续发问的机会,就让她出去了。
“玉不琢,不成器!先看看你的办事能力吧!”李景然心里想着,而待江小柔出去之后,他自己就打开电脑,开始在网上查询起语音识别数据库的信息来。显然,比起江小柔这个才出校门,什么也不懂的小菜鸟,他更相信自己的速度和效率!
通过网上的一番搜索之后,大概是太过专业,关于语音库的信息并不多。不过经过一个多小时的搜索,他还是找到了一些可以免费下载的语音库,有男生,有女生,有中文,也有英文。还有一些语音数据提供商,可以按照客户的要求提供专业的语音数据。
“小柔,你进来一下。”李景然拿起座机,叫自己的秘书进来。
“李总,你找我?”江小柔急冲冲的走了进来。李景然给她打电话的时候,在还在网上恶补语音数据库的相关知识,看了一个多小时,才勉强懂得这所谓的“语音识别数据库”到底时候什么东东。
“怎么样?有消息了吗?”李景然坐在大班椅上,看着江小柔问。
“啊,对不起,李总,我……我刚才一直在学习有关语音识别数据库的知识,还没来得及……来得及——”
“还没来得及查是吧?”李景然看着此时显得极度紧张的江小柔道,脸上还是笑眯眯的。
但他这种笑容,却给才上班不久的江小柔,带来的巨大的压力。
“对不起,李总,我——”江小柔神色焦急,以为李景然要责怪自己。
“没关系,小柔。不懂的可以慢慢学。没有人天生下来就懂的。你过来,我已经找到了几个免费的语音库,我把网址发给你,你把它们全部下载下来,然后再用U盘拷贝给我,好吧?”李景然把忐忑不安,有些不知所措的江小柔叫到自己的身边,给她看了看自己找的语音库,然后又说,“好了,先出去吧,我马上就把网址发给你。”
“嗯,李总,我一定马上去办!”江小柔重重的点了点头。她原以为李景然会责怪自己办事不力,但李景然不仅没有责怪她,反而帮她做了一些本该她自己做的工作,这让江小柔在松了一口气的同时又有些愧疚。江小柔用力的吸了口气,捏了捏小拳头,在心中对自己道:
江小柔,你一定要努力呀!
对于网上的那几家语音库供应商,综合比较之后,李景然就对深圳的一家名叫智冠语音数据中心的语音库供应商感兴趣起来。
“不错嘛,……从2004年就开始从事专业的语音数据采集……在全中国有超过20个数据采集中心……可以根据用户的需求,收集各种语音,甚至包括方言……和大陆,包括香港的多家高校,研究所,公司都有着紧密的合作关系,甚至和全球最大的数据中心LDC也有合作……不错不错,就是这家了!”李景然在网上翻看着这家数据供应商的介绍,是越看越感兴趣,越看越兴奋。
通过这两天的扫盲,李景然明白,语音数据库的采集和整理就如同编撰字典一样,绝对是一件浩繁的大工程!实际上,在某种意义上说,建立语音数据库就是编撰字典——编撰声音的字典!它需要收集每个字词的不同发音,然后进行标注,检查,整理,分离,然后合成一部声音的大字典!
但这比起编撰字典来说,复杂程度和工程量又要浩大得多。因为每个字词的写法只有一种,但它们的发音却有可能有多种,男人是一种声,女人又是一种声,如果用不同的方言来讲,更是不同,而且所有的这些音,都需要专业的采集设备来采集。因此,建立语音数据库,绝不是像李景然当初那样简简单单的买些字典,收集些文本资料就可以搞定的事情。
在不能向真智开放互联网,让他这个超级智能到互联网上去自主采集的前提下,要想得到一个比较满意的数据库,那绝对是一件需要集众人之所长才能完成的壮举!
与深圳智冠的联系相当简单,当李景然在电话中报了自己的来历,并向对方说明自己想购买专业的语音数据库后,那边的人立即表示出了极大的兴趣。
“雷山生,我们有各种不同类型的专业语音数据库,涵盖了普通话,粤语,大陆各地方言以及英语的数据库,请问你系准备购买哪种类型的数据库噶?”一个明显带着粤语普通话的中年男音在电话中对着李景然道。
“雷山生?”李景然一愣,“妈的,老子姓李好不好?看来,广东人的普通话和四川人一样,都是不敢恭维!”他没工夫去纠正人家的发言,见提到正事,就答道:“呃,肖先生,如果可以的话,所有有关中文的语音数据库,我都想购买,可以吧?”
“啊,什么,雷先生,你想买全部的中文数据库?”一听到李景然说想买所有的语音库,对方有些吃惊,但开口之后,似乎又觉得自己的吃惊有些不礼貌,或者多此一举,于是有些犹豫,过了一会儿才道,“对不起啦,雷山生,或许我这样问有些不礼貌,你要买这么多种类的语音库,是准备用来做什么的呢?”
“妈的,晓得不礼貌还要问啊?”李景然暗自腹诽,不过,在这点上,他并不打算打什么埋伏,如果自己以后进军智能语音合成和智能语音识别这两大“高科技领域”,不可能不继续跟这些语音库提供商打交道,迟早人家会知道的,于是,李景然道:
“是这样的,肖先生,我们公司最近准备想开发一款智能语音输入系统,但是还缺少一种可靠的语音识别数据库。听说贵公司在这方面口碑不错,比较专业,所以,就找上了贵公司。肖先生,你看?”
“哦,原来系这样的噶!那你找我们智冠找对了噶。给你说,雷先生,我们智冠从2004年开始就一直从事专业的语音数据采集……”接下来,李景然就听到那个姓肖的家伙,在电话中滔滔不绝的跟李景然讲起他们智冠的“光辉历史”,有多么雄厚的技术实力,和多少高校,科研机构合作过,现今市面上流行的语音输入软件都从他们那里买过语音数据库。
“这家伙,倒是把公司的公司简介背得很熟!”李景然一边在心中继续腹诽,一边等着那家伙自吹自擂完毕,在此期间,心头突然有些担心起来:
这什么智冠的公司,不会是什么皮包公司吧?
“……就系这样的啦,雷山生,在全中国,没有比我们智冠更专业的语音数据提供商的啦!总之,你选择我们智冠,绝对是最明智的选择!”
“嗯,明白,就是看到贵司比较专业,所以才打算从你们那里购买嘛!”李景然适时送上马屁,心头却对着家伙的话,开始打起折来。
“那么雷山生,我是先传一些样品,让你看看呢,还是?”
“哦,肖先生,样品就不用传了。这样的,我下个月中旬,会到广州去一趟。届时,能否麻烦肖先生亲自来广州一趟,到时候咱们面谈?”
“好的好的。能够和雷山生面谈,那就最好不过了!雷山生,请问你什么时候去广州?酒店定下来了没有?下个月中旬可是广交会开始的时候!如果要定酒店的话,一定要趁早哟!”对方在在电话中提醒。
而就是这个提醒,打消了李景然心中才升起不久的那丝疑虑。
广交会?老子去的就是广交会!
——————————————————————————————
感谢“肥仔7931,三千尘,飘渺云隐”三位书友的打赏!灰常感谢!
再次温馨提示:没有收藏本书的朋友一定要收藏哦,下一周,大家就不一定找得到本书了哈!