- 积分
- 339
- 最后登录
- 2017-2-3
- 阅读权限
- 20
- 注册时间
- 2011-7-1
- 回帖
- 25
- 精华
- 0
机械村良民
- UID
- 855
- 威望
- 1
- 机械币
- 64
- 活力
- 0
|
国内外语音识别行业最全盘点及技术分析和预测
随着机器学习和人工智能的热闹,国内语音行业也可谓是百花齐放,尤其是最近几年,不仅涌现了很多国内外的小公司,而且巨头们也开始加速语音识别行业的布局。本文就详细盘点一番国内外的大型公司,并对他们掌握的技术进行分析,同时预测一下未来的语音识别趋势,期望带给行业内外的专业人士些许参考,借此更进一步推进整个行业的发展。
1 国外语音识别行业收购盘点和技术分析
传统语音识别行业贵族Nuance逐渐没落
任何时候提到语音识别,都不能避过Nuance这家公司,这家公司曾经在语音领域一统江湖,世界上有超过80%的语音识别都用过Nuance识别引擎技术,其语音产品可以支持超过50种语言,在全球拥有超过20亿用户,几乎垄断了金融和电信行业。就算现在,仍旧是瘦死的骆驼比马大,Nuance依旧是全球最大的语音技术公司,掌握着全球最多的语音技术专利。苹果语音助手Siri、三星语音助手S-Voice、各大航空公司和顶级银行的自动呼叫中心,刚开始都是采用他们的语音识别引擎技术。Nuance已经登陆了纳斯达克,三星、苹果和百度都和它传过绯闻,传言多次收购,但是全都无疾而终。
事实上,Nuance有点过于自大了,语音技术即便冠绝全球,但是在具体应用上,差距就没有那么大了。语音识别技术并非高不可攀,实际上一款用户体验较好的语音识别系统,很大程度上依靠数据和经验,专利和算法什么的并没有那么重要。聪明人自然很多,所以巨头们只需考虑挖到专业人士或者收购初创公司,自主研发出不逊于Nuance的语音识别技术也不是太难的事情,又何必花费巨资看Nuance脸色呢。
苹果收购Siri、NovaurisTechnologies、VocallQ和Emotient
苹果的Siri已经鼎鼎大名了,也算世界上语音识别的执牛耳者。Siri并不是苹果自己研发的技术,而是2010年苹果收购Siri Inc.公司的产品,2011年苹果将该技术融入到iPhone 4S中并发布了Siri语音助理。Siri Inc.这家公司成立于2007年,原本核心技术是CALO人工智能项目。当然Siri刚开始发布的时候语音识别的体验还很差,众多果粉也是四处吐槽。因此2013年苹果又收购了语音识别公司NovaurisTechnologies。Novauris是一种可识别整个短语的语音识别技术,这种技术并非简单识别单个词句,而是试图利用超过2.45亿个短语的识别辅助理解上下文,当然这是很有难度的一件事情。不管怎样,这次收购也让苹果进一步完善了Siri的功能。
但是这还是不够,因此2015年苹果又收购了英国语音技术初创公司VocalIQ。VocalIQ开发的人工智能软件,能够帮助计算机与用户进行更为自然的对话。VocalIQ使用机器学习(machinelearning)开发虚拟助手,将语音处理和机器学习技术整合到可穿戴设备、家庭联网设备当中的同时,这家公司还特别关注车载应用的开发。这次收购也证实了苹果将来迈入汽车领域的决心。Siri应该是通用语音识别领域用户体验当前较好的产品,特别是在儿童语音识别领域,这也得益于苹果极易上手的特性吸引了众多小朋友,也包括笔者家里的小朋友。
当然,Siri还是距离我们的实际应用需求还差很远,因此苹果最近又收购了美国圣地牙哥AI 技术公司 Emotient,接收其脸部表情分析与情绪辨别技术。据悉,Emotient开发的情绪引擎可读取人们的面部表情并且预测其情绪状态。 |
|