wineast
财经 | 宏观 | 国内 | 国外  投资 | 风投 | 天使 | 私募 | 产业 | 并购 | 投行  证券 | 金融资本 |  创 业 板 
商机 | 公司 | 产品 | 供求  学院 | 创业 | 管理 | 连锁 | 投行 | 理财 | 贷款  机构 | 投资机构 |  外商投资 
服务 | 展会 | 招聘 | 名录  市场 | 项目 | 投资 | 专利 | 技术 | 产权 | 连锁  互动 | 创业社区 |  有问必答 
您当前位置:中国创业投资网 >> 新闻频道 >> 产经新闻 >> 无线/通信 >> 浏览文章

语音云乘着移动互联网和云计算东风(2)

2012-6-23 5:28:12IT经理世界 【字体:

一则荣威车主“调戏”iVoka的视频在网上流传甚广——iVoka是荣威350上装配的语音云驾驶系统——当车主对着iVoka说“我爱你”的时候,iVoka不无醋意地表示“这句话你也对Siri说过吧”,车主只好无奈认栽。

事实上,对于iVoka这种全新的智能语音人机交互装置,逗趣唠嗑只是其“副业”,连接豆瓣点播音乐、查天气、查股票、查航班、查实时新闻资讯等等,才是它的正经功能——在这一应用背后,是一家叫科大讯飞的公司所提供的语音技术。

2012年3月22日,北京国家会议中心,科大讯飞“新一代语音云平台”发布会现场。科大讯飞CEO刘庆峰拿出一部智能手机,开始演示公司开发的新应用“讯飞语点”。他用自己的声音命令手机发短信、安排日程、查找餐馆,还不忘调侃手机:“你能做什么”?手机回答道:“我正在反思自己的不足。”现场立刻笑声一片。

一切都像极了当年由乔布斯掌控的苹果产品发布会现场。

苹果公司的Siri大热,将语音技术的消费应用提到了日程上,各行各业都在挖掘自己和语音的结合点;而像科大讯飞这样的语音技术提供商则希望在更广泛的消费应用方面和不同的开发商合作,找到更广阔的天地。

移动引爆语音

人们对下一代语音交互方式的美好畅想,从来就没有停止过。不过,在很长一段时间内,语音技术被看成是鸡肋:弃之可惜,食之无味。微软、谷歌、IBM,这些世界级的IT巨头,一直在语音技术商用方面努力探索。然而,前景虽然很美好,语音技术却始终无法实现大规模民用。

“我当年在微软工作的时候,曾听到比尔·盖茨说:‘语音技术在5年后将改变世界。’5年之后,我又听到他说了一次;到了第三个5年,比尔·盖茨有一次提起语音,他说:‘这话我过去说了两次。’”创新工场CEO李开复所讲述的这件往事,折射出语音技术当时所面临的尴尬前景。

而前谷歌中国的高级研究员、《浪潮之巅》的作者吴军最近在微博里调侃道:“语音识别(在产品上)忽悠人从上世纪90年代开始,大约每10年一个周期,最后的结果相同,就是大家发现这是个玩具,而不是工具……如此反复。不过我相信最后有一次不再是忽悠人,但是不是现在这一次?”

至少,在扑面而来的移动互联网和云计算大潮中,想象从来没有像这一次这么像真的:决定语音识别技术精确度的关键性因素在于语料库的丰富程度。

在过去,语料库的建立,主要是通过人工采集声音信号来完成,需要花费大量的时间和精力,语料库的增量非常有限,这也意味着语音技术的精确度提升速度非常低。而在移动互联网时代,语音交互的终端和应用在不断涌现;另一方面,云计算能够处理比以往更海量的用户语音交互数据,云端的服务器能够不断收集、处理这些数据,在不断反馈训练中持续进化语音理解能力。

并且,随着移动用户和多种移动终端的爆发式增长,人们对语音应用的需求前所未有的强烈:移动终端设备键盘与屏幕尺寸小,用手指输入并不方便,尤其是在移动的应用场景中,眼忙手忙,语音输入作为信息交互最自然、便捷的手段,更能发挥它先天性的作用。

而苹果公司所推出的Siri功能在全球所引发的疯狂,则成为语音技术在移动互联网上被引爆的直接导火索,也让一直苦于找不到语音卖点的厂商茅塞顿开。苹果的高明之处,在于将Siri的语音技术与苹果封闭系统内的各行各业的信息服务、应用进行了无缝的对接,并且整合了三大数据库:Yelp、维基百科、WolframAlpha,这就意味着Siri不仅仅是一个被人“调戏”的玩具,而是在某种程度上可以帮人们解决实际问题:查找餐馆、地图、翻译……

尽管在目前看来,Siri的实用性依然有限,但随着用户越来越多,建立的语料数据库就越丰富,就越能通过数据的不断纠正变得越来越“聪明”,这就有了“人工智能”的意味。

分享到:


网友评论:

  • 阅读排行
  • 本日
  • 本周
  • 本月
关于我们 | 免责条款 | 网站地图 | 联系我们 | 广告服务 | 帮助中心 | 会员登陆 | 友情链接 | 订阅RSS |