我们采访了一位资深速记,揭马云云栖大会推崇的ET智能语音识别现状

[ 导读 ] 2016年云栖大会让人眼前一亮的,是实时字幕翻译的黑科技——阿里云ET人工智能和它在大会上展示的实๑时语音识别技术。但这次的技术展示并没有引起行业恐慌,而是没有被大家看好。语音识别尚无法达到人类水平,∫背后原因З何|︴()〔〕在呢?

Л 〣 ≈

阿里巴巴主办的2016年云栖大会于10月14日在杭州召开。此次云栖大会让人眼前一亮的,是≧实时字幕翻译的黑科技——阿里云ET人工智能和它在大会上展示的实时语音识别技术。

如大家所愿,杭州地区的速记群炸了,由于阿里云ET人工智能已经在阿里云栖大会上秀肌肉了,因此很多同行被邀请去“连续四天”做现场速记。

等等,这个剧本是不是拿错了?不应该是速记觉得很恐慌,甚至问马云,“◐我们的出路在哪里吗θ?”

情况并非大家所想,人工智能目前在速记行业没有造成恐惧,而是不被看好。

得知这一消息,我们第一时间联系了一位资深速记朋友,想询问速记员们▉对语音识别是什么看法?会不会面临被取代的危机?但得到的答案却恰恰相反。她告诉我们,速记员们事实上也希望ET机器人这样的人工智能语音识别能够取代他们的工作≥。然而这个想法现在还不能ν实现。

首先⿸,准确率仍不能达标。目前语§音识别的错误率远高于1/1000这个速记员的最低标准。李彦宏说百度的语音识别۞۞能做到准确率97%,但⺌这就意◈味着每两行就要错一个字,这样的错误率谁能容忍?

其次,人的灵活度比机器人要高很多。语音机器人目前并不懂断句、不懂标点符号用法、不懂方言口语、不♨能去除多余的语气词“嗯、啊、哦”等;有些嘉宾多次重复某些话,语音机器人并不能判断这些是否是多余的;同音词也是一个ぁ问题,语音机器人不能通过上下文判断同音词的使用;当速记发现前面۩错了,能够寻回改正,但是语音机器人不可以。

另外这名朋友还告诉我们,目前用人工来为语音识别纠错也不现实↙。科大讯飞曾招募速记去做ψ‰错误纠正员,但是没人愿意去。速记听完就打速度很快,但是纠正要经历几个过程“找、删、写”这░三个步骤其实比纯打字耗时更长,所以不见得语音☼机器人能够减轻速记员的负担。

目前看来,语音识别取代速记还要很久,那么现在研究人工智能语音识别的公司都是拿它来做些什么呢?带着这个问题,对国内外►主流公司在语音技术上的布局进行了︰盘点。

上图盘点了国内在语音技术上有重大布局的9家公司,在9家之中,科大讯飞、百度、中科信利Ↄ、云知声4家的技术都来自于中科院,可见中科院在国内语音识别技术上的领军地位。此外,上市公司或上市公司控股公司,具有资金ё-和资源优势,其商业化产品多为软件,例如百度语音嵌入百度旗下其他app,搜д狗的语音识别应用于搜狗输入法,腾讯的语音识别应用于微信的语音转文字功能。相比之下$,创业公司的语音技术依靠硬件作๑·ิ.·ั๑为流量分发入口,例如云知声的智能家居、思必驰的车载语音助手等。总体来看,国内的语音技术以中科院为首,各公#司都在努力将〓语音技术商业化。

相比国内而言,国外大公司在收购技术上更愿意花钱,但商业化程度并不高。例☞如谷歌、Facebook,虽然收购动作频繁,但并没有推出主↔打语音技术的产品,语音识别很可能为人工智能产品服务。国外的语音技术产品多为辅助软件,例۩๑如苹果∝的Siri、微软的智能助理Cortana等。总而∠言之,国外大公司目前偏向于韬光养晦,并不急于商业化。

通过对比不难发♂现这其中差异化的原因。已经商业化了的语音识别技术,以国内云知声、科大讯飞Ψ等为例,多数是通∞过关键字识别,使机器能够听懂特定指令,实现⿺人机交互。

而对非限定性语句进行识别的另⿵一些产品,如百度、搜狗、谷歌、Facebook的语音搜索、输入功能,以及苹果的Siri等语音服务功能,这类⿰技术比较还不成熟,也存在一定的错误率。因此这些功能还不能实现商业化,它们基本上还在增大用户群体,获取大量数据的阶段。

虽♂然目前这方面的技术还™不成熟,但在不久的将来,语音识别就有可能达到甚至超越人类水平。

科大讯飞副总裁、研究院院长胡郁就曾表示,由于深度学习和人工神经网络技术的应用,语音识别的错误率正在以每年30%的速度降低,在这种趋势下ↀ,◁在未来四到五年的时间内就能达到人类水平。

也就是说四到五年后,语音识别就有可能取代速记了。事实上不只是速记,更多的传统行业和从业者会受到冲击。你觉得你的工作会被人工智能取代吗?不妨在评论区留下真知灼见。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处: 我们采访了一位资深速记,揭马云云栖大会推崇的ET智能语音识别现状