江苏昊目智能
当前位置: 自动焊接机 > 公司简介 >

语音识别技术突飞猛进 或成人工智能下一个风口

点击:934

  伴随着重出江湖的“阿尔法围棋”克日横扫多位中日韩顶尖棋手,有些人评价说,人脑斗不外机械的时期已光降。不外,正在言语了解层面,今朝机械还远远斗不外人脑,但这类状况正正在敏捷发作转变。

  语音辨认手艺一日千里 或成人工智能下一个风口

  “嘿,Kuri!想一同玩吗?”“嘿,Kuri!能讲个故事吗?”只要听到叫本身的名字,身高半米、看上去胖嘟嘟的机器人Kuri就会睁开眼跑到你跟前,像小狗普通心爱。正在美国拉斯维加斯进行的消耗电子展上,这款乌红色的呆萌家用机器人让媒体争相报导。

  “Kuri是一款社交机器人,您能够把它当做家庭的一个成员,”研发这款机器人的草创企业梅菲尔德机器人公司首席执行官迈克尔·毕比说。除能够用手机运用程序控制外,还能根据简朴的言语下令批示它完成一些义务,比方正在家里主动巡查、把小狗赶下沙发、取小孩一同顽耍、讲故事、放音乐等等。

  语音辨认日新月异,达到了人耳的水平

语音识别技术突飞猛进 或成人工智能下一个风口

  据预测,到2020年,美国每10户家庭中就有一户将具有家用机器人。这一些机器人不只醒目家务活,更主要的是还能与人简朴交换,替人们排忧解闷。

  跟着重出江湖的“阿尔法围棋”克日横扫多位中日韩顶尖棋手,有些人评价说,人脑斗不外机械的时期已光降。不外,正在言语明白层面,现阶段机械还远远斗不外人脑,但这类情形正正在疾速发作改动。

  “电脑的下一个接口是语音,”展会主办方美国消耗技能协会首席经济学家肖恩·杜布拉瓦茨在记者会上断言。他列出将来5大技能发展趋向,语音交互排在第一位。

  目下当今的智能手机和个人电脑依附图形用户界面来实现人机交互。它最早可追溯到1981年施乐公司的“施乐之星”操作系统。3年后,苹果公司“偷师”的Macintosh成为首个正在商用行业取得成功的图形用户界面个人电脑。从命令行发展到图形界面是人机交互体例的严重革命,助推了个人电脑敏捷遍及。

  自那之后,伴随着小我私家设备运算本领日趋加强,种种应用程序越来越多,图形用户界面还变得更庞杂。与此同时,由2010年逐步鼓起的可穿着式设备和其他一些非传统设备,起头实验把最主要的运算功效经过无线连接交给手机或其他中枢设备。

  很多人以为,图形用户界面已靠近极限。接下来,谁能把人类由纷繁复杂的窗口、工具栏和菜单选项中解放出来,脑电波、眼神照样语音?10年前这三种体式格局没有一个靠谱,本日语音好像成了首选项。

  语音辨认研讨已有好几十年,但进度一向没有皆大欢喜。微软早正在1994年就成立了研讨团队,但2006年研讨人员正在投资者眼前演示时,电脑居然把“mom”(妈妈)听成了“aunt”(阿姨)。“初期版本的语音辨认技能太糟糕了,”杜布拉瓦茨说。据他先容,到2011年,哪怕口音再尺度、配景噪音再小,语音识此外单词错误率仍然高达25%,即电脑每听4个词就会错一个。

  得益于深度进修取人工神经网络的开展,近3年来语音辨认日新月异,单词错误率降到5%摆布,达到了人耳的水平。“我们正在曩昔30个月所获得的语音辨认进度比曩昔30年还要多,”杜布拉瓦茨说,“这便是为何我以为语音技能会涌现爆发式增加。”

  “动动嘴皮子”,就能够关灯、锁门,乃至叫车

  苹果手机推出了语音助手Siri,微软、谷歌和亚马逊还接踵推出类似的语音助手。值得一提的是,约两年前亚马逊第一个把其语音助手“亚历克萨”嵌入到“反响”智能音箱中,作为智能家居的中枢操纵音箱,让人们多了一个“家庭事务助理”。有了“反响”,人们“动动嘴皮子”就能够查信用卡账单、关灯、锁门,乃至叫车。

  尔后,谷歌推出了家用智能硬件“谷歌家庭”,三星和遐想等还筹办推出近似产物……一场由语音交互驱动的智能家居比赛正正在进行当中。汽车厂商还入手下手到场进来,福特正在展会上公布跟亚马逊协作,正在车上安装“亚历克萨”,未来可由语音掌握车内播放音乐、浏览消息,快抵家时翻开车库门和家庭中的照明、空调等。

  杜布拉瓦茨说,到目前为止,环球预计已售出约500万个语音助手,本年大概还会售出500万个。

  正在中文语音辨认层面,科大讯飞是杰出人物。正在此次美国展会上,长虹就展出了基于科大讯飞手艺的语音节制电视和空调,并先容说,2012年长虹就推出了语音节制电视,现阶段已升级到第三代,除普通话,还能听懂四川话、粤语等几种方言。正在演示中,长虹工作员根据语音遥控器或安装了相干软件的手机,说出“长虹小白,我想看某某电视连续剧第几集”,电视就直接开端播放相干剧集,并可以批示快进、退却或直接跳到某个工夫点开端播放。

  复兴通讯高等副总裁程立新正在展会新品发布会上说,复兴把语音交互视为将来手机成长的一个主要标的目的。“我们还牵头成立了一个聪慧语音同盟,以打造一个好的生态圈。我们以为将来智能手机的接口会有许多的、大的成长,语音的成长有可能会真正束缚人类的双手,”他说。

  语音辨认还要克制许多阻碍,例如明白喧闹布景下的言语指令、主动纠错、明白统一词语正在不一样情境下的语义等。但杜布拉瓦茨以为,将来是悲观的。

  “显然,语音(辨认)跨过了拐点,正从理论走向实际,”他说,“人们起头思量,若是它(语音辨认)能施展阐发得再好一点点的话,我们该如何使用它。”