语音识别:您的智能手机变得更智能
当我们还是孩子的时候,我和我的朋友们经常玩一个游戏,我们在游戏中幻想哪些星际迷航技术最有可能是我们生活中的现实世界发明。输送机和经纱驱动-不太可能。但是通讯器、声控计算机和通用翻译器是非常可能的。
当语音识别出现在电脑桌面上时,这似乎是一个好主意——但对大多数人来说,它不能代替键盘和鼠标。现在,语音识别技术正在一个全新的环境中使用:手机。它的存在进一步促进了它在桌面上的使用和发展。
语音识别最早作为一种原始技术出现在20世纪50年代,那只是一种好奇。20世纪60年代初,IBM的鞋盒设备可以识别16个口语单词,并对简单的数学请求做出响应,例如“三加四的总数”。
Dragon Systems的口授可能是PC的第一个语音识别程序,它是在20世纪80年代早期为DOS计算机发布的。它只能识别单个单词,一次只能说一个。随着时间的推移,它演变成了龙的自然语音的产物(现在是第11版,归Nuance Communications所有),可以用正常的会话声音和速度转录口语文本。
桌面上的语音识别有两大局限。首先,为了使程序高度准确,必须训练它识别用户的语音模式。Windows Vista和Windows7的原生语音仍然需要用户培训期,才能对文本技术和第三方产品(如Long Nature Speech)有用。
第二个限制是键盘的普及。大多数人习惯于打字而不是说话,因此语音控制面临着与德沃夏克键盘布局相同的困难障碍。普通老QWERTY现成好用,为什么还要学用dvorak?
负责为各种环境开发语音识别技术的微软TellMe团队高级产品经理Abhi release非常赞同这一点:“在桌面环境下,用户可以轻松使用其他交互方式,即键盘和鼠标,所以使用语音主要针对语音爱好者。
更广泛的应用所需要的语音控制计算是两件事——开箱即用更好,演讲已经是王道。其中一个地方长期以来一直在崛起:手机。
Nuance产品管理和营销副总裁Matt Revis解释了桌面和移动环境的区别:“桌面是完全专注于桌面用例的静态环境,因此桌面语音遵循任务流:支持办公应用、Web浏览、通信等。在移动领域,说话更多的是支持各种生活方式:专业人士出门、出去玩、免提(通话)等等。
Gartner分析师Tuong阮源也认为,声音在移动环境中更有意义。“从使用角度来看,”他说,“语音识别在手持设备上的价值要大得多。它增加了一种方便直观的输入法。
Nguyen补充说,这当然是正确的,如果一个简单陈述的替代方法是挖掘大量菜单或对抗微小的屏幕键盘:“随着纯触摸设备(没有物理按键)的使用越来越多,语音识别被用来增强数据输入/输入。它还支持免提要求或立法”。
(故事在下一页继续)
语音识别是通过建立口语统计模型来实现的。“为了识别口语单词,”谷歌产品经理阿米尔马内(Amir Mane)说,“我们比较了输入语音和语言的统计模型,试图找到最接近的匹配——系统对用户所说内容的最佳猜测。”
语言的统计模型需要大量的存储空间才能实用。马内说:“(它们)必须涵盖一种语言的所有基本声音(音素)、所有单词和所有不同的方式,这些在口语中可以联系在一起。此外,还有口音、性别和年龄差异、地区发音、选词(“汽水”对“可乐”对“流行”)等等。
曼恩指出,谷歌语音搜索的统计模型需要三个要素:声学模型、语言模型和词汇。他说:“声学模型是通过转录语音记录和口语内容,并使用这两者来创建电话表示,这是特定语言中所有单词的基本组成部分。
语言模型包括找出哪些单词可能跟在其他单词后面,并将它们用作提高识别准确性的方法。马内解释说:“在‘帝国反击’这个词后面会加上‘国家’或‘打击’(例如《帝国反击战》),而不是‘多样化’或‘番石榴’。从该领域收集数据有助于不断改进语言模型和词汇。
谷歌不是唯一的众包公司。语音识别应用Vlingo将cookie放在用户的手机上,根据用户自己的反馈和类似扬声器的模型不断构建语音模型。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订