企业培训资讯_企业培训干货

当前位置:首页 > 名师团队 > 落地导师

环球体育APP-苹果发布论文,揭示Siri的秘密

发布时间:2021-07-05    来源:官网78315

本文摘要:苹果的跨平台Siri虚拟世界助手在世界上拥有多达5亿用户,语音识别似乎是苹果感兴趣的最重要领域之一。

官网

苹果的跨平台Siri虚拟世界助手在世界上拥有多达5亿用户,语音识别似乎是苹果感兴趣的最重要领域之一。上周,苹果公司公开发表了一系列真实的印刷研究论文,研究了如何改进语音启动时的检查和说话人的检查,以及多说话人的语言识别技术。【照片来源:PatentlyApple所有者:PatentlyApplel】扬声器检查和语音启动时,在第一篇论文中,苹果研究人员明确提出了训练过的人工智能模型,该模型可以继续执行自动语音识别任务,也可以继续执行识别任务。

正如他们在概要中说明的那样,语音助手识别的命令一般以启动时的短语(例如嘿,Siri)为后缀,检查这个启动时的短语有两个步骤。首先,人工智能必须识别输出声音中的声音内容是否与启动时的短语声音内容一致(声音启动时的检查),其次,人工智能必须识别说话者的声音是否与注册用户或用户的声音一致(声音检查)。

一般来说,这两项任务都是独立国家考虑的。但是,如果有年度出版者对语音发起者的理解有助于推断语音信号中的语音内容,相反,这有助于评价这两个属性。应对,研究人员设计了3套需要自学语音和说明人信息的模型,对一组数据进行了训练。这些数据包括多达16000小时的带注解样本,其中5000小时的音频有语音标签(其馀为说明人标签)。

环球体育APP

不仅如此,还有多达100名受试者用于智能音箱设备在一系列声学设置中为语料库做出贡献,包括安静的房间、来自房间内的电视和厨房设备的外部噪音,录音机以大量的音量播放音乐。值得一提的是,电视、广播、播客的2000次小时候也加入了不包括开始时短语的倒数音频记录,测量了误报的亲率。这些模型表明具有自学语音和明人信息的能力的同时,在完全相同数量的参数下(按下,控制训练过程中某些属性的变量),每项任务的准确性至少与基础模型完全相同。

事实上,在明确提出的三种模式中,有一种在多重设置下的显示高于提出者的检测基础,与文本相关的任务中的基础提高了7.6%。研究人员指出,这种实验结果非常有趣,因为这些模型是用来训练不相关的数据集,也就是说,每个音频样本都有语音标签,或者有说话人的标签,两者都没有。通过对结果的仔细观察,研究人员明确提出了灵活的设计,通过连接不同任务的训练数据,不为每个训练例提供多个标签,而是通过多个与任务有关的训练模型。

从简单的角度来看,需要在两个任务之间共享计算,节省设备内存、计算时间或延迟、消耗的电力/电池。【照片来源:venturebeat所有者:venturebeat)错误开始时减轻研究,补充研究增加了错误开始时的再次发生,也就是说,语音助手无意识地忽视了Siri这样的语音助手的声音。

研究人员回答说,他们用于图形神经网络(GNN)。这是操作者在图形结构上的人工智能模型,其中各节点与标签有关,目标是在没有基础事实的情况下预测节点的标签。在论文中,研究人员写道,语音启动时的智能助手一般在开始监视用户的催促之前不会检测到启动时的短语……错误的启动时,一般来说来自背景噪音和启动时听到类似短语的语音。

环球体育APP

因此,增加错误启动时是以隐私为中心的非侵入性智能助手的最重要方面。在未来的工作中,该团队计划将基于GNN的处置扩展到其他任务,如用户的意图分类。

多语言发言人识别在另一篇论文中,苹果研究探索了针对多语言用户定制的语言识别系统。他们回应说,语音识别系统对大多数语言都有很高的准确性。但是,多种语言频繁出现时,该语言识别系统的表现并不令人满意。因此,根据这种执行情况,研究人员要求积极开展说话人的语言识别系统工作。

环球体育APP

值得注意的是,《华盛顿邮报》最近委托的研究表明,谷歌和亚马逊生产的人气智能扬声器听不到本地用户的声音,比听不到非美国口音的概率高30%。同时,像Switchboard这样的语料库也证明了国内特定地区的使用者没有可测弯曲,这个语料库还是由IBMT和微软公司等公司使用的。针对这种情况,年出版者将有关模式的科学知识融入一个问答系统,这个系统需要为来自60多个地区的演讲者做出决定。其中,声学子模型根据语音信号发送的证据进行预测,上下文感觉预测组件考虑各种交互式上下文信号,通过这两方面的预测,自由选择拟合的单词自动语音识别系统。

据了解,上下文的信号包括接受问答催促的条件的信息,包括已安装的问答区域、现在自由选择的问答区域、用户在提出请求之前是否转换了问答区域的信息。最重要的是,在声音信号过短的情况下,依靠声学模型有助于产生可靠的预测。

例如,如果用户同时安装英语和德语,像nain这样的短而模糊的语言,在德语中有可能被驳回的nein,在英语中是数字nine。此外,为了评估该系统,研究人员还开发了一个定制指标,称为平均用户精度(公共编号:根据AUA、AverageUser指出,该指标可以更好地反映模型中的人口水平用于模型。

通过对多语言使用者的128,000个具有适当对话上下文信息的问答语言的内部语料库进行了严格的训练,在所有语言人中构筑了平均值87%的准确性,同时将最佳情况下的准确性提高到基线的60%以上。另外,团队调整参数以均衡的正确性和延迟和设备运营模型的计算抗后,平均延迟从下降2秒增加到下降1.2秒,对AUA的影响不大达0.05%。记录:本文编译器允许从venturebeat版权文章中发布禁令。下一篇文章发表了注意事项。


本文关键词:环球体育,环球体育APP,官网

本文来源:环球体育-www.bookbookblog.com

分享到:
相关推荐MORE+
07-25 四海鲸骑:3D海战动画这么燃?国漫崛起,这届网友真幸福!:环球体育APP

本文摘要:娱乐圈送过来出题来了!娱乐圈送过来出题来了!听到也有很多人分不清楚郑成功、郑和、郑提督和郑板桥?《四海鲸骑马》送了正确答案,中国第一部低燃三维大海战动漫发布,给你一秒忘记非常酷帅的郑提督。半

07-21 老国脚范志毅力挺总局 领导是不会说国足杂牌军的!

本文摘要: 李家国脚范志毅全力支持质监总局 领导干部是要说国足杂牌军的!_新闻专题频道栏目_全球体育网 全球体育主页 添加收藏 帮助管理中心 通知公告 热门标签 手机安卓版 全球体育手机客户端 沦落权

07-21 官网-方舟生存进化手机版怎么玩 手游方舟新手操作技巧

本文摘要:方舟生存演化月底6月14日在国际版登陆谷歌商业街和苹果商店,现在的游戏是国际版,中国版在线,编辑今天给大家写最近的操作界面,一起考虑吧。方舟生存演化月底6月14日在国际版登陆谷歌商业街和苹果

07-21 妈妈把我的游戏藏起来了3第12关怎么过 第12关通关攻略【环球体育APP】

本文摘要:母亲把我的游戏藏起来3第12关是怎么通过的,母亲把我的游戏藏起来3是最近的谜题游戏,我们在房间里寻找母亲藏起来的游戏机,密码各种机构的谜题,下雨为母亲隐藏我的游戏3第12关报关进攻。母亲把我

【官网】季前赛-帕戈39分亚当斯25分 深圳擒新疆获2连胜 关于2017年全国篮球高水平后备人才基地U15男子比赛裁判员安排的通知【环球体育APP】
热门文章
可口可乐获利大跌20%,总部裁员千人-环球体育
因3D摄像头技术问题5.8英寸iPhone8将延迟数周发货:官网
阿里云上线版权图片库,包年只要360元|官网
环球体育APP:全球车用电池市场六成中国造想打破日韩技术垄断
未经法律允许使用用户数据,西班牙监管组织向Facebook处以百万罚款
OKEx合约大数据——巧用基差和多空比,玩转比特币合约_官网
环球体育-过年拜年要红包的句子顺口溜 新年搞笑讨红包幽默语句
优衣库在美国悄然关闭城郊门店业务布局缩减
IBM认为模拟芯片可为机器学习加速1000倍【环球体育APP】
风云中步惊云一脸享受是什么梗 步惊云一脸享受搞笑表情包:环球体育
Uber前CEO卡兰尼克试图在辞职后重新对Uber进行控制-官网
环球体育APP-苹果发布论文,揭示Siri的秘密
环球体育APP|热切拥抱中国AI热潮,404也没能挡住Google的脚步
99家P2P上线银行存管业内警示“双系统”陷阱-环球体育APP
环球体育APP_深鉴科技CEO姚颂:半导体行业继续因AI而改变
客户案例
×