语音识别(ASR)论文优选：端到端模型是否满足工业界落地需求Are E2E ASR models ready for an industrial usage?

我叫永强

于 2022-01-07 16:06:42 发布

阅读量2k

收藏 1

点赞数

分类专栏：语音识别论文文章标签：语音识别人工智能深度学习机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/liyongqiang2420/article/details/122366681

版权

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请注明出处。欢迎关注微信公众号：低调奋进。

Are E2E ASR models ready for an industrial usage?

本文为Orange, 4 rue du Clos Courtel, Cesson-Sevign ´ e, France在2021.12.09更新的文章，主要在多场景下对比E2E的识别模型跟传统混合模型的性能和速度，具体的文章链接https://arxiv.org/pdf/2112.12572.pdf

（本文主要为实验对比。作者可能考虑成本开销，对每种模型训练时长进行限制，该操作造成模型欠拟合，不能表现出模型最优效果）

1 背景

随着端到端E2E模型的兴起，自动语音识别 (ASR) 社区经历了一个重要的转折点。同时，传统的混合模型仍然是语音识别使用的标准选择。本文在多场景下，对主流 E2E 模型和混合模型在性能和运行速度进行对比。实验表明 E2E 模型是混合模型的可行替代方案，甚至在准确性和推理速度方面都优于混合模型。因此，本文呼吁研究人员可以把关注点从性能转移到其它方面，比如端到端模型如何快速适应新的词典。

2 详细设计

本文强调很多研究都是在开源的单一场景进行试验，而

最低0.47元/天解锁文章

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
语音识别(ASR)论文优选：端到端模型是否满足工业界落地需求Are E2E ASR models ready for an industrial usage?

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请
复制链接

扫一扫

我叫永强 CSDN认证博客专家 CSDN认证企业博客

200: 原创

5万+: 周排名

15万+: 总排名

22万+: 访问

: 等级

2377: 积分

266: 粉丝

86: 获赞

61: 评论

437: 收藏

写文章

热门文章

C++学习小疑问：类的名称能否和命名空间的名称相同？ 7049
网络牛网:苏剑林和他的科学空间 6776
语音开源项目优选：免费配音网站15.ai 6167
ElegantLatex：优美的 LATEX 模板（对文章，书籍进行排版） 5259
语音识别（ASR)论文优选：WeNet 4033

分类专栏

NLP 3篇
语音识别综述 19篇
语音合成综述 44篇
语音识别论文 23篇
随想 3篇
语音开源项目 9篇
声纹识别 1篇
机器学习 3篇
语音信号处理论文 4篇
语音 1篇
TaintDroid 5篇
语音合成论文 104篇
编程 1篇

最新评论

语音识别(ASR)论文优选：粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D
维生素續C: 你好，请问如何获取数据集
LLM文章阅读：Baichuan 2 干货
qq_37131779: 报告没有提及使用的是Megatron-LM + deepspeed，来源是哪里？
语音开源项目优选：免费配音网站15.ai
艾克丶艾达: 朋友，这个网站上个月我还能上，突然就上不去了，打开只能选择跳转推特还是Patreon，知道是什么情况吗
语音合成（speech synthesis）方向一：双重学习Dual Learning
小乐777: 真的是太棒了
语音合成（TTS)论文优选:A Mask-based Model for Mandarin Chinese Polyphone Disambiguation
pongzjp: 你好，博主，有个疑问，在训练的时候，我们是知道哪些字是多音字，所以用到了Mask矩阵，在测试的时候，还需要用到Mask吗

大家在看

【DevOps】网络安全进阶之路：打造更安全、更可靠的网站 1738
千问Qwen7B chat：简单代码使用
浅谈AIGC的底层技术 1837
欢乐钓鱼大师加速、暴击内置脚本，直接安装
apache并发详解

最新文章

快上车，LLM专列：想要的资源统统给你准备好了
LLM文章阅读：Baichuan 2 干货
Is ChatGPT a general-purpose natural language processing task solver?

目录

目录

分类专栏

NLP 3篇

语音识别综述 19篇

语音合成综述 44篇

语音识别论文 23篇

语音开源项目 9篇

声纹识别 1篇

机器学习 3篇

语音信号处理论文 4篇

TaintDroid 5篇

语音合成论文 104篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

打赏作者

我叫永强 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

您的余额不足，请更换扫码支付或充值

打赏作者

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

两个鬼故事幸福精灵展望未来的诗句万能网卡驱动下载小天鹅火锅旅行社名称怎么起新颖的名字好含义的成语起名字西行记剧场版再见悟空 2018年开店起名王家男人起名字大全孩子起名网站哪个好辞海起名顽童大人宝宝免费起名打分测试述职述廉述德报告沧海电视剧氵字旁的字有哪些字起名字好听儿童起名女孩午夜dj免费中文字幕免费起名网英文名梦见老虎给服装店起个好名字屈指可数的意思宝宝免费起名的姓名测试结果打分生辰八字杨卓娜李姓好听的男孩起名游戏起个英文名字看看屋官方在线观看给合作社起个名字的妖孽小仙医陆言徐性男起啥名好少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人？男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户 19岁小伙救下5人后溺亡多方发声 315晚会后胖东来又人满为患了张立群任西安交通大学校长 “重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费小米：已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡 “开封王婆”爆火：促成四五十对奥巴马现身唐宁街黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化