第一次参加 CHiME-6 challenge 总结robingao1994的博客-

16 四月

星期四, 16 四月 2020 18:23 Last Updated on 星期四, 16 四月 2020 18:23 0 Comments

第一次参加chime的自然场景多人对话远场语音识别评测

主要负责数据增强和音频信号处理

冲着高分去的，但由于最终的transcriptions包含了特殊symbol, 本来达到了既定目标，但修改之后最终结果并没有达到预期，

有几点记录一下：

1. GSS + ASR alignment是能稳定提升1.5%的识别率的，取决于用什么ASR模型进行alignment了，这个的目的就是去找有效音，因为原始的用时间戳的对齐方法，对每一帧他是不会标注出“静音”帧的。 vad同理能在这里取得不错的效果，但是没有ASR的好。 GSS alignment在pb_chime5 需要改一下数据处理的不稳已经标注部分，但是chime-7大概率换了批数据，所以这个算法以后大概率不会在用到了，毕竟比现在的pit,danet等算法更不实用，出来的音频更失真。把GSC修改成mask-based会更好

2.根据房间参数生成RIR会更好

3.cnn-tdnnf还是王道

4.这种比赛还是对同一场景下的数据过拟合会更好

5.Separation的作用与BF搭配能超越传统BF，利用separation 估计一个mask出来再传入bf，能比市面上任何BF都好

6.没有实验ROVER的fusion结果，但lattice-combine 能达到不错的结果，我相信ROVER应该会更好

7.wpe做stft时需要做fading和pad，不然效果会不好，甚至雪崩

8.做alignment时要把subsample设置为1

虽然成绩没出来，但排名应该不会特别高，争取下次努力冲！

第一次参加 CHiME-6 challenge 总结robingao1994的博客-

RoadmanG

发布了15 篇原创文章 · 获赞 37 · 访问量 3万+

私信关注

展开阅读全文

本页所有内容来自官方网站 https://www.imapbox.com 新闻来源：互联网搜索引擎和新闻站

本网页所有图片由 ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片，下载并得到。

ImageBox 图片批量下载器工具地址: 网页图片批量下载工具-最新版本下载

非凡下载站地址：https://www.crsky.com/soft/35838.html

本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器下载并得到。

ImovieBox网页视频下载器下载地址: ImovieBox网页视频下载器-最新版本下载

本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.

阅读和此文章类似的: 全球云计算

第一次参加 CHiME-6 challenge 总结robingao1994的博客-

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

第一次参加 CHiME-6 challenge 总结robingao1994的博客-

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

登录