当前位置: 首页> 文旅> 美景 > ctc(Connectionist Temporal Classification) 学习

ctc(Connectionist Temporal Classification) 学习

时间:2025/7/30 19:28:42来源:https://blog.csdn.net/j99999999955555/article/details/140670126 浏览次数:0次

        CTC实际上解决了一个问题,狭义的讲,怎么确定一个语音识别网络输出的音素串是否对应一个单词。这个在利用损失函数进行优化的时候是必要的。

        一个单词的说法是很多的,有的部分发音长,有的部分发音短,因此一个单词的音素序列是很多的,不确定的,不可能直接用枚举的方式判断音素串是否对应一个单词。       

        CTC对序列整体进行建模,计算一个音素序列对应当前单词的概率。

        以heeϵlϵlloo 为例,判断heeϵlϵlloo音素序列是hello的概率。考虑一个整体比较麻烦,可以考虑把一个序列拆分成一个一个基本单元来分析。可以考虑用动态规划的方法。这里用递归的思路来分析。

        首先用P(heeϵlϵlloo|hello)表示heeϵlϵlloo对应hello的概率,考虑到连续音素可以匹配一个字符,P(heeϵlϵlloo)可以拆分成P(hellϵlϵllo|hello)P(o|o)+P(hellϵlϵllo|hell)P(o|o),然后P(hellϵlϵllo|hello)又可以拆分P(hellϵlϵll|hello)P(o|o)+P(hellϵlϵll|hell)P(o|o),然后不断拆分下去。最后会拆分成每个输出的音素的对应某个字符的概率。某个音素是某个字符的概率就是NN输出的softmax概率。

        
https://distill.pub/2017/ctc/icon-default.png?t=N7T8https://distill.pub/2017/ctc/

https://zhuanlan.zhihu.com/p/40170325icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/40170325连接时序分类 Connectionist Temporal Classification (CTC)_connectionist temporal classification-CSDN博客文章浏览阅读1.6k次,点赞12次,收藏11次。CTC全称Connectionist temporal classification,是一种常用在语音识别、文本识别等领域的算法,用来解决输入和输出序列长度不一、无法对齐的问题。在CRNN中,它实际上就是模型对应的损失函数(CTC loss)。_connectionist temporal classificationhttps://blog.csdn.net/m0_64768308/article/details/136494825华为开发者论坛icon-default.png?t=N7T8https://developer.huawei.com/consumer/cn/forum/topic/0201784250928720072CTC(Connectionist Temporal Classification)介绍_connectionist temporal classification (ctc)-CSDN博客文章浏览阅读1.7k次。CTC解决什么问题CTC,Connectionist Temporal Classification,用来解决输入序列和输出序列难以一一对应的问题。举例来说,在语音识别中,我们希望音频中的音素和翻译后的字符可以一一对应,这是训练时一个很天然的想法。但是要对齐是一件很困难的事,如下图所示(图源见参考资料[1]),有人说话块,有人说话慢,每个人说话快慢不同,不可能手动地对音素和字符对齐,这样太......_connectionist temporal classification (ctc)https://blog.csdn.net/weixin_36670529/article/details/102885071        Graves A, Fernández S, Gomez F, et al. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks[C]//Proceedings of the 23rd international conference on Machine learning. 2006: 369-376.

 

关键字:ctc(Connectionist Temporal Classification) 学习

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: