"Speaker Recognition and Segmentation"

"Speaker Recognition and Segmentation"

本文关键字:Segmentation and Recognition Speaker      更新时间:2023-10-16

寻找一个代码,将媒体文件处理为"谁说了什么,什么时候说的",换句话说,是一个"说话人对说话人的分割",以及每个人的时间。失败的答案:做任何手工工作来处理媒体文件…谢谢!

您可以使用Kaldi的扬声器拨号,它不容易设置,但效果很好。

还有很多其他的库——LIUM, bob等