"Speaker Recognition and Segmentation"

本文关键字：Segmentation and Recognition Speaker 更新时间：2023-10-16

寻找一个代码，将媒体文件处理为"谁说了什么，什么时候说的"，换句话说，是一个"说话人对说话人的分割"，以及每个人的时间。失败的答案:做任何手工工作来处理媒体文件…谢谢!

您可以使用Kaldi的扬声器拨号，它不容易设置，但效果很好。

还有很多其他的库——LIUM, bob等