"Speaker Recognition and Segmentation"
"Speaker Recognition and Segmentation"
寻找一个代码,将媒体文件处理为"谁说了什么,什么时候说的",换句话说,是一个"说话人对说话人的分割",以及每个人的时间。失败的答案:做任何手工工作来处理媒体文件…谢谢!
您可以使用Kaldi的扬声器拨号,它不容易设置,但效果很好。
还有很多其他的库——LIUM, bob等
相关文章:
- C++核心准则 C35 对于接口类"A base class destructor should be either public and virtual, or protected and nonv
- 为什么C++逐位AND运算符在不同大小的操作数中表现为这样
- 为什么 Clang 不允许"and"作为函数名称?
- 位阵列上的快速AND运算
- 是否可以在 C++03 中定义'move-and-swap idiom'等效项
- 示例外壳应用程序显示的 V8 "segmentation fault (core dumped)"错误
- 为什么我的C++代码中出现'Segmentation Fault: 11'行?
- BoostPython and CMake
- OpenSSL BIO and SSL_read
- Gurobi GRBModel and GRBmodel in C++
- 给定一个整数数组,需要在Max_Heap上运行操作。得到错误"segmentation fault",有什么想法吗?(C++)
- 导致Segmentation错误的结构中的矢量
- std::visit and std::variant usage
- SHBrowseForFolder with BIF_BROWSEFORCOMPUTER and SHGetPathFr
- Directx12 and keystrokes
- different between int **arr =new int [ n]; and int a[i][j]?
- C++ getenv and setenv
- Inference pytorch C++ with alexnet and cv::imread image
- Getter and Segmentation Fault
- "Speaker Recognition and Segmentation"