阅读训练数据失败:tagger.cpp (393) crf++
faliure in reading training data: tagger.cpp (393) CRF++
当我在训练数据(train.txt)上运行crf++时,我得到了以下错误
C:Users2012DesktopCRF_Software_PackageCRF++-0.58>crf_learn template train.d
ata model
CRF++: Yet Another CRF Tool Kit
Copyright (C) 2005-2013 Taku Kudo, All rights reserved.
reading training data: tagger.cpp(393) [feature_index_->buildFeatures(this)]
0.00 s
我的训练数据包含Unicode字符,数据保存使用记事本(编码= Unicode大印度)
我不确定是模板问题还是训练数据的格式问题。如何查看训练数据的格式?
我认为这是因为你的模板文件。请检查您是否将最后一栏作为gold-standard training feature加入列索引从0开始。例如,如果您的BIO文件中有6列。模板中不应该有%x[0,5]
问题是模板文件检查你的功能是否有错误的"语法"即U10: % x (1,0)/% (0,0)
你意识到在第二个%之后有一个缺失的'x'修改后的线应该如下所示U10: x % x (1,0)/% (0,0)
我有同样的问题,文件是UTF-8,模板文件和培训文件肯定是正确的格式。原因是CRFPP期望输入文件中最多有1024列。如果它能在这种情况下输出一个适当的错误消息,那就太好了。
问题不在Unicode编码,而在模板文件。
看看这个类似的问题:使用CRF+0.58 train NE Model失败
相关文章:
- .cpp和.h文件中的模板专用化声明
- 为什么两个不同的未命名名称空间可以共存于一个cpp文件中
- Linux的Cpp上的计时器
- 如何运行位于boost/libs/python/example/tutorial目录中的hello.cpp和Jamfil
- 命名空间中具有.h和.cpp文件的类
- 内置函数可查看CPP中的成员变量
- 无法编译 rtmidi 测试 cmidiin.cpp 文件, 非法指令
- Cpp-Tuple使用带有变量的get
- C++-试图将函数指针推回到另一个CPP文件中的矢量时出错
- 有充分的理由在h文件中使用include保护而不是cpp文件吗
- 如何通过cpp程序运行shell脚本
- 使用2个键的cpp-stl::优先级队列排序不正确
- cpp二进制搜索问题,计算给定数组中输入元素的出现次数
- 如何在cpp文件之间切换窗口?在Qt中
- 在 .h 文件中的类中声明静态变量和在.cpp文件中声明"global"变量有什么区别
- 我需要知道编译器如何在cpp中使用析构函数
- 如何在cpp.中使用协议缓冲区存储大缓冲区/数组(char/int)
- 无法在UE4中包含BP类到CPP类
- C++:Application.cpp中抛出了未解析的外部符号(解决方案在问题的末尾,供未来的读者参考)
- 阅读训练数据失败:tagger.cpp (393) crf++