定义CRF++模板文件

define CRF++ template file

本文关键字:文件 CRF++ 定义      更新时间:2023-10-16

这是我的问题,但它没有说明如何正确定义模板文件。

我的培训文件如下:

上   B-NR
海   L-NR
浦   B-NR
东   L-NR
开   B-NN
发   L-NN
与   U-CC
法   B-NN
制   L-NN
建   B-NN
...

CRF++非常易于使用。网站上的说明解释得很清楚。

http://crfpp.googlecode.com/svn/trunk/doc/index.html

假设我们提取直线的特征东L-NR

Unigram

U02:%x[0,0]#表示当前行的第0列

U03:%x[1,0]#表示下一行的第0列

因此,基本特征是";第0列=开"

类似于二元图

这个问题似乎是因为没有清楚地了解CRF++是如何处理培训文件的。您的功能可能不包括最后一列中的值。这些是标签!如果你把它们包含在你的功能中,你的模型就会非常完美!定义模板文件时,因为只有两列,所以它只能包含形式为%x[n,0]的规则。它被硬编码为CRF++(尽管据我所知,没有明确记录),-4<=n<=4.