LookaheadTaggerTsuruoka等人的词性标记算法C++实现
前瞻标记器是Tsuruoka等人提出的词性(POS)标记算法的C++实现。它允许用户使用自己的POS注释语料库进行训练。首先,编译并进入相应目录:cd lapos-XX/
,然后生成标记句子,要求每行一个句子格式。之后,运行lapos
命令进行标记:
echo '他打开了窗户。' | ./lapos -t -m ./model_wsj02-21 He/PRP 打开/VBD/DT 窗口/NN ./.
如何使用自己的注释语料库构建标记模型,请参阅自述文件。参考文献:
[1]鹤冈义政、宫尾雄介和风间纯一。2011.使用Lookahead学习:基于历史的模型能否与全局优化模型相匹敌?在CoNLL会议录,第238-246页。
下载地址
用户评论