Preliminary Study of Chinese Word Segmentation and Part of Speech Tagging Being 上传者:变黑的白翼 2021-02-09 12:03:13上传 PDF文件 393.13KB 热度 20次 本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作。 下载地址 用户评论 更多下载