ICTPOS3.0汉语词性标记集
计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集:1.北大《人民日报》语料库词性标记集;2.北大2002新版词性标记集(草稿);3.清华大学汉语树库词性标记集;4.教育部语用所词性标记集(国家推荐标准草案2002版);5.美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;
下载地址
用户评论