Diablo 推文中的释义检测 佐治亚理工学院人工智能课程项目
暗黑破坏神该项目适用于乔治亚理工学院的CS 6601人工智能。该项目是对推文进行释义,即找出两条推文在给定推文的含义上是否相似。我们实现了一种滑动窗口方法,我们通过神经语言模型学习词嵌入向量,对其进行归一化,然后运行动态池化以获得相同大小的相似矩阵。然后我们将其展平并添加其他特征,如句子长度、占位符词频(标点符号、数字)和通用命名实体术语,以获得最终的特征向量。我们将其传递给Logistic回归分类器并训练它从我们的训练集中识别相似和不相似的句子。我们达到了63.8%的af测量分数。关于如何运行的说明:要运行非规范化:将run.sh中的第2行和第3行改为input.txt sh run.sh python simMat.py python分类Tweets.py运行规范化:检查normalizedInput.txt是否存在。
下载地址
用户评论