PythonHTMLSimilarity使用结构和样式度量标准比较html相似度
这个包提供了一组函数来度量网页之间的相似度
下载地址
用户评论