Yelp项目 识别类别与分析主要正负面因素
Yelp项目 - 识别业务类别和查找业务的主要正面/负面项目。在本项目中,您将有机会实践信息检索和文本挖掘方法与算法,应用在Z534课程中学到的技能。此项目需要利用Yelp数据(文本数据和数字数据)来解答一些重要问题。访问并下载Yelp数据,请前往:Yelp数据集挑战。该数据集包含:
-
42,153个企业
-
320,002个企业属性
-
31,617个签到集
-
252,898个用户
-
955,999边缘社交图
-
403,210条提示
-
1,125,458条评论
其中,提示和评论为文本库,所有数据均保存在JSON文件中,便于处理和分析。
下载地址
用户评论