Python朴素贝叶斯算法垃圾邮件分类
Python 写的朴素贝叶斯垃圾邮件分类,还蛮适合入门机器学习的朋友试试。代码简单清晰,数据集也一并给你准备好了,不用自己找。基本上就是拿一堆标好标签的邮件(1 是垃圾,0 是正常),统计每个词的出现概率,算新邮件是不是垃圾的性。训练方法也挺直白的,用train_naive_bayes
函数跑一遍就行,预测用predict_naive_bayes
,流程顺。
不想光看代码?你还可以下载配套的数据集,直接跑一遍看看效果,挺方便。类似的还有用Matlab
实现的,或者更全套的源码也能找到,适合想深入研究的同学。
如果你刚接触朴素贝叶斯
,想找个轻量级的项目练练手,这份资源就挺不错。建议先跑通,自己改改,比如加点文本预、换换分词工具,分类效果会更好。
下载地址
用户评论