1. 首页
  2. 编程语言
  3. Python
  4. python实现爬虫统计学校BBS男女比例之数据处理(三)

python实现爬虫统计学校BBS男女比例之数据处理(三)

上传者: 2022-04-01 12:54:55上传 PDF文件 145.50 KB 热度 9次

java里面有缓存方法可以避免频繁读取硬盘上的文件,python其实也有,可以见这篇文章。本代码为了简便,没有再把httperror的那些id分类,直接存储为下面这5个文件里可以看下输出Log记录,总共处理了多少个httperror的数据。代码简单,我们利用单线程统计一下unkownsex的用户。另外,经过我们检查,没有性别的用户也是没有活动时间的。sumCount 是统计一个多少人,boycount 、girlcount 、secretcount 分别统计男、女、保密的人数。注意,我们输出的是截止某个文件的统计信息,而不是单个文件的统计情况。我们可以对correct、errTime 、unkownsex的文本都进行处理。输出为多线程代码输出为注意python在类内部经常需要加上self,这点和java区别很大。

下载地址
用户评论