1. 首页
  2. 操作系统
  3. Ubuntu
  4. 基于JAVA技术的网页内容智能抓取

基于JAVA技术的网页内容智能抓取

上传者: 2020-08-29 02:20:24上传 DOC文件 91.5KB 热度 28次
完全基于java的技术 XML解析,HTML解析,开源组件应用。应用的开源组件包括: DOM4J:解析XML文件 jericho-html-2.5:解析HTML文件 commons-httpclient:读取WEB页面内容工具 其他必须的辅助引用包括: commons-codec commons-logging jaxen
下载地址
用户评论
码姐姐匿名网友 2020-08-29 02:20:25

人云亦云型,借鉴一下

码姐姐匿名网友 2020-08-29 02:20:25

还不错,节省了很多工作量

码姐姐匿名网友 2020-08-29 02:20:25

源代码发来瞧瞧

码姐姐匿名网友 2020-08-29 02:20:25

还不错把,基本的功能实现了

码姐姐匿名网友 2020-08-29 02:20:25

希望有源码可供借鉴

码姐姐匿名网友 2020-08-29 02:20:25

这个思路错了,要通用,减少或没有配置才牛啊。

码姐姐匿名网友 2020-08-29 02:20:25

一般,毕设借鉴一下;

码姐姐匿名网友 2020-08-29 02:20:25

只是个说明,说明……我想看的是源码和例子

码姐姐匿名网友 2020-08-29 02:20:25

原理都说明了很好,可惜木有源码可供借鉴

码姐姐匿名网友 2020-08-29 02:20:25

可惜木有源码可供借鉴