Crawl Google Results使用Jsoup进行Google搜索结果抓取
使用 Jsoup Java 库的 Google 搜索爬虫程序,这个程序能够抓取和解析 HTML。它为您提供以下内容:
标题: 斯坦福 NLP(自然语言处理)小组
地点: nlp.stanford.edu/
摘要: 斯坦福自然语言处理和计算语言学组。
标题: 自然语言处理 - Google 研究
地点: research.google.com/pubs/NaturalLanguageProcessing.html
摘要: 大多数 NLP 应用程序,如信息提取、机器翻译、情感分析和问答,都需要.... 2014年自然语言处理经验方法会议(EMNLP '14)的论文集。
标题: 自然语言处理博客
步骤:
-
克隆这个 repo。
-
在构建路径中添加 jar 文件。
-
在源文件中,将“自然语言处理”替换为您的搜索查询,将“10”替换为您想要的结果数。
-
运行程序。
下载地址
用户评论