Java中用爬虫进行解析的实例方法

 更新时间:2020年12月24日 08:32:41   作者:小妮浅浅  
在本篇文章里小编给大家整理的是一篇关于Java中用爬虫进行解析的实例方法,有需要的朋友们可以学习参考下。

我们都知道可以用爬虫来找寻一些想要的数据,除了可以使用python进行操作,我们最近学习的java同样也支持爬虫的运行,本篇小编就教大家用java爬虫来进行网页的解析,具体内容请往下看:

1、springboot项目,引入jsoup

<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.10.2</version>
</dependency>

2、准备解析对象

Content.java
package com.asia.pojo;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
@Data
@NoArgsConstructor
@AllArgsConstructor
public class Content {
 private String title;
 private String img;
 private String price;
}

3、爬虫工具类

HtmlParseUtil.java
package com.asia.utils;
import java.net.URL;
import java.net.URLDecoder;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import com.asia.pojo.Content;
public class HtmlParseUtil {
public static void main(String[] args) throws Exception {
new HtmlParseUtil().parseJD("西瓜").forEach(System.out::println);
}
public List<Content> parseJD(String keywords) throws Exception {
String url = "https://search.jd.com/Search?keyword=" + URLDecoder.decode(keywords, "GBK");
// 解析网页.(Jsoup返回Document就是浏览器的Document对象)
Document document = Jsoup.parse((new URL(url)), 30000);
Element element = document.getElementById("J_goodsList");
Elements elements = element.getElementsByTag("li");
List<Content> list = new ArrayList<Content>();
for (Element el : elements) {
String src = el.getElementsByTag("img").eq(0).attr("data-lazy-img");
String price = el.getElementsByClass("p-price").eq(0).text();
String name = el.getElementsByClass("p-name").eq(0).text();
list.add(new Content(name, src, price));
}
return list;
}
}

到此这篇关于Java中用爬虫进行解析的实例方法的文章就介绍到这了,更多相关Java中如何使用爬虫进行解析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • java Map转Object与Object转Map实现代码

    java Map转Object与Object转Map实现代码

    这篇文章主要介绍了 java Map转Object与Object转Map实现代码的相关资料,需要的朋友可以参考下
    2017-02-02
  • Java的分支结构与循环你知道多少

    Java的分支结构与循环你知道多少

    这篇文章主要为大家详细介绍了Java的分支结构与循环,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-02-02
  • Java8在遍历集合时删除元素问题解决

    Java8在遍历集合时删除元素问题解决

    本文主要介绍了Java8在遍历集合时删除元素问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • 如何使用JavaMail发送邮件

    如何使用JavaMail发送邮件

    这篇文章主要教大家如何使用JavaMail发送邮件在web应用中,实现用户注册成功之后,将用户的注册信息以Email的形式发送到用户的注册邮箱当中,感兴趣的小伙伴们可以参考一下
    2015-12-12
  • Java并发底层实现原理学习心得

    Java并发底层实现原理学习心得

    本片文章是学习Java并发底层实现原理的一篇知识心得,对大家学习这个方便的知识很有帮助,一起参考下。
    2018-01-01
  • Java MD5加密工具类的方法(支持多参数输入)

    Java MD5加密工具类的方法(支持多参数输入)

    在实际开发过程中,MD5加密是一种常见的数据安全处理手段,常用于密码存储、数据完整性校验等场景,这篇文章主要介绍了Java MD5加密工具类(支持多参数输入),需要的朋友可以参考下
    2024-05-05
  • 使用java编程从0到1实现一个简单计算器

    使用java编程从0到1实现一个简单计算器

    这篇文章主要介绍了使用java编程从0到1实现一个简单计算器,文章中用代码实例讲解的很清晰,有感兴趣的同学可以学习研究下
    2021-02-02
  • SpringBoot中使用EasyExcel并行导出多个excel文件并压缩zip后下载的代码详解

    SpringBoot中使用EasyExcel并行导出多个excel文件并压缩zip后下载的代码详解

    SpringBoot的同步导出方式中,服务器会阻塞直到Excel文件生成完毕,在处理大量数据的导出功能,本文给大家介绍了SpringBoot中使用EasyExcel并行导出多个excel文件并压缩zip后下载,需要的朋友可以参考下
    2024-09-09
  • java中List去除重复数据的5种方式总结

    java中List去除重复数据的5种方式总结

    这篇文章主要给大家总结介绍了关于java中List去除重复数据的5种方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • JAVA设计模式之建造者模式原理与用法详解

    JAVA设计模式之建造者模式原理与用法详解

    这篇文章主要介绍了JAVA设计模式之建造者模式,简单说明了建造者模式的原理、组成,并结合实例形式分析了java建造者模式的定义与用法,需要的朋友可以参考下
    2017-08-08

最新评论