使用jsoup解析html的table中的文本信息实例

 更新时间:2018年05月21日 14:35:35   作者:chenkangyong  
今天小编就为大家分享一篇使用jsoup解析html的table中的文本信息实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

 jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。

下面就是我使用jsoup解析html的表格的java源代码。

亲测可用!

public void parse(){
	String htmlStr = "<table id=kbtable >"
			+ "<tr> "
				+ "<td width=123>"
					+ "<div id=12>这里是要获取的数据1</div>"
					+ "<div id=13>这里是要获取的数据2</div>"
				+ "</td>"
				+ "<td width=123>"
					+ "<div id=12>这里是要获取的数据3</div>"
					+ "<div id=13>这里是要获取的数据4</div>"
				+ "</td>	"
			+ "</tr>"
			+ "</table>";
	Document doc = Jsoup.parse(htmlStr);
	// 根据id获取table
	Element table = doc.getElementById("kbtable");
	// 使用选择器选择该table内所有的<tr> <tr/>
	Elements trs = table.select("tr");
	//遍历该表格内的所有的<tr> <tr/>
	for (int i = 0; i < trs.size(); ++i) {
		// 获取一个tr
		Element tr = trs.get(i);
		// 获取该行的所有td节点
		Elements tds = tr.select("td");
		// 选择某一个td节点
		for (int j = 0; j < tds.size(); ++j) {
			Element td = tds.get(j);
			// 获取td节点的所有div
			Elements divs = td.select("div");
			// 选择一个div
			for (int k = 0; k < divs.size(); k++) {
				Element div = divs.get(k);
				//获取文本信息
				String text = div.text();
				//输出到控制台
				System.out.println(text);
			}
		}
	}
}

以上这篇使用jsoup解析html的table中的文本信息实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Java Springboot之Spring家族的技术体系

    Java Springboot之Spring家族的技术体系

    今天带大家来学习Spring家族的技术体系,文中有非常详细的图文介绍及代码示例,对正在学习java的小伙伴们很有帮助,需要的朋友可以参考下
    2021-05-05
  • java通过jacob实现office在线预览功能

    java通过jacob实现office在线预览功能

    这篇文章主要为大家详细介绍了java通过jacob实现office在线预览功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Java软件设计模式之适配器模式详解

    Java软件设计模式之适配器模式详解

    这篇文章主要介绍了Java软件设计模式之适配器模式详解,适配器模式可分为对象适配器和类适配器两种,在对象适配器模式中,适配器与适配者之间是关联关系;在类适配器模式中,适配器与适配者之间是继承(或实现)关系,需要的朋友可以参考下
    2023-07-07
  • 详解java中的static关键字

    详解java中的static关键字

    这篇文章主要介绍了java中的static关键字的的相关资料,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
    2020-06-06
  • Java使用组件编写窗口实现网上文件下载

    Java使用组件编写窗口实现网上文件下载

    这篇文章主要为大家详细介绍了Java使用组件编写窗口实现网上文件下载的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-02-02
  • java获取Date时间的各种方式汇总

    java获取Date时间的各种方式汇总

    这篇文章针对java获取Date时间的各种方式汇总,有常用的时间获取方式,还有一些其他特殊时间获取方式,感兴趣的小伙伴们可以参考一下
    2015-12-12
  • Spring RestTemplate使用方法示例总结

    Spring RestTemplate使用方法示例总结

    这篇文章主要介绍了Spring RestTemplate使用方法示例总结,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧
    2025-04-04
  • java如何通过Kerberos认证方式连接hive

    java如何通过Kerberos认证方式连接hive

    该文主要介绍了如何在数据源管理功能中适配不同数据源(如MySQL、PostgreSQL和Hive),特别是如何在SpringBoot3框架下通过Kerberos认证与Hive进行安全交互,文章详细描述了Kerberos认证过程,包括配置krb5.conf和keytab文件、处理Hadoop和Hive版本兼容性问题
    2025-02-02
  • maven依赖传递和依赖冲突原理

    maven依赖传递和依赖冲突原理

    这篇文章主要介绍了maven依赖传递和依赖冲突原理详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • IDEA启动tomcat项目报错53820 socket closed问题及解决

    IDEA启动tomcat项目报错53820 socket closed问题及解决

    IDEA启动Tomcat项目时报错,原因是IDEA关闭时Tomcat未正常关闭,导致端口被占用,解决方法是通过任务管理器关闭占用高内存的Java进程,通常是IDEA进程下面的,或者使用命令行找到PID并强制终止进程
    2024-12-12

最新评论