Java 获取Html文本中的img标签下src中的内容方法
更新时间:2018年06月01日 08:57:43 作者:安_shuai
今天小编就为大家分享一篇Java 获取Html文本中的img标签下src中的内容方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
如下所示:
/**
* 得到网页中图片的地址
* @param sets html字符串
*/
public Set<String> getImgStr(String htmlStr) {
Set<String> pics = new HashSet<String>();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
pics.add(m.group(1));
}
}
return pics;
}
以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
Spring Boot集成Mybatis中如何显示日志的实现
这篇文章主要介绍了Spring Boot集成Mybatis中如何显示日志的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2020-07-07
java读取配置文件(properties)的时候,unicode码转utf-8方式
这篇文章主要介绍了java读取配置文件(properties)的时候,unicode码转utf-8方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2022-02-02
idea运行java项目main方法报build failure错误的解决方法
当在使用 IntelliJ IDEA 运行 Java 项目的 main 方法时遇到 "Build Failure" 错误,这通常意味着在项目的构建过程中遇到了问题,以下是一些详细的解决步骤,以及一个简单的代码示例,用于展示如何确保 Java 程序可以成功构建和运行,需要的朋友可以参考下2024-09-09
Spring两种任务调度Scheduled和Async的区别和应用场景详解
在现代应用程序中,任务调度是一个非常普遍的需求,Spring框架提供了两种主要的方式来实现任务调度:Scheduled 和 Async,在这篇文章中,我们将详细介绍这两种方式的区别和应用场景,需要的朋友可以参考下2024-12-12
浅谈缓冲字符流 BufferedReader BufferedWriter用法
这篇文章主要介绍了缓冲字符流 BufferedReader BufferedWriter的用法,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2021-07-07


最新评论