java代码抓取网页邮箱的实现方法

 更新时间:2016年06月01日 09:23:09   投稿:jingxian  
下面小编就为大家带来一篇java代码抓取网页邮箱的实现方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

实现思路:

1、使用java.net.URL对象,绑定网络上某一个网页的地址

2、通过java.net.URL对象的openConnection()方法获得一个HttpConnection对象

3、通过HttpConnection对象的getInputStream()方法获得该网络文件的输入流对象InputStream

4、循环读取流中的每一行数据,并由Pattern对象编译的正则表达式区配每一行字符,取得email地址

package cn.sdhzzl;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
//和网络相关的操作
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {
public static void main(String[] args) throws IOException {
//1.1 创建一个url对象
URL url = new URL("https://www.jb51.net/group/topic/8845032/"); 
//1.2 打开连接 
URLConnection conn = url.openConnection(); 
//1.3 设置连接网络超时时间 单位为毫秒
conn.setConnectTimeout(1000 * 10); 
//1.4 通过流 操作读取指定网络地址中的文件 
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream())); 
String line = null; 
//1.5 匹配email的正则
String regex = "[a-zA-Z0-9_-]+@\\w+\\.[a-z]+(\\.[a-z]+)?";
//1.6 使用模式的compile()方法生成模式对象
Pattern p = Pattern.compile(regex); 
//1. 
while((line = bufr.readLine()) != null) { 
Matcher m = p.matcher(line); 
while(m.find()) { 
System.out.println(m.group());// 获得匹配的email 
} 
} 
}
}

以上这篇java代码抓取网页邮箱的实现方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • java 如何调用Python文件包括传参

    java 如何调用Python文件包括传参

    这篇文章主要介绍了java 调用Python文件包括传参的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • IDEA连接MySQL后管理数据库的操作指南

    IDEA连接MySQL后管理数据库的操作指南

    本节就来教大家如何在IDEA连接MySQL后管理数据库(创建/修改/删除数据库、创建/修改/删除表、插入/更新/删除/查询表记录),文中通过图文结合的方式给大家讲解的非常详细,需要的朋友可以参考下
    2024-05-05
  • java树形菜单对象生成

    java树形菜单对象生成

    这篇文章主要为大家详细介绍了java树形菜单对象生成,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-05-05
  • Mybatis-plus selectByMap条件查询方式

    Mybatis-plus selectByMap条件查询方式

    这篇文章主要介绍了Mybatis-plus selectByMap条件查询方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-06-06
  • 深入浅析ZooKeeper的工作原理

    深入浅析ZooKeeper的工作原理

    ZooKeeper 是一个开源的分布式协调服务,由雅虎创建,是 Google Chubby 的开源实现。接下来通过本文跟大家介绍ZooKeeper的原理,小编觉得挺不错的,感兴趣的小伙伴们可以参考一下
    2018-05-05
  • Java并发Timer源码分析

    Java并发Timer源码分析

    这篇文章讲述了java并发编程的相关知识点,并通过Timer源码分析更深入的讲解了java并发编程。
    2018-07-07
  • 带你了解Java数据结构和算法之前缀,中缀和后缀表达式

    带你了解Java数据结构和算法之前缀,中缀和后缀表达式

    这篇文章主要为大家介绍了Java的前缀,中缀和后缀表达式 ,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • Java学习之如何进行JSON解析

    Java学习之如何进行JSON解析

    JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它算是JavaScript语言的一部分,与XML一样都可以用于数据的存储和传输,本文讲给大家介绍如何进行JSON解析,需要的朋友可以参考下
    2023-12-12
  • 新手小白学JAVA 日期类Date SimpleDateFormat Calendar(入门)

    新手小白学JAVA 日期类Date SimpleDateFormat Calendar(入门)

    本文主要介绍了JAVA 日期类Date SimpleDateFormat Calendar,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-10-10
  • Spring Boot 配置MySQL数据库重连的操作方法

    Spring Boot 配置MySQL数据库重连的操作方法

    这篇文章主要介绍了Spring Boot 配置MySQL数据库重连的操作方法,需要的朋友可以参考下
    2018-04-04

最新评论