java代码抓取网页邮箱的实现方法

 更新时间:2016年06月01日 09:23:09   投稿:jingxian  
下面小编就为大家带来一篇java代码抓取网页邮箱的实现方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

实现思路:

1、使用java.net.URL对象,绑定网络上某一个网页的地址

2、通过java.net.URL对象的openConnection()方法获得一个HttpConnection对象

3、通过HttpConnection对象的getInputStream()方法获得该网络文件的输入流对象InputStream

4、循环读取流中的每一行数据,并由Pattern对象编译的正则表达式区配每一行字符,取得email地址

package cn.sdhzzl;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
//和网络相关的操作
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {
public static void main(String[] args) throws IOException {
//1.1 创建一个url对象
URL url = new URL("https://www.jb51.net/group/topic/8845032/"); 
//1.2 打开连接 
URLConnection conn = url.openConnection(); 
//1.3 设置连接网络超时时间 单位为毫秒
conn.setConnectTimeout(1000 * 10); 
//1.4 通过流 操作读取指定网络地址中的文件 
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream())); 
String line = null; 
//1.5 匹配email的正则
String regex = "[a-zA-Z0-9_-]+@\\w+\\.[a-z]+(\\.[a-z]+)?";
//1.6 使用模式的compile()方法生成模式对象
Pattern p = Pattern.compile(regex); 
//1. 
while((line = bufr.readLine()) != null) { 
Matcher m = p.matcher(line); 
while(m.find()) { 
System.out.println(m.group());// 获得匹配的email 
} 
} 
}
}

以上这篇java代码抓取网页邮箱的实现方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Java基础篇之对象数组练习

    Java基础篇之对象数组练习

    对象数组就是数组里的每个元素都是类的对象,赋值时先定义对象,然后将对象直接赋给数组就行了,这篇文章主要给大家介绍了关于Java基础篇之对象数组练习的相关资料,需要的朋友可以参考下
    2024-03-03
  • spring boot linux启动方式详解

    spring boot linux启动方式详解

    这篇文章主要介绍了spring boot linux启动方式详解,分为为前台启动,后台启动和脚本启动的各种方式讲解,需要的朋友可以参考下
    2017-11-11
  • Spring @Async 的使用与实现的示例代码

    Spring @Async 的使用与实现的示例代码

    本篇文章主要介绍了Spring @Async 的使用与实现的示例代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-08-08
  • 利用Java手写一个简易的lombok的示例代码

    利用Java手写一个简易的lombok的示例代码

    Lombok是一款Java开发插件,使得Java开发者可以通过其定义的一系列注解来消除业务工程中冗长和繁琐的代码,尤其对于简单的Java模型对象。本文就来手写一个简易的lombok,需要的可以参考一下
    2022-10-10
  • Mybatis各种查询接口使用详解

    Mybatis各种查询接口使用详解

    这篇文章主要介绍了Mybatis各种查询接口使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
    2022-11-11
  • java基于servlet实现文件上传功能解析

    java基于servlet实现文件上传功能解析

    这篇文章主要为大家详细介绍了java基于servlet实现上传功能,后台使用java实现,前端主要是js的ajax实现,感兴趣的小伙伴们可以参考一下
    2016-05-05
  • RocketMQ 延时级别配置方式

    RocketMQ 延时级别配置方式

    这篇文章主要介绍了RocketMQ 延时级别配置方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-07-07
  • Java8中的LocalDateTime你会使用了吗

    Java8中的LocalDateTime你会使用了吗

    LocalDateTime 是 Java 8 中日期时间 API 提供的一个类,在日期和时间的表示上提供了更加丰富和灵活的支持,本文就来讲讲LocalDateTime的一些具体使用方法吧
    2023-05-05
  • 关闭支付宝小额免密支付步骤详解

    关闭支付宝小额免密支付步骤详解

    支付宝现在作为我们日常生活中最常用的应用之一,已经成为了人们的虚拟钱包。但是最近,有人发现了支付宝的一个漏洞,本文将对如何关闭小额免密支付进行步骤介绍。下面跟着小编一起来看下吧
    2017-01-01
  • 浅析Spring的事务实现原理

    浅析Spring的事务实现原理

    这篇文章主要为大家详细介绍了Spring中事务实现的原理,文中的示例代码讲解详细,对我们学习Spring有一定的帮助,需要的可以参考一下
    2022-11-11

最新评论