Java正则表达式使用

 更新时间:2015年09月23日 10:41:16   投稿:mrr  
本篇文章主要给大家介绍java在正则表达式的使用,本篇文章给大家主要介绍应用点在抓取网页中的email地址和代码统计,感兴趣的朋友一起看看吧

一:抓取网页中的Email地址

利用正则表达式匹配网页中的文本

复制代码 代码如下:

[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+

将网页内容分割提取

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class EmailSpider {
  public static void main(String[] args) {
    try {
      BufferedReader br = new BufferedReader(new FileReader("C:\\emailSpider.html"));
      String line = "";
      while((line=br.readLine()) != null) {
        parse(line);
      }
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
  private static void parse(String line) {
    Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
    Matcher m = p.matcher(line);
    while(m.find()) {
      System.out.println(m.group());
    }
  }
}

打印结果:

867124664@qq.com
260678675@QQ.com
806208721@qq.com
hr_1985@163.com
32575987@qq.com
qingchen0501@126.com
yingyihanxin@foxmail.com
1170382650@qq.com
1170382650@qq.com
yingyihanxin@foxmail.com
qingchen0501@126.com
32575987@qq.com
hr_1985@163.com

现在你找到这么多邮箱地址,用上JavaMail的知识,你可以群发垃圾邮件了,呵呵!!!

二:代码统计

import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
public class CodeCounter {
  static long normalLines = 0;//正常代码行
  static long commentLines = 0;//注释行
  static long whiteLines = 0;//空白行
  public static void main(String[] args) {
    //找到某个文件夹,该文件夹下面在没有文件夹,这里没有写递归处理不在同一文件夹的文件
    File f = new File("E:\\Workspaces\\eclipse\\Application\\JavaMailTest\\src\\com\\java\\mail");
    File[] codeFiles = f.listFiles();
    for(File child : codeFiles){
      //只统计java文件
      if(child.getName().matches(".*\\.java$")) {
        parse(child);
      }
    }
    System.out.println("normalLines:" + normalLines);
    System.out.println("commentLines:" + commentLines);
    System.out.println("whiteLines:" + whiteLines);
  }
  private static void parse(File f) {
    BufferedReader br = null;
    //表示是否为注释开始
    boolean comment = false;
    try {
      br = new BufferedReader(new FileReader(f));
      String line = "";
      while((line = br.readLine()) != null) {
        //去掉注释符/*前面可能出现的空白
        line = line.trim();
        //空行 因为readLine()将字符串取出来时,已经去掉了换行符\n
        //所以不是"^[\\s&&[^\\n]]*\\n$"
        if(line.matches("^[\\s&&[^\\n]]*$")) {
          whiteLines ++;
        } else if (line.startsWith("/*") && !line.endsWith("*/")) {
          //统计多行/*****/
          commentLines ++;
          comment = true;  
        } else if (line.startsWith("/*") && line.endsWith("*/")) {
          //统计一行/**/
          commentLines ++;
        } else if (true == comment) {
          //统计*/
          commentLines ++;
          if(line.endsWith("*/")) {
            comment = false;
          }
        } else if (line.startsWith("//")) {
          commentLines ++;
        } else {
          normalLines ++;
        }
      }
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } finally {
      if(br != null) {
        try {
          br.close();
          br = null;
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
    }
  }
}

以上内容就是本文给大家分享的Java在正则表达式的使用,希望大家喜欢。

相关文章

  • 正值表达式匹配html标签的属性值

    正值表达式匹配html标签的属性值

    正则表达式是做文本解析工作必不可少的技能。今天通过本文给大家介绍正值表达式匹配html标签的属性值,需要的朋友一起学习吧
    2016-02-02
  • JavaScript正则表达式下之相关方法

    JavaScript正则表达式下之相关方法

    这篇文章主要介绍了JavaScript正则表达式下之相关方法 的相关资料,需要的朋友可以参考下
    2016-05-05
  • java 正则表达式基础,实例学习资料收集大全

    java 正则表达式基础,实例学习资料收集大全

    本站长期收集的java正则表达式学习资料,包括javascript,vbscript,asp,php,asp.net等正则表达式学习资料
    2007-12-12
  • 一文秒懂python正则表达式常用函数

    一文秒懂python正则表达式常用函数

    这篇文章主要介绍了python正则表达式常用函数及使用方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • PHP正则表达式完全教程之提高篇

    PHP正则表达式完全教程之提高篇

    正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如javascript,java,.net,php等等,我今天就把我对正则表达式的理解跟大家唠唠,不当之处,请多多指教!
    2015-09-09
  • 一文教会你用正则表达式校验日期时间格式

    一文教会你用正则表达式校验日期时间格式

    日期的格式多种多样,有如:"yyyy-MM-dd HH:mm:ss"、"yyyy/MM/dd HH:mm:ss"、"yyyyMMdd HH:mm:ss"等,当然也有的只记录到天,下面这篇文章主要给大家介绍了关于用正则表达式校验日期时间格式的相关资料,需要的朋友可以参考下
    2022-10-10
  • 正则表达式之字符串模式匹配实例详解

    正则表达式之字符串模式匹配实例详解

    正则表达式就是一种强大而灵活的文本处理工具,正则可以很好的解决这类字符串校验问题,下面这篇文章主要给大家介绍了关于正则表达式之字符串模式匹配的相关资料,需要的朋友可以参考下
    2022-04-04
  • 表单正则验证及文件上传验证功能

    表单正则验证及文件上传验证功能

    表单正则验证主要是用来对表单提交信息的过滤,防止sql注入(比如登录界面),上传的文件也需要进行文件名后缀和大小进行验证,下面是一个简单的表单验证实例代码,需要的的朋友参考下吧
    2017-07-07
  • 详解正则表达式Matcher类中group方法

    详解正则表达式Matcher类中group方法

    这篇文章主要介绍了正则表达式Matcher类中group方法,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • 正则表达式实现最小匹配功能的方法

    正则表达式实现最小匹配功能的方法

    这篇文章主要介绍了正则表达式实现最小匹配功能的方法,结合具体实例形式分析了正则表达式最小匹配功能的原理与实现技巧,需要的朋友可以参考下
    2017-02-02

最新评论