java 抓取网页内容实现代码

 更新时间:2014年02月28日 16:00:45   作者:  
这篇文章主要介绍了java 抓取网页内容实现代码,需要的朋友可以参考下

复制代码 代码如下:

package test;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.net.Authenticator;

import java.net.HttpURLConnection;

import java.net.PasswordAuthentication;

import java.net.URL;

import java.net.URLConnection;

import java.util.Properties;

 

public class URLTest {

 // 一个public方法,返回字符串,错误则返回"error open url"

 public static String getContent(String strUrl) {

  try {

   URL url = new URL(strUrl);

   BufferedReader br = new BufferedReader(new InputStreamReader(url

     .openStream()));

   String s = "";

   StringBuffer sb = new StringBuffer("");

   while ((s = br.readLine()) != null) {

    sb.append(s + "/r/n");

   }

   br.close();

   return sb.toString();

  } catch (Exception e) {

   return "error open url:" + strUrl;

  }

 }

 

 public static void initProxy(String host, int port, final String username,

   final String password) {

  Authenticator.setDefault(new Authenticator() {

   protected PasswordAuthentication getPasswordAuthentication() {

    return new PasswordAuthentication(username,

      new String(password).toCharArray());

   }

  });

  System.setProperty("http.proxyType", "4");

  System.setProperty("http.proxyPort", Integer.toString(port));

  System.setProperty("http.proxyHost", host);

  System.setProperty("http.proxySet", "true");

 }

 

 public static void main(String[] args) throws IOException {

   String url = "https://www.jb51.net";

   String proxy = "http://192.168.22.81";

   int port = 80;

   String username = "username";

   String password = "password";

   String curLine = "";

   String content = "";

   URL server = new URL(url);

   initProxy(proxy, port, username, password);

   HttpURLConnection connection = (HttpURLConnection) server

   .openConnection();

   connection.connect();

   InputStream is = connection.getInputStream();

   BufferedReader reader = new BufferedReader(new

   InputStreamReader(is));

   while ((curLine = reader.readLine()) != null) {

   content = content + curLine+ "/r/n";

   }

   System.out.println("content= " + content);

   is.close();

   System.out.println(getContent(url));

 }

}       

相关文章

  • Jmeter生成UUID作为唯一标识符过程图解

    Jmeter生成UUID作为唯一标识符过程图解

    这篇文章主要介绍了Jmeter生成UUID作为唯一标识符过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • @FeignClient 实现简便http请求封装方式

    @FeignClient 实现简便http请求封装方式

    这篇文章主要介绍了@FeignClient 实现简便http请求封装方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-03-03
  • SpringBoot集成MQ的过程(四种交换机的实例)

    SpringBoot集成MQ的过程(四种交换机的实例)

    本文介绍了RabbitMQ中四种交换机(直连、扇出、主题和头交换机)的使用方法,包括路由机制、典型场景和实现步骤,通过创建SpringBoot项目并配置交换机、队列和消费者,展示了如何发送和接收消息,每种交换机的示例代码和测试步骤也一并提供,感兴趣的朋友一起看看吧
    2025-03-03
  • 深入理解spring如何管理事务

    深入理解spring如何管理事务

    文章详细介绍了Spring框架中的事务管理机制,包括事务的基本概念、事务管理的两种方式、Spring事务管理的整体架构、事务配置、声明式事务的实现原理、事务的关键流程、事务属性与配置,以及实际开发中常见的事务问题和解决方案,感兴趣的朋友一起看看吧
    2025-01-01
  • java中把汉字转换成简拼的实现代码

    java中把汉字转换成简拼的实现代码

    本篇文章是对在java中把汉字转换成简拼的实现方法进行了详细的分析介绍,需要的朋友参考下
    2013-05-05
  • SpringCloud maven-assembly-plugin 多级目录打包的实现

    SpringCloud maven-assembly-plugin 多级目录打包的实现

    本文主要介绍了SpringCloud maven-assembly-plugin 多级目录打包的实现,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-10-10
  • Spring MVC访问静态文件_动力节点Java学院整理

    Spring MVC访问静态文件_动力节点Java学院整理

    这篇文章主要为大家详细介绍了Spring MVC访问静态文件的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-08-08
  • Java String不可变性实现原理解析

    Java String不可变性实现原理解析

    这篇文章主要介绍了Java String不可变性实现原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • Java的Shiro框架认证流程详解

    Java的Shiro框架认证流程详解

    这篇文章主要介绍了Java的Shiro框架认证流程详解,Shiro 是一个功能强大和易于使用的安全框架,为开发人员提供一个直观而全面的解决方案的认证,授权,加密,会话管理四大功能,需要的朋友可以参考下
    2024-01-01
  • Java高并发测试框架JCStress详解

    Java高并发测试框架JCStress详解

    这篇文章主要介绍了Java高并发测试框架JCStress,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04

最新评论