asp.net保存远程图片的代码

 更新时间:2008年09月19日 23:50:49   作者:  
最近有点烦,没怎么看书,几天下来,就研究了一个保存远程图片的。
注意:并没有实现CSS中的图片采集,且图片的正则还有待完善。
复制代码 代码如下:

using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;

//引入空间
using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;
using System.Collections;

/// <summary>
/// 采集
/// </summary>
public class caiji
{
public caiji()
{
//
// TODO: 在此处添加构造函数逻辑
//
}

/// <summary>
/// 要采集的网页的连接地址
/// </summary>
/// <param name="url">url</param>
/// <returns></returns>
public static string caijiByUrl(string url,string chargest,string path)
{
string str = GetSourceTextByUrl(url,chargest);

ArrayList lib = new ArrayList();

int i = 0;
//根据url取得网站域名
Uri uri = new Uri(url);

//Scheme或者协议,一般为http,Host为取得域名
string baseurl = uri.Scheme + "://" + uri.Host + "/";

//提取出url,包括src等信息
//\S匹配任何非空白字符
Regex g = new Regex(@"(src=(""|\')\S+\.(gif|jpg|png|bmp)(""|\'))", RegexOptions.Multiline | RegexOptions.IgnoreCase);

MatchCollection m = g.Matches(str);

foreach (Match math in m)
{
//已经提取到图片的路径了,但还需要分绝对路径,相对路径,以及后缀名是否为图片,因为可能为.asp,.aspx这些,比如验证码图片
string imgUrl = math.Groups[0].Value.ToLower();//转成小写,=号之间可能有不定的空格

//去除src与单引号,双引号
imgUrl = imgUrl.Replace("src","");
imgUrl = imgUrl.Replace("\"","");
imgUrl = imgUrl.Replace("'","");
imgUrl = imgUrl.Replace("=","");
imgUrl = imgUrl.Trim();

//路径处理
if (imgUrl.Substring(0, 4) != "http")
{
//需要判断是否是绝对路径还是相对路径
if (imgUrl.Substring(0, 1) == "/")
{
imgUrl = baseurl + imgUrl;
}
else
{
imgUrl = url.Substring(0,url.LastIndexOf("/") + 1) + imgUrl;
}
}

//判断元素是否已经存在,-1为不存在
if (lib.IndexOf(imgUrl) == -1)
{
lib.Add(imgUrl);
}
}

string str_ = string.Empty;
WebClient client = new WebClient();

for (int j = 0; j < lib.Count; j++)
{
string savepath = path + DateTime.Now.Month + DateTime.Now.Day + DateTime.Now.Minute + DateTime.Now.Second + j + lib[j].ToString().Substring((lib[j].ToString().Length) -4,4);
try
{
client.DownloadFile(new Uri(lib[j].ToString()), savepath);
str_ += lib[j].ToString() + "<br /> 保存路径为:" + savepath + "<br /><br />";
}
catch (Exception e)
{
str_ += e.Message;
}

}

return str_;
}

public static string GetSourceTextByUrl(string url,string chargest)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超时
WebResponse response = request.GetResponse();

Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream,Encoding.GetEncoding(chargest));
return sr.ReadToEnd();
}
}

使用:比如我是保存到upload文件夹中的:
复制代码 代码如下:

string path = Server.MapPath("~/upload/");
Response.Write(caiji.caijiByUrl(https://www.jb51.net, "utf-8", path));

相关文章

  • 如何解决asp.net负载均衡时Session共享的问题

    如何解决asp.net负载均衡时Session共享的问题

    这篇文章主要介绍了解决asp.net负载均衡时Session共享的问题,详细的介绍了ASP.Net session存储方式以及如何实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-11-11
  • asp.net自定义控件回发数据实现方案与代码

    asp.net自定义控件回发数据实现方案与代码

    在实现asp.net的自定义控件中,若要实现数据的回发或者post数据,那自义控件必须实现IPostBackDataHandler接口, 在该接口中有两个方法一个是LoadPostData,另一个是RaisePostDataChangedEvent,需要的朋友可以了解下
    2012-12-12
  • 12306动态验证码启发之ASP.NET实现动态GIF验证码(附源码)

    12306动态验证码启发之ASP.NET实现动态GIF验证码(附源码)

    这篇文章主要介绍了受到12306动态验证码启发,实现ASP.NET动态GIF验证码,需要的朋友可以参考下
    2015-08-08
  • ASP.NET XmlHttp跨域访问实现代码

    ASP.NET XmlHttp跨域访问实现代码

    最近项目需要实现XmlHttp的POST方法到另一服务器上的页面进行数据的更新,可是IE会提出“该页正在访问其控制范围之外的信息,是否继续?”等警告信息,而在其他浏览器上直接禁止掉,GOOGLE一下原来是XmlHttp的跨域访问问题,找了很多资料,说是提供很多解决方案,可是都没有用处。
    2008-11-11
  • .NET Web开发之.NET MVC框架介绍

    .NET Web开发之.NET MVC框架介绍

    MVC是一种架构设计模式,该模式主要应用于图形化用户界面(GUI)应用程序。那么什么是MVC?MVC由三部分组成:Model(模型)、View(视图)及Controller(控制器)
    2014-03-03
  • asp.net Coolite 学习交流

    asp.net Coolite 学习交流

    近来不知什么原因,发现国人有不少开始学习Coolite了,对于有些人可能不知道什么是Coolite,这里先简单介绍一下
    2009-05-05
  • ASP.NET中后台注册js脚本使用的方法对比

    ASP.NET中后台注册js脚本使用的方法对比

    接下来为大家介绍下使用Page.ClientScript.RegisterClientScriptBlock 和Page.ClientScript.RegisterStartupScript:区别
    2013-04-04
  • IdentityServer4实现.Net Core API接口权限认证(快速入门)

    IdentityServer4实现.Net Core API接口权限认证(快速入门)

    这篇文章主要介绍了IdentityServer4实现.Net Core API接口权限认证,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • .NET读取Excel文件的三种方法的区别

    .NET读取Excel文件的三种方法的区别

    最近研究了如何使得ASP.NET读取Excel文件更加高效呢,现总结如下:
    2013-03-03
  • .NET垃圾回收器原理及使用

    .NET垃圾回收器原理及使用

    这篇文章介绍了.NET垃圾回收器原理及使用方法,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-01-01

最新评论