从此不再惧怕URI编码 JavaScript及C# URI编码详解

 更新时间:2012年03月07日 07:50:26   作者:  
JavaScript中的还好,只提供了三个,C#中主要用的就有这么多,还没有列出其他编码(HTML),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在JavaScript及C#中如何对URI进行编码的方法(注:本文不涉及到其他编码)。
混乱的URI编码
  JavaScript中编码有三种方法:escape、encodeURI、encodeURIComponent

  C#中编码主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString

  JavaScript中的还好,只提供了三个,C#中主要用的就有这么多,还没有列出其他编码(HTML),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在JavaScript及C#中如何对URI进行编码的方法(注:本文不涉及到其他编码)。

escape:不推荐使用
  原因:eacape是BOM中的方法,只能对ASCII符号正确编码,而encodeURI、encodeURIComponent可以对所有的Unicode符号编码。ECMAScript v3 反对使用该方法,应用使用 decodeURI() 和 decodeURIComponent() 替代它。

  escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI:用于对网址编码(不包含参数)
  encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

  encodeURI就是为这个而设计的。encodeURI不对URI中的特殊字符进行编码,如冒号(:)、斜杠(/)。下面看个示例:
复制代码 代码如下:

encodeURI("https://www.jb51.net/a file with spaces.html")
// outputs https://www.jb51.net/a%20file%20with%20spaces.html

可以看到仅仅把空格替换成了20%,所以此方法可用于对网址进行编码。

  由于encodeURI不对冒号(:)、斜杠(/)进行编码,所以如果参数(如把网址作为参数)中包含冒号(:)、斜杠(/),就会解析出错,所以此方法不能对参数进行编码。

encodeURIComponent:用于对网址参数进行编码
  encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z

  可以看到此方法对:/都进行了编码,所以不能用它来对网址进行编码。由于此方法对中文,空格,井号(#),斜线(/),冒号(:)都进行了编码,所以适合对URI中的参数进行编码。看下面的示例:
复制代码 代码如下:

var param="博客园";
var url="https://www.jb51.net/?key="+encodeURIComponent(param)+"&page=1";
console.log(url);//outputs https://www.jb51.net/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1

可以看到,这正是我们想要的结果(这里只对需要编码的参数(page=1不需要编码)进行了编码)。

Server.UrlEncode && HttpUtility.UrlEncode:不推荐
  把这两个放到一起说是因为这两个方法在绝大多数情况下是一样的。它们的区别是HttpUtility.UrlEncode默认使用UTF8格式编码,而Server.UrlEncode是使用系统预设格式编码,Server.UrlEncode使用系統预设编码做为参数调用HttpUtility.UrlEncode编码,所以如果系统全局都用UTF8格式编码,这两个方法就是一样的。

  这两个方法是怎么编码的呢,我们来看个示例:
复制代码 代码如下:

string url1 = "https://www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
Response.Write(HttpUtility.UrlEncode(url1) );

//output
http%3a%2f%2fwww.jb51.net%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc

由上面的例子我们可以看出,HttpUtility.UrlEncode对冒号(:)和斜杠(/)进行了编码,所以不能用来对网址进行编码。

  那么能不能对参数进行编码呢,答案也是否定的。因为在参数中空格应该被编码为%20而不是被HttpUtility.UrlEncode编码为加号(+),所以不推荐用这两个方法对URI进行编码。

Uri.EscapeUriString:用于对网址编码(不包含参数)
  我们还是用例子说话:
复制代码 代码如下:

string url1 = "https://www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
Response.Write( Uri.EscapeUriString(url1));
//outputs:
https://www.jb51.net/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc

可以看出,Uri.EscapeUriString对空格进行了编码,也对中文进行了编码,但对冒号(:)、斜杠(/)和井号(#)未编码,所以此方法可以用于网址进行编码,但不能对参数进行编码,作用类似JavaScript中的encodeURI方法。

Uri.EscapeDataString:用于对网址参数进行编码
  仍然用例子说话:
复制代码 代码如下:

string url1 = "https://www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
Response.Write(Uri.EscapeDataString(url1));
//outputs:
http%3A%2F%2Fwww.jb51.net%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc

可以看出,Uri.EscapeDataString对冒号(:)、斜杠(/)、空格、中文、井号(#)都进行了编码,所以此方法不可以用于网址进行编码,但可以用于对参数进行编码,作用类似JavaScript中的encodeURIComponent方法。

小结
  在JavaScript中推荐的做法是用encodeURI对URI的网址部分编码,用encodeURIComponent对URI中传递的参数进行编码。

  在C#中推荐的做法是用Uri.EscapeUriString对URI的网址部分编码,用Uri.EscapeDataString对URI中传递的参数进行编码。

  解码部分就不说了,与编码方法相对应。
作者:天行健,自强不息

出处:http://artwl.cnblogs.com

相关文章

  • Chrome浏览器断点调试技巧(非常详细!)

    Chrome浏览器断点调试技巧(非常详细!)

    在我们日常开发中,常常利用chrome强大的控制台Sources下面进行代码断点调试,这篇文章主要给大家介绍了关于Chrome浏览器断点调试技巧的相关资料,需要的朋友可以参考下
    2023-09-09
  • 在IDEA中配置SFTP远程Linux服务器系统的实现

    在IDEA中配置SFTP远程Linux服务器系统的实现

    本文主要介绍了在IDEA中配置SFTP远程Linux服务器系统的实现,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-12-12
  • 详解Google Protobuf简明教程

    详解Google Protobuf简明教程

    这篇文章主要介绍了详解Google Protobuf简明教程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • git在idea中的冲突解决方法(非常重要)

    git在idea中的冲突解决方法(非常重要)

    这篇文章主要介绍了git在idea中的冲突解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • .gitignore文件作用及使用方法详解

    .gitignore文件作用及使用方法详解

    这篇文章主要为大家介绍了.gitignore文件作用及使用方法详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • Git清除缓存常用的四个命令

    Git清除缓存常用的四个命令

    Git是一种常用的版本控制工具,被广泛用于项目开发中,下面这篇文章主要给大家介绍了关于Git清除缓存常用的四个命令,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-03-03
  • git分支(branch)操作相关命令及分支命令的使用

    git分支(branch)操作相关命令及分支命令的使用

    这篇文章主要介绍了git分支(branch)操作相关命令及分支命令的使用的相关资料,需要的朋友可以参考下
    2017-10-10
  • 网站程序员如何应对web标准

    网站程序员如何应对web标准

    网站程序员如何应对web标准...
    2007-04-04
  • Git如何恢复到之前版本

    Git如何恢复到之前版本

    这篇文章主要介绍了Git如何恢复到之前版本,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-09-09
  • 详解VSCode打开多个项目文件夹的解决方法

    详解VSCode打开多个项目文件夹的解决方法

    这篇文章主要介绍了详解VSCode打开多个项目文件夹的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04

最新评论