使用CDN之后APACHE日志记录中IP地址不正确的解决方案

 更新时间:2014年12月23日 10:22:29   投稿:hebedich  
这篇文章主要介绍了使用CDN之后APACHE日志记录中IP地址不正确的解决方案,需要的朋友可以参考下

最近在搞APACHE日志分析,装好了awstats之后,这两天进行了观察,

报表日期 月 1 月 2010
首次参观日期 2010年01月12日 11:04
最近参观日期 2010年01月13日 23:59
    参观者 参观人次 网页数 文件数 字节
浏览器流量 * 77  226  (2.93 参观人次/参观者) 508979 (2252.11 网页数/参观) 509492 (2254.38 文件数/参观) 13.67 G字节 (63430.28 K字节/参观)
非浏览器流量 *  117312 122716 736.24 M字节

这边的结果很让人费解,通过google统计网站的独立IP访问量有2W做,这里显示的数字相差甚远。  后面的网页数和文件数又都与实际相吻合。  经过查找原因发现 apache日志里记录的IP地址不正确,大部分都是cdn的节点地址。 产生的原因很显然是因为CDN造成的,之前在网站后台程序里读取用户IP地址也出现了类似问题。 可以使用print_r($_SERVER)  (PHP语言),查找到真实的用户IP地址,本站为 $_SERVER[‘HTTP_CDN-SRC-IP'].  这个是CDN携带的真实的客户IP地址(这里不计较用户是否使用代理)。 但在APACHE的日志记录里如何使用这个值呢?  本人在GOOGLE和百度里查找了许久都没有找到相应的资料或者说解决方案,只好自己思考寻求了。
仔细看了下APACHE里日志记录的相关配置,针对LogFormat:
LogFormat "%h %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combined
我思索里面的%{Referer}和%{User-Agent} 是如何取得的, 这两个是在程序里也是经常会用到的东西,客户端发送请求的时候 这两个信息都是作为头详细发送到服务器的。后来查看了下访问时的所有头信息,如下:

复制代码 代码如下:

Array
(
    [Cdn-Src-Ip] => 222.44.46.58
    [Accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
    [Accept-Language] => zh-cn
    [User-Agent] => Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727)
    [Host] => www.875.cn
    [Cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5; __utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedShopsID=621; viewedShopsPP=%u6B27%u5C1A%u574A
    [Accept-Encoding] => gzip
    [Via] => 1.1 hnay40:80 (Cdn Cache Server V2.0)
    [Connection] => keep-alive
)

当然rerfer的时候也会有rerfer信息出现在头部信息里,上面也有Cookie、Host、User-Agent等信息,这些信息都是可以在apache配置文件里可以使用的变量,当然这里Cdn-Src-Ip正是我想要的客户的真实IP地址。 于是推测${Cdn-Src-Ip}在日志记录格式里应该也是可以使用的。 后面的i应该是指忽略大小写的意思。于是得出一个解决方案:

添加一个新的logformat信息

复制代码 代码如下:

LogFormat "%{Cdn-Src-Ip}i %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combinedcdn

在需要记录的网站配置里增加:

复制代码 代码如下:

CustomLog "|/usr/local/sbin/cronolog /usr/local/apache/logs/www.875.cn-access_log.%Y%m%d" combinedcdn env=!IMAGES

重启apache服务,然后访问网站,查看日志记录发现现在可以正常记录客户IP地址了。

相关文章

  • Linux date命令知识点总结

    Linux date命令知识点总结

    在本篇文章里小编给大家分享的是关于Linux date命令详细说明,有兴趣的朋友们跟着学习下。
    2020-02-02
  • 有效学习Linux系统的4个方法

    有效学习Linux系统的4个方法

    这篇文章主要为大家详细介绍了有效学习Linux系统的4个方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • 使Apache实现gzip压缩配置

    使Apache实现gzip压缩配置

    Apache默认的http.conf配置文件中没有开启gzip压缩,apache1.3.x可以用mod_gzip进行优化网页浏览的速度,在apache2中也尝试用mod_gzip,但是配置后确发现网页不能正确显示(空白页),所以改换为mod_deflate
    2014-08-08
  • linux服务器上使用nginx访问本地静态资源的方法

    linux服务器上使用nginx访问本地静态资源的方法

    这篇文章主要介绍了linux服务器上如何使用nginx访问本地静态资源,本文给出了解决方法,需要的朋友可以参考下
    2019-12-12
  • linux wget下载tomcat方式

    linux wget下载tomcat方式

    这篇文章主要介绍了linux wget下载tomcat方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01
  • Ubuntu部署python3.5的开发和运行环境

    Ubuntu部署python3.5的开发和运行环境

    这篇文章主要介绍了Ubuntu部署python3.5的开发和运行环境,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。
    2017-01-01
  • ubuntu (linux)修改网卡名称命令

    ubuntu (linux)修改网卡名称命令

    这篇文章主要介绍了ubuntu (linux)修改网卡名称命令的相关资料,这里提供了实现的命令代码,需要的朋友可以参考下
    2016-11-11
  • crontab执行时间与系统时间不一致问题解决

    crontab执行时间与系统时间不一致问题解决

    这篇文章主要给大家介绍了关于crontab执行时间与系统时间不一致问题的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-01-01
  • Apache服务器中使用.htaccess实现伪静态URL的方法

    Apache服务器中使用.htaccess实现伪静态URL的方法

    这篇文章主要介绍了Apache服务器中使用.htaccess实现伪静态URL的方法,示例结合PHP脚本,需要的朋友可以参考下
    2015-07-07
  • 本地与linux互传文件的方式详解

    本地与linux互传文件的方式详解

    实现本地与Linux服务器文件互传的常用方式:scp命令、sftp命令、lrzsz程序,xftp软件,下面就跟随小编一起来学习一下如何具体操作的吧
    2023-08-08

最新评论