黑帽联盟

标题: shell脚本分析nginx日志访问次数最多及最耗时的页面(慢查询) [打印本页]

作者: yun    时间: 2017-2-18 13:45
标题: shell脚本分析nginx日志访问次数最多及最耗时的页面(慢查询)
当服务器压力比较大,跑起来很费力时候.我们经常做站点页面优化,会去查找那些页面访问次数比较多,而且比较费时.找到那些访问次数高,并且比较耗时的地址,就行相关优化,会取得立竿见影的效果的.下面是我在做优化时候,经常用到的一段shell 脚本.这个也可以算是,统计web页面的slowpage 慢访问页面,象mysql slowquery .

以下是我的nginx 配制:
  1. log_format  main  '$remote_addr - $remote_user [$time_local] $request '
  2.                   '"$status" $body_bytes_sent "$http_referer" '
  3.                   '"$http_user_agent" "$http_x_forwarded_for" $request_time';

  4. access_log  /var/log/nginx/access.log  main buffer=32k;
复制代码
从上面配置,可以看到:ip在 第一列,页面耗时是在最后一列,中间用空格分隔.因此在awk 中,分别可以用:$1
$NF 读取到当前值.其中NF是常量,代表整个列数.

下面是分析代码的shell文件,可以存为slow.sh
  1. #!/bin/sh

  2. export PATH=/usr/bin:/bin:/usr/local/bin:/usr/X11R6/bin;
  3. export LANG=zh_CN.GB2312;

  4. function usage()
  5. {
  6.    echo "$0 filelog  options";
  7.    exit 1;
  8. }

  9. function slowlog()
  10. {
  11. #set -x;
  12. field=$2;
  13. files=$1;
  14. end=2;
  15. msg="";

  16. [[ $2 == '1' ]] && field=1&&end=2&&msg="总访问次数统计";
  17. [[ $2 == '2' ]] && field=3&&end=4&&msg="平均访问时间统计";

  18. echo -e "\r\n\r\n";
  19. echo -n "$msg";
  20. seq -s '#' 30 | sed -e 's/[0-9]*//g';

  21. awk '{split($7,bbb,"?");arr[bbb[1]]=arr[bbb[1]]+$NF; arr2[bbb[1]]=arr2[bbb[1]]+1; } END{for ( i in arr ) { print i":"arr2[i]":"arr[i]":"arr[i]/arr2[i]}}' $1 | sort  -t: +$field -$end -rn |grep "pages" |head -30 | sed 's/:/\t/g'
  22. }

  23. [[ $# < 2 ]] && usage;

  24. slowlog $1 $2;
复制代码
只需要执行:slow.sh 日志文件  1或者2                  
1:三十条访问最平凡的页面
2:三十条访问最耗时的页面

执行结果如下:

chmod +x ./slow.sh

chmod +x slow.sh
./slow.sh /var/log/nginx/
./slow.sh /var/log/nginx/access.log 2


平均访问时间统计#############################
/pages/########1.php        4       120.456 30.114
/pages/########2.php 1       16.161  16.161
/pages/########3.php 212     1122.49 5.29475
/pages/########4.php     6       28.645  4.77417

..................
希望以上脚本对大家会有一定帮助.






欢迎光临 黑帽联盟 (https://bbs.cnblackhat.com/) Powered by Discuz! X2.5