在线笔记 favinavi - 人性化网络收藏夹

网站的页面访问量以及搜索引擎爬虫访问量的统计方法

分类标签：全部 CSS html javascript php/other IT

by: fanshome 2023-05-23 15:54(UTC)

统计页面访问量的方法有无数种，这里介绍我的“低级”方法：

1、当然是先用数据库建立一张访问统计表，每个需要统计的页面单独需要建一个字段，比如首页就用“index”。

2、区分是否是移动终端访问，这个其实是有难度的，不可能100%精确统计，我们就退而求其次，大概能统计到位就行，采用正则判断User Agent的方法：

$MOBILE=preg_match("/(android|mobi|phone)/i",$_SERVER['HTTP_USER_AGENT'])?true:false;

这个方法肯定不够精确，只能说大致够用，包含了"android"、"MOBI”、"mobile"、"phone"、"iphone”等关键字，基本OK吧。

3、定义需要统计的页面，用一个数组：

$botsArr=array(//常用搜索引擎爬虫识别

["baidu" ,"Baiduspider"],//百度爬虫

["google","Googlebot"],//谷歌爬虫

["bing" ,"bing"],//微软bing爬虫

["360" ,"360Spider"],//360搜索so.som爬虫

["sogou" ,"sogou"],//搜狗搜索爬虫

["yandex","yandex"],//yandex爬虫

["junkBot","(MJ12bot|AhrefsBot)"],//垃圾蜘蛛爬虫

["otherBot" ,"(bot|spider)"]//其它明确标志自己的爬虫

);

其中，每个数组下标0代表爬虫名字，下标1代表爬虫的USER_AGENT必须包含的关键字，基本做到了简单并且够用。

for($i=0;$i<count($botsArr);$i++){

if(preg_match("/".$botsArr[$i][1]."/i",$_SERVER['HTTP_USER_AGENT'])){

$isBot=true;//是个爬虫

//执行sql，数据库插入统计记录；

...

$i++;

break;

}

再定义一个数组，包含所有需要统计的页面文件名称：

$statItem=array("文件名1","文件名2",...);

if(in_array($filename,$statItem)){

//执行SQL语句

//数据库插入统计记录

}

5569

favinavi - 重度网络用户必备在线笔记

网站开发测试环境启用https，使用自签发ssl证书不是个好主意
如题，即使你折腾了一圈把自签发证书安装好了，最后一步还是会遇到浏览器不认证书的问题（比如最新版的chrome），即便你已经添加了“信任此根证书颁发机构”。带着“...
更全面匹配UTF-8中文汉字的正则表达式
网上搜索得到的匹配汉字的正则表达式有一部分并不全面，只匹配了Unicode字符集中\u4E00-\u9FA5范围，并不包含\uF900-\uFA2D这些后期添加...
几种CSS字体描边和阴影效果
基本方法： 1、-weblit-text-strok：字体描边，非标准方法，浏览器兼容性存在一些问题。好处是这种方法不扩展字体本身，属于在字体内部描出边界，所以...
CSS实现倾斜绶带式45°标签
有时候页面需要在某个元素上设置一个醒目的标志，比如“审核中”、“热卖中”、“HOT”等等，此时本样式比较合适。先上图看最终效果。 [img]
我的酱香之路
一、男人喜欢喝点酒，是一件很正常的事。我其实并不太懂酒，也不算是酒鬼，平时在自己家里基本不喝酒。现在，假如可以选择，那么我只喝酱香酒。咱们中国人，一般来说...
你的网站会有不请自来的访客吗？
做网站，做SEO，就是希望别人来访问，最欢迎的当然是真实用户，其次是各大搜索引擎的蜘蛛。但是，假如你是个站长，你真的了解都有谁来造访你的网站吗？有不请自来的吗？...