Online notes favinavi - online bookmark

网站的页面访问量以及搜索引擎爬虫访问量的统计方法

by: fanshome 2023-05-23 15:54(UTC)

统计页面访问量的方法有无数种，这里介绍我的“低级”方法：

1、当然是先用数据库建立一张访问统计表，每个需要统计的页面单独需要建一个字段，比如首页就用“index”。

2、区分是否是移动终端访问，这个其实是有难度的，不可能100%精确统计，我们就退而求其次，大概能统计到位就行，采用正则判断User Agent的方法：

$MOBILE=preg_match("/(android|mobi|phone)/i",$_SERVER['HTTP_USER_AGENT'])?true:false;

这个方法肯定不够精确，只能说大致够用，包含了"android"、"MOBI”、"mobile"、"phone"、"iphone”等关键字，基本OK吧。

3、定义需要统计的页面，用一个数组：

$botsArr=array(//常用搜索引擎爬虫识别

["baidu" ,"Baiduspider"],//百度爬虫

["google","Googlebot"],//谷歌爬虫

["bing" ,"bing"],//微软bing爬虫

["360" ,"360Spider"],//360搜索so.som爬虫

["sogou" ,"sogou"],//搜狗搜索爬虫

["yandex","yandex"],//yandex爬虫

["junkBot","(MJ12bot|AhrefsBot)"],//垃圾蜘蛛爬虫

["otherBot" ,"(bot|spider)"]//其它明确标志自己的爬虫

);

其中，每个数组下标0代表爬虫名字，下标1代表爬虫的USER_AGENT必须包含的关键字，基本做到了简单并且够用。

for($i=0;$i<count($botsArr);$i++){

if(preg_match("/".$botsArr[$i][1]."/i",$_SERVER['HTTP_USER_AGENT'])){

$isBot=true;//是个爬虫

//执行sql，数据库插入统计记录；

...

$i++;

break;

}

再定义一个数组，包含所有需要统计的页面文件名称：

$statItem=array("文件名1","文件名2",...);

if(in_array($filename,$statItem)){

//执行SQL语句

//数据库插入统计记录

}

5627

我的酱香之路
一、男人喜欢喝点酒，是一件很正常的事。我其实并不太懂酒，也不算是酒鬼，平时在自己家里基本不喝酒。现在，假如可以选择，那么我只喝酱香酒。咱们中国人，一般来说...
一个纯CSS的最小干扰的渐变色彩虹loading bar
Loading图标，又称“加载中”图标，以往是用gif格式动图来实现。但是gif有一个比较明显的问题，不易调整大小，然后图片一般比较粗糙，颗粒感严重。现在流...
发现一只有趣的蜘蛛——“BSbot”
最近发现有一个有趣的蜘蛛来访，它的User Agent是这么写的： BSbot 1.1 (monthly copyright check - html/js/...
使用基于Cookie-Free域名加载CSS时，解决字体文件无法加载的问题
当使用基于Cookie-Free域名加载CSS时，字体文件无法加载的问题通常是因为浏览器政策所导致的。这个问题与字体文件资源和浏览器的同源策略有关。在Web...
把favinavi网络收藏夹的书签搜索功能做到最好
在此先感谢“changanluan”用户的建议，是他（她）提出了这个问题，favinavi怎么还没有书签搜索功能呢？是啊，我不属于那种要收藏几千个书签的收藏...
CSS3特效“喜欢/Like”动态按钮，一颗会跳动的心脏
纯css+svg实现，鼠标移上去心脏会有节律地跳动，适合用来做点赞按钮参考，或者学习css动画技巧。