乐观 发表于 2015-2-3 23:56:36

PHP教程之经由过程PHP法式统计蜘蛛是不是会见你的网站

熟悉了PHP和MYSQL开发的要领之后,再回头看你写的那个留言本,你也许会怀疑那真的是你写的吗?当然,如果屋里还有鬼的话,也许是它写的-_-法式|会见|统计|蜘蛛     搜刮引擎的蜘蛛会见网站是经由过程近程抓取页面来停止的,咱们不克不及利用JS代码来获得蜘蛛的Agent信息,然而咱们可以经由过程image标签,如许咱们就能够失掉蜘蛛的agent材料了,经由过程对agent材料的剖析,就能够肯定蜘蛛的品种、性别等要素,咱们在经由过程数据库或文原本纪录就能够停止统计了。
  数据库布局:
#
# 表的布局 `naps_stats_bot`
#

CREATE TABLE `naps_stats_bot` (
`botid` int(10) unsigned NOT NULL auto_increment,
`botname` varchar(100) NOT NULL default '',
`botagent` varchar(200) NOT NULL default '',
`bottag` varchar(100) NOT NULL default '',
`botcount` int(11) NOT NULL default '0',
`botlast` datetime NOT NULL default '0000-00-00 00:00:00',
`botlasturl` varchar(250) NOT NULL default '',
UNIQUE KEY `botid` (`botid`),
KEY `botname` (`botname`)
) TYPE=MyISAM AUTO_INCREMENT=9 ;

#
# 导出表中的数据 `naps_stats_bot`
#

INSERT INTO `naps_stats_bot` VALUES (1, 'Googlebot', 'Googlebot/2.X (+http://www.谷歌bot.com/bot.html)', '谷歌bot', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (2, 'MSNbot', 'MSNBOT/0.1 (http://search.msn.com/msnbot.htm)', 'msnbot', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (3, 'Inktomi Slurp', 'Slurp/2.0', 'slurp', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (4, 'Baiduspider', 'Baiduspider+(+http://www.百度.com/search/spider.htm)', '百度spider', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (5, 'Yahoobot', 'Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)', 'slurp', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (6, 'Sohubot', 'sohu-search', 'sohu-search', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (7, 'Lycos', 'Lycos/x.x', 'lycos', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (8, 'Robozilla', 'Robozilla/1.0', 'robozilla', 0, '0000-00-00 00:00:00', '');
  PHP法式:
/***************************************************************************
* NAPS -- Network Article Publish System
* ----------------------------------------------
*                                 bot.php
*                            -------------------
*   begin                : 2004-08-15
*   copyright            : (C) 2004 week9
*   email                : wapshow@gmail.com
*   homepage             : http://www.week9.com
*                        http://www.wapshow.com
*
***************************************************************************/

/***************************************************************************
*
*   This program is free software; you can redistribute it and/or modify
*   it under the terms of the GNU General Public License as published by
*   the Free Software Foundation; either version 2 of the License.
*
***************************************************************************/

/***************************************************************************
*
*   NAPS产物是自在软件。你可以且必需依据《GNU GPL-GNU通用公共允许证》的相干划定
*   复制、修正及分发NAPS产物。任何故NAPS产物为基本的衍生刊行版未必需经由飘飘的受权。
*
***************************************************************************/

error_reporting(E_ALL & ~E_NOTICE);

function get_naps_bot()
{
      $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
                        
      if (strpos($useragent, '谷歌bot') !== false){
                return 'Googlebot';
      }
      
      if (strpos($useragent, 'msnbot') !== false){
                return 'MSNbot';
      }
      
      if (strpos($useragent, 'slurp') !== false){
                return 'Yahoobot';
      }
      
      if (strpos($useragent, '百度spider') !== false){
                return 'Baiduspider';
      }
      
      if (strpos($useragent, 'sohu-search') !== false){
                return 'Sohubot';
      }
      
      if (strpos($useragent, 'lycos') !== false){
                return 'Lycos';
      }
      
      if (strpos($useragent, 'robozilla') !== false){
                return 'Robozilla';
      }      
      return false;
}

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
//添加蜘蛛的抓取纪录
$searchbot = get_naps_bot();
if ($searchbot) {
      $DB_naps->query("UPDATE naps_stats_bot SET botcount=botcount+1, botlast=NOW(), botlasturl='$tlc_thispage' WHERE botname='$searchbot'");
}

?>
熟悉了PHP和MYSQL开发的要领之后,再回头看你写的那个留言本,你也许会怀疑那真的是你写的吗?当然,如果屋里还有鬼的话,也许是它写的-_-

admin 发表于 2015-2-4 07:06:16

装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。

分手快乐 发表于 2015-2-5 12:15:36

如果你已经到这种程度了,那么你已经可以做我的老师了。其实php也分很多的区域,

精灵巫婆 发表于 2015-2-11 00:02:26

我还是推荐用firefox ,配上firebug 插件调试js能省下不受时间。谷歌的浏览器最好也不少用,因为谷歌的大侠们实在是太天才啦,把一些原来的js代码加了一些特效。

飘灵儿 发表于 2015-3-1 18:13:49

有位前辈曾经跟我说过,phper 至少要掌握200个函数 编起程序来才能顺畅点,那些不熟悉的函数记不住也要一拿手册就能找到。所以建议新手们没事就看看php的手册(至少array函数和string函数是要记牢的)。

简单生活 发表于 2015-3-10 21:41:38

说php的话,首先得提一下数组,开始的时候我是最烦数组的,总是被弄的晕头转向,不过后来呢,我觉得数组里php里最强大的存储方法,所以建议新手们要学好数组。

冷月葬花魂 发表于 2015-3-16 07:35:50

当留言板完成的时候,下步可以把做1个单人的blog程序,做为目标,

若天明 发表于 2015-3-17 02:09:24

如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了,

灵魂腐蚀 发表于 2015-3-18 22:01:20

首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。

小女巫 发表于 2015-3-24 19:54:04

对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。

柔情似水 发表于 2015-4-6 01:09:39

作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。

金色的骷髅 发表于 2015-4-10 23:30:34

写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。

爱飞 发表于 2015-4-11 03:08:53

个人呢觉得,配wamp 最容易漏的一步就是忘了把$PHP$目录下的libmysql.dll拷贝到windows系统目录的system32目录下,还有重启apache。

深爱那片海 发表于 2015-4-15 04:11:31

这些都是最基本最常用功能,我们这些菜鸟在系统学习后,可以先对这些功能深入研究。

蒙在股里 发表于 2015-4-16 02:14:53

有位前辈曾经跟我说过,phper 至少要掌握200个函数 编起程序来才能顺畅点,那些不熟悉的函数记不住也要一拿手册就能找到。所以建议新手们没事就看看php的手册(至少array函数和string函数是要记牢的)。

只想知道 发表于 2015-5-3 11:04:24

首先声明:我是一个菜鸟,是一个初学者。学习了一段php后总是感觉自己没有提高,无奈。经过反思我认为我学习过程中存在很多问题,我改变了学习方法后自我感觉有了明显的进步。

谁可相欹 发表于 2015-6-16 20:31:22

学好程序语言,多些才是王道,写两个小时代码的作用绝对超过看一天书,这个我是深有体会(顺便还能练打字速度)。

莫相离 发表于 2015-6-22 23:19:51

开发工具也会慢慢的更专业,每个公司的可能不一样,但是zend studio是个大伙都会用的。

变相怪杰 发表于 2015-7-4 02:21:40

做为1门年轻的语言,php一直很努力。

兰色精灵 发表于 2015-7-14 22:28:15

多看优秀程序员编写的代码,仔细理解他们解决问题的方法,对自身有很大的帮助。
页: [1] 2
查看完整版本: PHP教程之经由过程PHP法式统计蜘蛛是不是会见你的网站