2009年5月23日
分析网站在服务器上的访问日志是站长的工作之一,在平时做搜索优化时,我们分析百度,谷歌等搜索引擎有没有访问自己的网站并有没有成功获取内容的一个方法就是分析网站的日志文件,这样就可以了解并找出自己的网站为什么不收录,搜索引擎爬虫程度访问网站的频率等等技术分析。那么怎样怎样看原始日志文件呢?
【举例说明】:221.201.77.63 - - [02/Jul/2006:15:30:41 +0800] “GET /seoblog/2006/04/17/user-friendly-website/HTTP/1.1″ 200 19031 “http://www.baidu.com/swd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3″ “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;SV1; Alexa Toolbar)”
【分析说明】221.201.77.63 是IP[02/Jul/2006:15:30:41 +0800] 前面是日期,0800是时区;“GET 是服务器的动作,不是GET就是POSP;GET是从服务器上获取内容;/seoblog/2006/04/17/user-friendly-website/ HTTP/1.1″ 使用HTML1.1协议获取相关内容200 是返回状态码,200是成功获取;404是文件没找到;401是需要密码,403禁止查看,500服务器错误。19031 是文件大小“http://www.baidu.com/swd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3″表示来路“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)” 表示的是用户所使用的电脑是与Netscape兼容的Mozilla浏览器,Windows NT操作系统,浏览器是IE6.0,装有Alexa Toolbar。
【网站日志文件存在哪?关于网站虚拟主机FTP几个文件夹说明】
虚拟主机开通成功之后,会在您的FTP里面自动生成4个文件夹,分别是:"databases","logofiles","others","wwwroot",他们作用如下:
1、wwwroot文件夹:该文件夹内存放可以通过web访问的文件,您需要将您对外发布的网站文件上传到该目录下,输入域名访问到的文件将是该文件夹下的文件。
2、databases文件夹:该文件夹同logofiles、others文件夹一样,属于不可通过web访问的文件夹,即用户无法通过输入网址来访问这些文件夹下的文件,您可以在这些文件夹下上传一些不希望别人能够访问的文件。比如您可以将access数据库存放在databases文件夹下,这样可以最大化的保证您的数据库安全。
3、logofiles文件夹:logofiles文件夹是日志文件,该文件夹存放您的网站日志文件。通过日志文件您可以查询到网站的一些访问记录。
4、others文件夹:该站点存放您自定义的IIS错误文件。IIS默认的一些错误提示,比如404错误,403错误,500错误等等,如果您觉得这些错误提示不够个性化,您可以将您自定义的错误提示上传到该目录下。
三种流行DDOS攻击和DDOS攻击抵御 (2008-8-15 23:38:19)
DDOS攻击的原理和黑客组织DDOS攻击的过程 (2008-8-15 23:15:55)
ChinaCache的CDN技术优势 (2008-7-23 22:31:17)
新浪网易百度等各大门户网站的CDN架构设计分析 (2008-7-23 22:27:35)
CDN网络架构技术 (2008-7-23 22:21:30)
CDN网站加速器的工作原理和应用范围 (2008-7-23 22:18:51)
2008是CDN的丰收年 (2008-7-23 22:16:39)
什么是CDN?CDN是做什么的? (2008-7-23 22:13:4)
网站保姆是什么一回事? (2008-6-26 18:45:33)
四川汶川大地震 部分客户网站也受害其中 (2008-5-15 9:53:46)
我做了一个搜索引擎蜘蛛访问日志查看器。
有时间也可以看看
http://www.hekce.cn/down/zhizhu.asp