一、什么是网站日志? 网站日志,主要用于记录用户和搜索引擎蜘蛛对网站的访问行为。网站日志中,包括客户端访问时间、访问来源、来源IP、客户端请求方式、请求端口、访问路径及参数、Http状态码状态、返回字节大小等信息。 二、网站日志有哪几种? 由于服务器平台比较多,每使用不同的服务器记录的日志格式也不相同。经常使用的WEB服务器环境有以下几种,将逐一的进行解析说明。 1、Nginx服务器 linux虚拟主机的Nginx0.8服务器环境 2、Apache服务器 Linux虚拟主机的Apache服务器环境 3、IIS服务器 WIN虚拟主机的IIS6服务器环境 日志文件的名称格式是:ex+年份的末两位数字+月份+日期。 ( 如2002年8月10日的WWW日志文件是ex020810.log ) IIS的日志文件都是文本文件,可以使用任何编辑器或相关软件打开,例如记事本程序,AWStats工具。 开头四行都是日志的说明信息 #Software 生成软件 #Version 版本 #Date 日志发生日期 #Fields 字段,显示记录信息的格式,可由IIS自定义。 日志的主体是一条一条的请求信息,请求信息的格式是由#Fields定义的,每个字段都有空格隔开。 字段解释 data 日期 time 时间 cs-method 请求方法 cs-uri-stem 请求文件 cs-uri-query 请求参数 cs-username 客户端用户名 c-ip 客户端IP cs-version 客户端协议版本 cs(User-Agent) 客户端浏览器 cs(Referer) 引用页 4、其它主机空间日志 下面列举说明日志文件的部分内容(每个日志文件都有如下的头4行): #Software: Microsoft Internet Information Services 6.0 #Version: 1.0 #Date: 2007-09-21 02:38:17 #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status 2007-09-21 01:10:51 10.152.8.17 – 10.152.8.2 80 GET /seek/images/ip.gif – 200 Mozilla/5.0+(X11;+U;+Linux+2.4.2-2+i686;+en-US;+0.7) 三、如何分析日志! 因为日志文件是网站SEO数据分析的重要部分,因此,我们要明白通过日志分析,可以知道蜘蛛什么时候来过,看了哪些文件。访客都来看过什么文件,哪些页面打开的资料多,等等。 日志分析,我们可以借助工具,可以通过EXCEL表格等方案来理清日志文件进行分析。下面介绍一下EXCEL表格分析日志文件的方法。 下载文件文件,一般名字为:日期.log。 下载之后将后缀名改成txt. 打开一个excel,点击:数据-自文本-选择文件-分隔符号-只选空格-下一步-完成。这时就把日志文件成功导入到EXCEL表格中了。这时我们可以通过EXCEL文件自带的筛选功能来筛选不同的条件进行查询,筛选功能在:数据-筛选 的位置。 通过对网站返回码,抓取路径,来访用户,传输字节,可以分析网站的安全,蜘蛛来访时间,用户来访路径,访问文件等信息来分析网站。
|