第一,log是什么格式
如下所示的ex120807.log就是一個日志文件。擴展名為.log格式即為日志文件( it外包 )。
第二,網(wǎng)站日志文件在哪
通常一個網(wǎng)站日志文件在空間管理后臺的logofiles文件夾下面( 電腦維護(hù) )。每天系統(tǒng)會自動生成一個LOG日志文件。
網(wǎng)站日志文件是安全的,只有站長自己登陸空間管理后臺才能看見LOG日志文件。每天生成一個日志文件,一個日志文件里面往往記錄了網(wǎng)站下所有的記錄,包括用戶與蜘蛛的訪問信息,如:訪問頁面、IP信息、返回狀態(tài)等等等。所以,網(wǎng)站日志文件對于我們站長進(jìn)行網(wǎng)站分析與優(yōu)化有一定價值。
第三,log日志分析和查看
明白了log是什么格式,也知道了網(wǎng)站日志文件在哪,站長們接下來可以將網(wǎng)站日志文件下載到電腦里面打開進(jìn)行分析。
通常打開一個網(wǎng)站日志文件,可以看到下面這樣的一段代碼。一個網(wǎng)站日志文件,根據(jù)網(wǎng)站訪問和爬行記錄,由N段這樣的代碼組成,每一段代碼表示一條記錄。
接下來,筆者以這樣一段代碼來介紹如何進(jìn)行l(wèi)og日志分析。
2012-08-07 04:08:46 GET /images/index5_22.gif - - 113.4.225.46 HTTP/1.1 Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE) http://www.ittribalwo.com/show.asp?id=968 200 360
1. 2012-08-07 04:08:46:是用戶訪問時間。
2. GET:服務(wù)器的處理動作,包括GET和POST。網(wǎng)站日志中絕大部分都是GET,只有在進(jìn)行CGI處理的時候才會出現(xiàn)POST。GET,就是用戶從服務(wù)器上獲取了頁面或者別的文件。
3. GET后面“/…”:是用戶訪問的頁面,只有一個斜杠表示網(wǎng)站首頁。
4. 113.4.225.46:用戶IP地址。通過用戶IP,可以查詢到用戶來自哪個國家、省份、城市。
5. HTTP/1.1:用戶訪問該頁面是通過HTTP1.1協(xié)議進(jìn)行傳輸?shù)模?服務(wù)器維護(hù) ),也就是超文本傳輸1.1版本協(xié)議。
6. Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE:表示用戶所使用的電腦是Mozilla瀏覽器,Windows NT操作系統(tǒng)等等。
7. http://www.ittribalwo.com/show.asp?id=968 200 360:這是代碼中最重要的信息。前面自然是用戶訪問自己網(wǎng)站的某一個頁面, 后面的200,表示用戶訪問頁面的時候返回的狀態(tài)碼。200后面的360代表的是被訪問頁面的體積。
常見的狀態(tài)碼有:200,301,302,404,500等。
200:表示服務(wù)器成功地接受了客戶端請求。這是最佳的,表示網(wǎng)站頁面正常。
301:表示用戶所訪問的某個頁面已經(jīng)做了301重定向(永久性)處理( 辦公設(shè)備維護(hù) )。
302:則是暫時性重定向。如果網(wǎng)站日志分析發(fā)現(xiàn)有過多的302,需要確認(rèn)是否將301做錯為302。如果是,趕緊修改,搜索引擎不喜歡302重定向。
404:則代表所訪問的頁面已經(jīng)不存在,或者是訪問的url根本就是錯誤的。
500:服務(wù)器的錯誤。
相關(guān)文章