作為一個(gè)站長(zhǎng),如果你甚至不知道網(wǎng)站日志是什么,或者根本不喜歡它,我只能說(shuō)你是一個(gè)不稱職的站長(zhǎng)。一旦網(wǎng)站出了問(wèn)題,你一定很無(wú)助!即使你掌握了SEO的基本知識(shí),你也應(yīng)該善于分析網(wǎng)站日志
許多SEO新手站長(zhǎng)可能會(huì)認(rèn)為不分析網(wǎng)站日志沒(méi)關(guān)系。我相信每個(gè)人都在自己的網(wǎng)站上安裝了網(wǎng)站統(tǒng)計(jì)代碼,比如GoogleAnalytics、quantumstatistics、baidustatistics、cnzz、51La等。這些工具可以計(jì)算網(wǎng)站的流量,但這些統(tǒng)計(jì)工具無(wú)法計(jì)算你主機(jī)上資源的原始訪問(wèn)信息,比如誰(shuí)下載了圖片,而且無(wú)法統(tǒng)計(jì)沒(méi)有添加統(tǒng)計(jì)代碼的地方,例如后臺(tái)操作頁(yè)面
絕大多數(shù)收費(fèi)主機(jī)提供原始訪問(wèn)日志。網(wǎng)站服務(wù)器將自動(dòng)記錄每個(gè)訪問(wèn)者的訪問(wèn)信息,并將其保存在原始訪問(wèn)日志文件中。如果您的主機(jī)不提供日志功能,建議您在到期后更換主機(jī)。日志記錄了網(wǎng)站上所有資源的訪問(wèn)信息,包括所有網(wǎng)頁(yè)打開(kāi)過(guò)程中加載的圖像、CSS、JS、flash、HTML、MP3等資源。同時(shí),它記錄了誰(shuí)訪問(wèn)了這些資源,訪問(wèn)了哪些資源,訪問(wèn)結(jié)果是什么。可以說(shuō),原始訪問(wèn)日志記錄了主機(jī)所有資源的使用情況
分析網(wǎng)站日志的作用是什么
1。我們可以更準(zhǔn)確地定位搜索引擎爬行器爬行我們網(wǎng)站的次數(shù),并屏蔽偽爬行器(主要收集此類爬行器,這將增加我們服務(wù)器的開(kāi)銷)
2。通過(guò)分析網(wǎng)站日志,我們可以準(zhǔn)確定位搜索引擎蜘蛛抓取的頁(yè)面和時(shí)間長(zhǎng)度。我們可以依次調(diào)整我們的網(wǎng)站
3。HTTP返回狀態(tài)代碼。搜索引擎蜘蛛和用戶每次訪問(wèn)我們的網(wǎng)站時(shí)會(huì)有類似于301404200的狀態(tài)嗎?我們可以參考這些信息來(lái)簡(jiǎn)單地診斷我們的網(wǎng)站存在的問(wèn)題,并及時(shí)處理問(wèn)題
如何分析網(wǎng)站日志中的內(nèi)容
注意經(jīng)常訪問(wèn)的資源
如果您發(fā)現(xiàn)日志中經(jīng)常訪問(wèn)資源(網(wǎng)頁(yè)、圖片、MP3等),您應(yīng)該注意資源的使用位置!如果這些請(qǐng)求(referer)的來(lái)源不是您的網(wǎng)站或是空的,并且狀態(tài)代碼(httpcode)是200,這意味著您的資源可能會(huì)被盜。通過(guò)referer,你可以找到盜賊的網(wǎng)站,這可能是你網(wǎng)站流量激增的原因。你應(yīng)該做好防盜鏈
2、注意你網(wǎng)站上不存在的資源請(qǐng)求
如果一些請(qǐng)求的信息不是本網(wǎng)站的資源,httpcode是403或404,但從名稱分析來(lái)看,可能是保存數(shù)據(jù)庫(kù)信息的文件。如果這些信息被其他人拿走,攻擊你的網(wǎng)站就會(huì)容易得多。啟動(dòng)這些請(qǐng)求的目的無(wú)非是掃描你的網(wǎng)站,尋找漏洞。通過(guò)無(wú)目的地掃描和下載這些已知的漏洞文件,您很可能會(huì)在您的網(wǎng)站中發(fā)現(xiàn)漏洞!通過(guò)觀察,我們可以發(fā)現(xiàn)這些請(qǐng)求中使用的代理幾乎都是非傳統(tǒng)瀏覽器類型,如Mozilla/4.0、Mozilla/5.0或libwwwPerl/。我在上面提供的日志格式化工具集成了這些請(qǐng)求的警報(bào)功能。我們可以通過(guò)禁止這些代理的訪問(wèn)來(lái)防止他們被掃描。具體方法如下所述
觀察搜索引擎蜘蛛的訪問(wèn)
通過(guò)觀察日志中的信息,你可以看到你的網(wǎng)站被蜘蛛訪問(wèn)的頻率,然后你可以看到你的網(wǎng)站是否受到搜索引擎的青睞。這些都是SEO關(guān)注的問(wèn)題。日志格式化工具集成了搜索引擎蜘蛛的提示功能。常見(jiàn)搜索引擎蜘蛛使用的代理列表如下:
谷歌蜘蛛:Mozilla/5.0(兼容;Googlebot/2.1)+http://www.google.com/bot.html)
百度蜘蛛:百度蜘蛛+(+http://www.baidu.com/search/spider.htm)
雅虎!Spider:Mozilla/5.0(兼容;Yahoo!Slurp/3.0;http://help.yahoo.com/help/us/ysearch/slurp)
雅虎!中國(guó)蜘蛛:Mozilla/5.0(兼容;雅虎中國(guó);http://misc.yahoo.com.cn/help.html)
微軟必應(yīng)蜘蛛:MSNBot/2.0B(+http://search.msn.com/msnbot.htm)
谷歌Adsensespider:mediapartners谷歌
有道spider:Mozilla/5.0(兼容;有道機(jī)器人/1.0);http://www.youdao.com/help/webmaster/spider/)
Soso博客蜘蛛:sosoblogspider+(+http://help.soso.com/soso-blog-spider.htm)
搜狗網(wǎng)蜘蛛:搜狗網(wǎng)蜘蛛/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Twiceler爬蟲(chóng):Mozilla/5.0(Twiceler-0.9)http://www.cuil.com/twiceler/robot.html)
谷歌圖像搜索蜘蛛:谷歌機(jī)器人圖像/1.0
俄羅斯yandex搜索引擎蜘蛛:yandex/1.01.001(兼容;win16;I)
Alexa蜘蛛:IA_archiver(+http://www.alexa.com/site/help/webmasters)
Feedsky蜘蛛:Mozilla50(兼容;Feedskycrawler/1.0)
韓國(guó)雪人蜘蛛:雪人/1.0(nhncorp;http://help.naver.com/robots/)
觀察訪客行為
通過(guò)查看格式化日志,可以查看和跟蹤某個(gè)IP在一定時(shí)間段內(nèi)的一系列訪問(wèn)行為。單個(gè)IP的訪問(wèn)記錄越多,網(wǎng)站的PV越高,用戶粘性越好;如果單個(gè)IP的訪問(wèn)記錄很少,你應(yīng)該考慮如何使你的網(wǎng)站內(nèi)容更具吸引力。通過(guò)分析訪問(wèn)者的行為,你可以為你的網(wǎng)站建設(shè)提供有力的參考,哪些內(nèi)容好,哪些內(nèi)容壞,并確定網(wǎng)站的發(fā)展方向;通過(guò)分析訪問(wèn)者的行為,看看他們做了什么,我們可以猜測(cè)訪問(wèn)者的意圖,及時(shí)發(fā)現(xiàn)惡意用戶
總結(jié):另一點(diǎn)要介紹的是,當(dāng)網(wǎng)站遇到搜索引擎的K下降時(shí),網(wǎng)站日志可以向我們提供K下降的原因(我認(rèn)為這是站群的朋友),通過(guò)網(wǎng)站日志的相關(guān)數(shù)據(jù),我們可以看到搜索引擎何時(shí)會(huì)恢復(fù)正常訪問(wèn)。這樣,我們可以選擇繼續(xù)或放棄。雖然它非常無(wú)助,但它也是最后的手段和明智的選擇。