對(duì)于那些從事搜索引擎優(yōu)化的人來(lái)說(shuō),他們都知道網(wǎng)站日志文件的分析在整個(gè)搜索引擎優(yōu)化工作中非常重要。一些SEO用戶(hù)可能會(huì)說(shuō)“無(wú)用”??梢钥闯?,技術(shù)水平參差不齊。許多優(yōu)化器充其量只是外部鏈發(fā)布者或編輯。他們遠(yuǎn)離整個(gè)SEO帖子,甚至沒(méi)有入門(mén)級(jí),但他們認(rèn)為自己屬于SEO,更不用說(shuō)博客分析是SEO工作的基礎(chǔ),尤其是在大中型網(wǎng)站。阿里巴巴前搜索引擎優(yōu)化主管郭平曾表示,沒(méi)有博客分析的搜索引擎優(yōu)化是一個(gè)“局外人”,這很諷刺
日志分析和流量軟件分析的區(qū)別:
從SEO的角度來(lái)看,他們的觀點(diǎn)是一樣的:日志分析和流量軟件分析可以分析各種流量、訪問(wèn)頁(yè)面、關(guān)鍵字?jǐn)?shù)據(jù),等等
區(qū)別:
通用流量分析軟件不能分析搜索引擎爬蟲(chóng)數(shù)據(jù)
通用流量分析軟件不能分析錯(cuò)誤的鏈接和其他數(shù)據(jù)
以下網(wǎng)站日志分析能給SEO帶來(lái)什么
分析網(wǎng)站日志可以解決網(wǎng)站渠道收集不平衡的問(wèn)題
作者在企業(yè)做SEO工作時(shí),企業(yè)運(yùn)營(yíng)總監(jiān)(主要負(fù)責(zé)網(wǎng)站seo)將向作者咨詢(xún)網(wǎng)站未升級(jí)的原因,因此他將對(duì)網(wǎng)站進(jìn)行初步瀏覽和檢查。我不認(rèn)為我在運(yùn)營(yíng)的各個(gè)方面都有和我的同事一樣的理由。我會(huì)要求他公布搜索引擎最近幾天捕獲的網(wǎng)絡(luò)日志記錄
通過(guò)對(duì)網(wǎng)站日志數(shù)據(jù)的分析,幾分鐘內(nèi)就能找到網(wǎng)站收集問(wèn)題的根本原因。事實(shí)證明,百度蜘蛛每天80%的抓取量分布在兩個(gè)渠道下,但這兩個(gè)渠道的數(shù)據(jù)很少。與其他渠道相比,每天抓取數(shù)據(jù)量大、內(nèi)容更新頻繁的重要渠道不到10%,有的甚至抓取幾次。經(jīng)過(guò)分析,原來(lái)的百度蜘蛛在兩個(gè)渠道中都有一個(gè)“黑洞”,抓取得太多,也就是說(shuō),這是一個(gè)死循環(huán),消耗了大量資源,導(dǎo)致網(wǎng)站渠道之間的網(wǎng)頁(yè)收集不均勻,內(nèi)容大的網(wǎng)頁(yè)少之又少,由于百度蜘蛛很少抓取
定期分析網(wǎng)站日志將對(duì)網(wǎng)站優(yōu)化和排名起到突飛猛進(jìn)的作用
無(wú)論是百度還是谷歌,他們都通過(guò)編程技術(shù)模式下載網(wǎng)頁(yè),并通過(guò)多線程技術(shù)處理數(shù)億個(gè)網(wǎng)頁(yè)爬行問(wèn)題。因?yàn)槌绦驎?huì)有漏洞,沒(méi)有完美的技術(shù),網(wǎng)頁(yè)端的HTML代碼也沒(méi)有標(biāo)準(zhǔn)化,幾乎沒(méi)有一個(gè)網(wǎng)頁(yè)完全符合W3C標(biāo)準(zhǔn)。此外,網(wǎng)頁(yè)加載速度導(dǎo)致的字節(jié)下載截?cái)鄷?huì)導(dǎo)致搜索引擎過(guò)度重復(fù)抓取單個(gè)網(wǎng)頁(yè)或某些特征網(wǎng)頁(yè),從而影響網(wǎng)站的整體收集
然后,通過(guò)日志文件過(guò)濾掉前幾個(gè)URL或爬網(wǎng)次數(shù)過(guò)多的頻道的URL,并通過(guò)與實(shí)際網(wǎng)頁(yè)爬行量的比較來(lái)分析問(wèn)題
當(dāng)搜索引擎訪問(wèn)網(wǎng)頁(yè)時(shí),正常狀態(tài)代碼是200,而不是200,這是有問(wèn)題的。通過(guò)日志文件,我們可以使用網(wǎng)站日志分析工具(互聯(lián)網(wǎng)上有許多相關(guān)工具)。如果技術(shù)可用,我們可以使用它來(lái)處理日志文件,并過(guò)濾非200狀態(tài)代碼頁(yè)面的原因
還有許多其他因素,例如網(wǎng)站是否包含在內(nèi),此處未列出。通過(guò)日志分析,更重要的是解決網(wǎng)站收藏問(wèn)題,尤其是占整個(gè)SEO工作80%的大中型網(wǎng)站。網(wǎng)站收集是提高流量的基礎(chǔ)。