有幾個原因會影響爬行器的爬行,并最終影響頁面輸入的結果
網(wǎng)站更新狀態(tài)
一般來說,如果網(wǎng)站更新得很快,蜘蛛會更快地抓取網(wǎng)站的內容。如果網(wǎng)站內容長時間不更新,蜘蛛會相應調整網(wǎng)站的爬行頻率。更新頻率對于新聞等網(wǎng)站至關重要。因此,吸引蜘蛛每天堅持一定數(shù)量的更新是非常重要的
網(wǎng)站內容質量
對于低質量的頁面,搜索引擎總是受到影響。因此,創(chuàng)造高質量的內容并吸引蜘蛛是至關重要的。從這個角度來看,“內容取勝”是完全正確的。例如,如果網(wǎng)頁質量低,許多人收集相同的內容,而網(wǎng)頁的核心內容是空的,那么他們就無法得到蜘蛛的喜愛。網(wǎng)站是否可以正常訪問?網(wǎng)站能否正常訪問是搜索引擎的連通性問題。連接要求不應頻繁訪問網(wǎng)站。可能訪問速度很慢。從蜘蛛的角度來看,可以提供給搜索客戶的網(wǎng)頁應該是可以正常訪問的網(wǎng)頁。對于響應緩慢或經(jīng)常崩潰的服務器,相關網(wǎng)站必須具有負面形象。嚴重的是逐步減少爬行,甚至刪除已經(jīng)輸入的頁面
在實踐中,由于國內服務器的服務相對昂貴,此外,根據(jù)監(jiān)管要求,國內網(wǎng)站的建立需要有備案標準,并經(jīng)歷在線上傳備案信息的過程。一些中小型網(wǎng)站的站長可能會租用外國服務器,如GoDaddy(一家提供域名注冊和互聯(lián)網(wǎng)主機服務的美國公司)。然而,從國內訪問外國服務器的原因是它們之間的距離很長。訪問速度慢或無法防止崩潰。長期以來,這是對網(wǎng)站SEO功能的限制。如果你想謹慎運營一個網(wǎng)站,你仍然應該嘗試使用國內服務器為你服務。您可以選擇一些服務更好、界面友好的服務器供應商。當時,許多公司推出的云服務器都是不錯的選擇,此外,搜索引擎會根據(jù)網(wǎng)站的歸納和反映對網(wǎng)站進行評級。該額定值不能完全等于重量。然而,評級的不均勻將影響蜘蛛對網(wǎng)站的爬行策略
在爬行頻率方面,搜索引擎通常提供可以調整爬行頻率設置的東西,SEO人員可以根據(jù)實際情況進行調整。對于服務請求較多的大型網(wǎng)站,我們可以通過調整頻率來減輕對網(wǎng)站的壓力
在實際爬行過程中,如果遇到無法訪問的異常爬行情況,將導致網(wǎng)站搜索引擎的評級大幅下降,這將相應影響爬行等一系列SEO功能,索引、排序并最終反映流量的損失
異常爬行的原因有很多。例如,服務器不穩(wěn)定,服務器總是過載,協(xié)議可能出現(xiàn)故障。因此,要求網(wǎng)站運維人員密切關注網(wǎng)站的運行情況,確保網(wǎng)站的穩(wěn)定運行。在協(xié)議設備上,需要防止一些主要故障,如機器人的不允許設置故障。有一次,一位公司經(jīng)理咨詢SEO人員,問他們在委托外部開發(fā)人員做好網(wǎng)站后,為什么在搜索引擎中找不到它。SEO人員直接在URL和地址欄中輸入其網(wǎng)站機器人的地址,他們驚訝地發(fā)現(xiàn)蜘蛛爬行(不允許指令)在
內停止;還有其他可能無法訪問網(wǎng)站。例如,網(wǎng)絡運營商是不正常的,即蜘蛛無法通過電信或網(wǎng)通同等的勞動力供應商訪問網(wǎng)站;DNS異常,即蜘蛛無法正常解析網(wǎng)站IP。可能是地址錯誤或域名業(yè)務被阻止。在這種情況下,您需要聯(lián)系域名業(yè)務。也可能有一個死鏈的網(wǎng)頁。例如,在那個時候,頁面已經(jīng)失效或出錯。可能某些網(wǎng)頁已批量脫機。在這種情況下,最好的方法是提交死鏈解釋;如果由于URL更改而無法訪問舊URL,請設置301jump以將舊URL和相關權重轉換到新頁面。當然,搜索引擎本身可能會過載并被暫時阻止
對于已捕獲的數(shù)據(jù),下一步是為爬行器構建數(shù)據(jù)庫。在這個鏈接中,搜索引擎會根據(jù)一些標準來判斷鏈接的重要性。一般來說,判斷標準如下:內容是否原創(chuàng);如果是,將對其進行加權;主要內容是否明顯,即核心內容是否突出。如果是,將對其進行加權;內容是否豐富。如果內容非常豐富,將對其進行加權;用戶體驗是否良好,例如,頁面相對循環(huán),廣告負載較少等。如果是這樣,它將獲得權重等。因此,我們需要在網(wǎng)站的日常運營中遵守以下準則
(1)不要復制。因為通用內容受到所有搜索引擎公司的喜愛,互聯(lián)網(wǎng)鼓勵創(chuàng)意。許多互聯(lián)網(wǎng)公司希望通過大量的網(wǎng)絡內容收集來整理他們的網(wǎng)站。從SEO的角度來看,這實際上是不良行為
(2)在規(guī)劃網(wǎng)站內容時,我們應該堅持主題內容突出,也就是說,我們應該讓搜索引擎爬行了解網(wǎng)頁的內容,而不是在一堆內容中判斷網(wǎng)站在做什么。主題并不突出。在許多無序運營的網(wǎng)站中都有典型的例子。例如,在一些新穎的網(wǎng)站中,一個800字的章節(jié)分為8頁,每頁約100字,而其他本地頁面則是各種廣告和無關內容信息。在其他網(wǎng)站中,主要內容是框架結構或aiax結構,蜘蛛能爬到的信息是無關內容。(3)豐富的內容意味著內容信息量大,表現(xiàn)形式多樣。廣告宜少嵌入廣告,不要打開頁面全屏全是五顏六色的廣告。由于廣告加載時間是在頁面的整個加載時間內計算的,如果廣告加載時間過長,則頁面無法完全加載,頁面將變空變短。綜上所述,關于眾多廣告對用戶體驗的影響,百度于2013年5月17日發(fā)布公告,稱推出了針對低質量網(wǎng)頁的“石榴算法”,旨在沖擊那些含有大量不良廣告、阻礙用戶正常閱讀的網(wǎng)頁,尤其是頁面中存在大量低質量廣告和頁面主要內容混雜的浪費廣告。現(xiàn)在一些大型門戶網(wǎng)站從收入的角度來看仍然掛著很多廣告。作為SEO人員,他們需要考慮這個問題(4)堅持web內容的可訪問性。有些網(wǎng)頁承載大量內容,但它們是通過使用JS、Ajax和其他方法顯示的,這是搜索引擎無法識別的。這樣,網(wǎng)頁的內容是空的和短的,網(wǎng)頁的評級大大降低了
此外,就鏈接的重要性而言,有兩個重要的標準:從目錄級別上,堅持淺優(yōu)先級標準;從內鏈規(guī)劃的角度來看,堅持“熱門頁面優(yōu)先”的原則
所謂淺優(yōu)先級是指當搜索引擎處理新鏈接并判斷鏈接的重要性時,它會優(yōu)先考慮URL更多的頁面,即從URL排列上看頁面更接近主頁域名。因此,當SEO正在做重要的頁面優(yōu)化時,我們必須注意扁平化標準,并盡量縮短URL的中間鏈接
優(yōu)先級已經(jīng)很淺,能否將所有頁面平鋪到網(wǎng)站的根目錄,然后選擇SEO功能?一定不能這樣。首先,優(yōu)先權是一個相對的概念。如果您將所有內容都放在根目錄下,這并不重要。重要內容和不重要內容沒有區(qū)別。此外,從SEO的角度,URL爬行也被用來分析網(wǎng)站的結構。在URL組成之后,大致確定內容的分組。SEO人員可以通過URL的組合完成關鍵字和關鍵字頁面的排列。