
1、外因:算法調(diào)整,導(dǎo)致一批頁面被刪除(其實(shí),也仍是因頁面內(nèi)容質(zhì)量不高,被判定為低質(zhì)量頁面或垃圾頁面);
2、因?yàn)榫W(wǎng)站改版,或技術(shù)問題,導(dǎo)致大量頁面無內(nèi)容,或是404,或是代碼中增加了屏蔽蜘蛛的代碼;
3、因?yàn)榉?wù)器原因,或許是被攻擊,或是被別人惡意采集等,導(dǎo)致服務(wù)器不文檔,拜訪頁面常常500,或是頁面無內(nèi)容(接口問題);
解決辦法:
準(zhǔn)備工作:一定要在索引量東西中把網(wǎng)站各個(gè)頁面類型都增加進(jìn)去,這樣假如呈現(xiàn)索引量下降,就很清楚是哪個(gè)頁面類型出了問題。假如這步都沒做,請(qǐng)及時(shí)增加。
步,找到下降頁面類型,多檢查該頁面類型源代碼,看看代碼里邊是否存在屏蔽蜘蛛的代碼,或是看代碼中是否有頁面正文內(nèi)容;
第二步,多次頻頻的改寫頁面,看看頁面是否因?yàn)榘菰L頻頻而導(dǎo)致內(nèi)容為空,或呈現(xiàn)500情況(多呈現(xiàn)在調(diào)用接口的頁面);
第三步,假如這些都沒問題,那么你能夠利用東西中的“抓取診斷”東西,進(jìn)行抓取,看看抓取消耗時(shí)刻,和抓取內(nèi)容是否與原頁面內(nèi)容共同;
第四步,能夠去東西,檢查“抓取頻次”和“抓取反?!眱蓚€(gè)東西里邊的曲線圖,但這只能檢查到前 或前兩天的數(shù)據(jù);
第五步,通過上面幾步,基本上能夠看出是否是服務(wù)器出了問題,仍是技術(shù)接口出了問題以及網(wǎng)站改版問題導(dǎo)致的;
最后,咱們還能夠去搜索相關(guān)頁面類型URL,檢查“快照”與原頁面進(jìn)行對(duì)比,更進(jìn)一步的去排除問題。