1.sogou spider User-Agent字段是什么?
PC端UA為Sogou web spider,請注意,根據(jù)標準,ua區(qū)分大小寫。
2.搜狗spider的IP有哪些?
搜狗暫不對外提供搜狗spider IP列表,但您可以通過DNS反查IP的方式判斷某只spider是否來自搜狗搜索引擎。根據(jù)不同平臺有不同的驗證方法。
linux平臺:命令為host ip,如下圖。搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均為冒充。
在windows平臺或者IBM OS/2平臺:命令為nslookup ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均為冒充。
mac os平臺:命令為dig ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均為冒充。
3.sogou spider 如何反應我網(wǎng)站上頁面的更新?
sogou spider 會根據(jù)網(wǎng)頁的重要性和歷史變化情況來動態(tài)調(diào)整更新時間,更新已經(jīng)抓取過的頁面。
4.搜狗spider的抓取頻次是怎樣的?
sogou spider 對于同一個 IP 地址的服務器主機,只建立一個連接,抓取間隔速度控制在幾秒一次。一個網(wǎng)頁被收錄后,最快也要過幾天以后才會去更新。如果持續(xù)不斷地抓取您的網(wǎng)站,請注意您的網(wǎng)站上的網(wǎng)頁是否每次訪問都產(chǎn)生新的鏈接。
如果您認為 sogou spider 對于您的網(wǎng)站抓取過快,請與我們聯(lián)系,并最好能提供訪問日志中sogou spider 訪問的部分,而不要直接將搜狗spider的ua封禁。
5.sogou spider 喜歡收錄什么樣的頁面?
內(nèi)容優(yōu)良而獨特的頁面。如果您的頁面內(nèi)容和互聯(lián)網(wǎng)上已存在的其他頁面有高度的相似性,可能不會被 sogou spider 收錄。
鏈接層次較淺的頁面。過深的鏈接層次,尤其是動態(tài)網(wǎng)頁的鏈接,會被丟棄而不收錄。
如果是動態(tài)網(wǎng)頁,請控制參數(shù)的數(shù)量和URL的長度。搜狗更偏好收錄靜態(tài)網(wǎng)頁。重定向次數(shù)越多的頁面,越有可能被 sogou spider 丟棄。
? Copyright 2023 深圳藍曬科技有限公司. 粵ICP備2023054553號-1