如果你的站點可以像淘寶那樣牛叉,直接屏蔽掉百度蜘蛛的話,那恭喜你,可以不用浪費時間繼續看下去。如果還沒到那境界,就繼續看看建站時能避免就避免的因素,以免惹惱百度下發的“蜘蛛兵”。
1、Flash建站。如果網站裏放些flash做的圖標、廣告之類的,無疑是給你的站點添姿添彩。但是你用flash做個網站首頁甚至整站的話,那就有些炫過頭了。百度蜘蛛無法抓取flash文件中包含的文字內容和鏈接,這樣的站點隻能給人視覺效果,無法滿足蜘蛛的“胃口”了。
2、框架結構。這是老早以前的網站設計結構,現在幾乎棄用了,同樣的百度蜘蛛是無法抓取包含在框架裏的文字內容和鏈接。
3、JavaScript代碼。和flash類似,js代碼可以做出很多很炫的視覺效果,但是可惜的是我們可憐的百度蜘蛛也是無法識別它的麵目,所以能剩就剩。
4、動態URL。判斷是否為動態URL主要是看URL中是否包含問號、等號及參數,動態的URL不利於蜘蛛蜘蛛爬行,因為常常會使蜘蛛陷入死循環如萬年曆,或收錄大量的重複頁麵,所以盡量將動態URL靜態化。
5、頁麵跳轉。有利於seo的跳轉是301跳轉,其他的諸如302、js跳轉、Flash跳轉、MetaRefresh跳轉。這些跳轉都要慎用,因為百度蜘蛛對其跳轉方式比較敏感。不過此次的“住遊網”之後,301跳轉是否還是“最友好”的跳轉方式了。
6、要求登錄。這在一些社區經常看到,就是必須得登錄後才能看到站點內容。如果這是要求用戶的話倒無所謂了,但是如果要求蜘蛛也登錄之後才允許爬行,貌似百度蜘蛛不會注冊、填寫登錄信息。
這幾個不利於seo因素也不是絕對不能使用的,比如你可以用flash點綴下網站頁麵;你想讓一些內容不要蜘蛛爬行,你可以將它置於js代碼裏麵;暫時性的跳轉你可以使用302等等。上麵主要是以百度蜘蛛為例,其實現在的搜索引擎技術能夠簡單的識別諸如flash、js裏包含的內容,可是它們沒必要花費時間去解析那些內容。所以作為建站的我們隻能趨向於搜索引擎,做有利於搜索引擎抓取的站點