网站路径是最容易被站长们忽略的关键点,网站路径对于网站的结构有着关键的影响,并且对于seo优化起到了深远的影响。今天给大家分享下,网站路径与網絡推廣渠道之間的關系,我們應該如何處理正確地處理網站路徑。
路徑層級
对于蜘蛛抓取层面,网站的路径应该控制在3-5层,这是比较合理的一个区间,并且这个层级越短对于蜘蛛的抓取更友好。当然层级也不能少于3层,虽然利于抓取但是不利于网站内容的层级显现。
这里推荐大家网站层级控制在3层,第 一层首頁,第二层可以是列表或者是栏目页,第三层则是详情页面。如果站点内容比较复杂的可以将几层路径合并为一层,总体控制在3层,合并对于路径。
鏈接無序化
内容原创对于網絡推廣的優化服務非常的重要,但是泛濫的采集行爲讓人防不慎防,常見的方法無非只是增加了采集難度,只要可以訪問到鏈接就可以采集。這裏給大家提供一個非常有用的方法,巧妙地利用網站路徑來規避采集。
采集的危害在于对站点的大批量采集,所以关键点在于要防止站点大多数的内容被采集,好的方法就是把所有的路径给隐藏起来。很多站点的路径都是有规律的大多数都是同栏目的内容通过id自增实现,可以通过暴力枚举id来爬取全站的内容。
所以,站点需要通过将链接url无序化处理,处理方式就是在第三层的id添加脏数据,比如id加时间戳、或随机字符串,推荐可以添加关键词的拼音,提升关键词匹配的几率同时无序化来了网站路径。
列表數據範圍控制
内容无序化之后更加关键的是,列表栏目页一定不能翻页显示全部的内容,可以根据自身的網絡推廣服務需要僅展示一定範圍的數據。對于用戶來說一般正常人也最多浏覽1-3頁的列表,更加高效的獲取需求內容會通過搜索實現。
做到以上两点之后,爬虫基本上无法通过站点可显链接抓取到全站的内容;同样搜索引擎也无法抓取到全站的内容。这一点可以通过sitemap网站地图提交来解决,需要注意的是sitemap的路径要复杂,并且不要在任何位置公布出来。
因此,合理的布局网站路径结构不但可以增强搜索引擎蜘蛛抓取的友好性,同时可以很好规避内容被采集的情况。